China Daily Homepage
中文網(wǎng)首頁(yè)
時(shí)政
資訊
C財(cái)經(jīng)
生活
視頻
專欄
原創(chuàng)
觀天下
地方

登錄

注冊(cè)

移動(dòng)新媒體

China Daily Homepage
中文網(wǎng)首頁(yè)
時(shí)政
資訊
C財(cái)經(jīng)
生活
視頻
專欄
漫畫(huà)
原創(chuàng)
觀天下
地方

AI檢測(cè)AI：“矛”更利還是“盾”更堅(jiān)

來(lái)源：科技日?qǐng)?bào)

2024-08-16 08:17　

分享到

分享到微信

【AI世界】

◎本報(bào)記者吳葉凡

近年來(lái)，人工智能(AI)技術(shù)推動(dòng)生產(chǎn)力快速發(fā)展，但同時(shí)也因技術(shù)濫用導(dǎo)致各種問(wèn)題。

為監(jiān)督AI技術(shù)使用，如今市面上不乏各類用于檢測(cè)AI生成內(nèi)容(AIGC)的工具，如普林斯頓大學(xué)學(xué)生開(kāi)發(fā)的GPTZero、斯坦福大學(xué)研究團(tuán)隊(duì)推出的DetectGPT等。我國(guó)一些研究團(tuán)隊(duì)也陸續(xù)發(fā)布各類檢測(cè)工具，如西湖大學(xué)文本智能實(shí)驗(yàn)室研發(fā)的Fast-DetectGPT。

人類的創(chuàng)作與AIGC之間存在哪些差異？AI檢測(cè)工具如何根據(jù)差異進(jìn)行識(shí)別？AI檢測(cè)工具如何應(yīng)對(duì)越來(lái)越聰明的大模型？帶著這些問(wèn)題，記者采訪了有關(guān)專家。

AI創(chuàng)作套路化明顯

“雖然大模型在不斷發(fā)展迭代，但到目前為止，AIGC與人類的創(chuàng)作在用詞用語(yǔ)、邏輯語(yǔ)法等方面依舊存在明顯區(qū)別?！盕ast-DetectGPT研發(fā)者之一、西湖大學(xué)文本智能實(shí)驗(yàn)室博士生鮑光勝說(shuō)。

在用詞用語(yǔ)上，AIGC有相對(duì)固定的偏好?！安浑y發(fā)現(xiàn)，一些詞語(yǔ)會(huì)反復(fù)在語(yǔ)段中出現(xiàn)?！滨U光勝舉例說(shuō)，有研究發(fā)現(xiàn)，大模型應(yīng)用于英語(yǔ)學(xué)術(shù)論文寫(xiě)作時(shí)，“delve”(深入研究)一詞的使用頻率大大提高，這是因?yàn)榇竽Ｐ土?xí)慣用這個(gè)詞對(duì)語(yǔ)句進(jìn)行潤(rùn)色修改。

在邏輯語(yǔ)法上，AIGC慣常使用的一些語(yǔ)法搭配方式，在人類創(chuàng)作中可能并不常見(jiàn)。“受模型建模的影響，AIGC有相對(duì)固定的行文邏輯和表述模式，且這些模式會(huì)不斷地被重復(fù)。人類在行文上則更為靈活，沒(méi)有固定套路。”鮑光勝說(shuō)。

北京大學(xué)信息管理系師生比較了AI生成與學(xué)者撰寫(xiě)的中文論文摘要。研究結(jié)果同樣顯示，AI生成的摘要具有較高同質(zhì)性和較強(qiáng)寫(xiě)作邏輯性，并慣用歸納總結(jié)等學(xué)術(shù)話語(yǔ)體系；學(xué)者撰寫(xiě)的摘要?jiǎng)t具有顯著個(gè)性化差異，使用凸顯實(shí)際含義的搭配較多，并常用與國(guó)家政策密切相關(guān)的詞語(yǔ)。

哈爾濱工業(yè)大學(xué)一名研究生向記者講述了他使用大模型的實(shí)際感受：“當(dāng)我給大模型提供一些材料讓它擴(kuò)寫(xiě)，它每次都用相同的套路——把給定的材料拆解開(kāi)，分為若干點(diǎn)論述?？傮w來(lái)說(shuō)感覺(jué)它寫(xiě)得比較‘僵’?！?/p>

AIGC相對(duì)套路化的創(chuàng)作，可能會(huì)影響人類的用語(yǔ)習(xí)慣。“隨著越來(lái)越多人用AI創(chuàng)作或潤(rùn)色文字，人類會(huì)受到潛移默化的影響，這或?qū)⒂绊懻麄€(gè)社會(huì)對(duì)語(yǔ)言的使用。”鮑光勝說(shuō)。

三種路徑識(shí)別文本

如何準(zhǔn)確識(shí)別AI生成內(nèi)容？鮑光勝介紹，目前主要有三種技術(shù)路徑進(jìn)行檢測(cè)，分別是模型訓(xùn)練分類器法(也被稱為監(jiān)督分類器法)、零樣本分類器法、文本水印法?！叭N檢測(cè)方法本質(zhì)上都是利用AI檢測(cè)AI，且各有優(yōu)劣?！滨U光勝說(shuō)。

模型訓(xùn)練分類器法，首先要收集大量人類創(chuàng)作內(nèi)容與AIGC，然后以此為基礎(chǔ)訓(xùn)練一個(gè)能區(qū)分兩類內(nèi)容的分類器?！斑@是目前被廣泛使用的一種方法，但缺點(diǎn)較為明顯?！滨U光勝解釋，用于訓(xùn)練分類器的數(shù)據(jù)有限，很難覆蓋所有類型和語(yǔ)言的文本。分類器在訓(xùn)練數(shù)據(jù)覆蓋的文本領(lǐng)域或語(yǔ)言上檢測(cè)準(zhǔn)確率較高，反之準(zhǔn)確率則較低。而且，模型訓(xùn)練往往需要較高成本，數(shù)據(jù)規(guī)模越大，訓(xùn)練成本越高。

相比之下，零樣本分類器法不需要對(duì)機(jī)器進(jìn)行訓(xùn)練，也無(wú)需收集數(shù)據(jù)。它利用已訓(xùn)練好的大模型，抽取語(yǔ)言模型生成文本的特征，據(jù)此來(lái)區(qū)別人類與機(jī)器。“似然函數(shù)是零樣本檢測(cè)法中比較常用的基準(zhǔn)之一，它可以簡(jiǎn)單理解為一段文本在某個(gè)模型的建模分布中出現(xiàn)的概率。概率是一種特征，不同的概率體現(xiàn)了人類創(chuàng)作內(nèi)容與AIGC的差異。”鮑光勝進(jìn)一步解釋，“零樣本分類通過(guò)綜合考慮多種函數(shù)特征來(lái)區(qū)分人類創(chuàng)作內(nèi)容與AIGC?！?/p>

如今，很多大語(yǔ)言模型幾乎覆蓋了互聯(lián)網(wǎng)上的全部數(shù)據(jù)。因此，相比于模型訓(xùn)練分類器，零樣本分類器在不同領(lǐng)域、不同語(yǔ)言的文本上表現(xiàn)較為一致。

不過(guò)，零樣本分類器也存在明顯缺點(diǎn)。一方面，現(xiàn)有零樣本分類器依賴生成文本的源語(yǔ)言模型進(jìn)行檢測(cè)，這意味著如果是未知源模型生成的文本，分類器就無(wú)法準(zhǔn)確檢測(cè)。另一方面，為提高檢測(cè)準(zhǔn)確率，零樣本分類器往往需要多次調(diào)用模型，這增加了模型的使用成本和計(jì)算時(shí)間。

“文本水印法則是一類‘主動(dòng)方法’。區(qū)別于前兩類方法，它不是檢測(cè)已生成的文本，而是在AI生成文本時(shí)加入水印。人類雖然看不出這些水印，但卻能通過(guò)技術(shù)手段檢測(cè)出來(lái)。”鮑光勝說(shuō)，文本水印法的準(zhǔn)確率較高，但缺點(diǎn)在于水印可能被人為弱化甚至移除。此外，對(duì)于無(wú)法訪問(wèn)模型內(nèi)部結(jié)構(gòu)的大語(yǔ)言模型，技術(shù)人員可能無(wú)法在生成內(nèi)容時(shí)成功加入水印。

檢測(cè)技術(shù)需不斷改進(jìn)

“未來(lái)，我們要不斷更新、完善現(xiàn)有技術(shù)，力爭(zhēng)實(shí)現(xiàn)快速、準(zhǔn)確、低成本檢測(cè)，在大模型這把‘矛’越來(lái)越鋒利的同時(shí)，讓檢測(cè)技術(shù)這面‘盾’更為堅(jiān)固。”鮑光勝說(shuō)。

記者了解到，為提升檢測(cè)準(zhǔn)確性，目前市面上的商用AI檢測(cè)軟件大多融合了多種技術(shù)手段。國(guó)內(nèi)外研究團(tuán)隊(duì)也在進(jìn)一步完善相關(guān)技術(shù)。

例如，西湖大學(xué)文本智能實(shí)驗(yàn)室團(tuán)隊(duì)在DetectGPT基礎(chǔ)上研發(fā)的Fast-DetectGPT模型，可提升AI檢測(cè)準(zhǔn)確性，縮短檢測(cè)時(shí)間。“Fast-DetectGPT與其他零樣本分類器原理一致。其中一個(gè)創(chuàng)新點(diǎn)在于，我們提出通過(guò)條件概率曲率指標(biāo)進(jìn)行檢測(cè)?！滨U光勝說(shuō)，“與DetectGPT相比，F(xiàn)ast-DetectGPT在速度上提升340倍，在檢測(cè)準(zhǔn)確率上相對(duì)提升約75%?！?/p>

對(duì)AI檢測(cè)AI的前景，有兩種截然不同的觀點(diǎn)。一種觀點(diǎn)認(rèn)為，未來(lái)AIGC將會(huì)與人類創(chuàng)作極為相似，以至于檢測(cè)工具無(wú)法判別。還有一種觀點(diǎn)認(rèn)為，隨著技術(shù)發(fā)展，檢測(cè)技術(shù)或?qū)②s超大模型技術(shù)，實(shí)現(xiàn)對(duì)AIGC的有效識(shí)別。

“目前，無(wú)論是AI生成的文字、圖片還是視頻，都在技術(shù)可識(shí)別的范疇之內(nèi)。相較于文字，圖片和視頻甚至可以直接被專業(yè)人士肉眼識(shí)別。期待未來(lái)通過(guò)大模型技術(shù)的不斷進(jìn)步，推動(dòng)檢測(cè)技術(shù)發(fā)展。”鮑光勝說(shuō)。(來(lái)源：科技日?qǐng)?bào))

【編輯:胡寒笑】

【責(zé)任編輯：張瑨瑄】

科技日?qǐng)?bào)

最熱新聞

為你推薦

換一批

關(guān)于我們 | 聯(lián)系我們

首頁(yè)
時(shí)政
資訊
財(cái)經(jīng)
生活
視頻
專欄
漫畫(huà)
獨(dú)家
招聘

違法和不良信息舉報(bào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170006
信息網(wǎng)絡(luò)傳播視聽(tīng)節(jié)目許可證0108263號(hào)
京公網(wǎng)安備11010502032503號(hào)
京網(wǎng)文[2011]0283-097號(hào)
京ICP備13028878號(hào)-6

中國(guó)日?qǐng)?bào)網(wǎng)版權(quán)說(shuō)明：凡注明來(lái)源為“中國(guó)日?qǐng)?bào)網(wǎng)：XXX（署名）”，除與中國(guó)日?qǐng)?bào)網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外，其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用，違者必究。如需使用，請(qǐng)與010-84883777聯(lián)系；凡本網(wǎng)注明“來(lái)源：XXX（非中國(guó)日?qǐng)?bào)網(wǎng)）”的作品，均轉(zhuǎn)載自其它媒體，目的在于傳播更多信息，其他媒體如需轉(zhuǎn)載，請(qǐng)與稿件來(lái)源方聯(lián)系，如產(chǎn)生任何問(wèn)題與本網(wǎng)無(wú)關(guān)。

版權(quán)保護(hù)：本網(wǎng)登載的內(nèi)容（包括文字、圖片、多媒體資訊等）版權(quán)屬中國(guó)日?qǐng)?bào)網(wǎng)（中報(bào)國(guó)際文化傳媒（北京）有限公司）獨(dú)家所有使用。未經(jīng)中國(guó)日?qǐng)?bào)網(wǎng)事先協(xié)議授權(quán)，禁止轉(zhuǎn)載使用。給中國(guó)日?qǐng)?bào)網(wǎng)提意見(jiàn)：rx@chinadaily.com.cn

首頁(yè)
時(shí)政
資訊
財(cái)經(jīng)
文化
漫畫(huà)
視頻
地方

中文 | English

中國(guó)日?qǐng)?bào)版權(quán)所有
Content@chinadaily.com.cn

国产av剧情不卡,人妻无码喷潮上位,天天久久av每天,国产一区二区三区日韩精品

AI檢測(cè)AI：“矛”更利還是“盾”更堅(jiān)