IT之家 1 月 29 日消息,大型語言模型(LLM)的使用正在激增,尤其是 ChatGPT 最近非常火爆,然而由于其太過強(qiáng)大,甚至可以為學(xué)生生成論文。正因?yàn)槿绱耍F(xiàn)在需要有檢測(cè)機(jī)器生成的文本的系統(tǒng)。
最近,斯坦福大學(xué)的一個(gè)研究小組提出了一種名為 DetectGPT 的新方法,旨在成為打擊高等教育中機(jī)器生成文本的首批工具之一。該方法基于的原理是:由 LLM 生成的文本通常在模型的對(duì)數(shù)概率函數(shù)的負(fù)曲率區(qū)域的特定區(qū)域徘徊。通過這個(gè)發(fā)現(xiàn),該團(tuán)隊(duì)開發(fā)了一種新的指標(biāo),用于判斷文本是否是機(jī)器生成的,并且不需要訓(xùn)練人工智能或收集大型數(shù)據(jù)集來比較文本。
這種方法被稱為“零次學(xué)習(xí)(zero-shot)”,允許 DetectGPT 檢測(cè)機(jī)器寫的文本,而不需要了解用于生成文本的是什么人工智能工具。它的操作與其他需要訓(xùn)練“分類器”和真實(shí)及生成段落數(shù)據(jù)集的方法形成鮮明對(duì)比。
IT之家了解到,該團(tuán)隊(duì)在假新聞文章的數(shù)據(jù)集上測(cè)試了 DetectGPT,它在檢測(cè)機(jī)器生成的文本方面的表現(xiàn)優(yōu)于其他零次學(xué)習(xí)方法。該團(tuán)隊(duì)聲稱檢測(cè)性能有了實(shí)質(zhì)性的提高,并表明 DetectGPT 可能是一種有前途的方法,可以仔細(xì)檢查機(jī)器生成的文本。
總之,DetectGPT 是一種檢測(cè)機(jī)器生成的文本的新方法,它利用了 LLM 生成的文本的獨(dú)特特征。它是一種不需要任何額外數(shù)據(jù)或訓(xùn)練的零次學(xué)習(xí)方法,使其成為識(shí)別機(jī)器生成的文本的高效和有效工具。隨著 LLM 的使用繼續(xù)增長,檢測(cè)機(jī)器生成的文本的相應(yīng)系統(tǒng)的重要性將變得越來越關(guān)鍵。DetectGPT 是一種很有前途的方法,可以在許多領(lǐng)域產(chǎn)生重大影響,它的進(jìn)一步發(fā)展可能對(duì)許多領(lǐng)域都有利。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<