IT之家 1 月 29 日消息,大型語言模型(LLM)的使用正在激增,尤其是 ChatGPT 最近非?;鸨?,然而由于其太過強大,甚至可以為學生生成論文。正因為如此,現(xiàn)在需要有檢測機器生成的文本的系統(tǒng)。
最近,斯坦福大學的一個研究小組提出了一種名為 DetectGPT 的新方法,旨在成為打擊高等教育中機器生成文本的首批工具之一。該方法基于的原理是:由 LLM 生成的文本通常在模型的對數(shù)概率函數(shù)的負曲率區(qū)域的特定區(qū)域徘徊。通過這個發(fā)現(xiàn),該團隊開發(fā)了一種新的指標,用于判斷文本是否是機器生成的,并且不需要訓練人工智能或收集大型數(shù)據(jù)集來比較文本。
這種方法被稱為“零次學習(zero-shot)”,允許 DetectGPT 檢測機器寫的文本,而不需要了解用于生成文本的是什么人工智能工具。它的操作與其他需要訓練“分類器”和真實及生成段落數(shù)據(jù)集的方法形成鮮明對比。
IT之家了解到,該團隊在假新聞文章的數(shù)據(jù)集上測試了 DetectGPT,它在檢測機器生成的文本方面的表現(xiàn)優(yōu)于其他零次學習方法。該團隊聲稱檢測性能有了實質(zhì)性的提高,并表明 DetectGPT 可能是一種有前途的方法,可以仔細檢查機器生成的文本。
總之,DetectGPT 是一種檢測機器生成的文本的新方法,它利用了 LLM 生成的文本的獨特特征。它是一種不需要任何額外數(shù)據(jù)或訓練的零次學習方法,使其成為識別機器生成的文本的高效和有效工具。隨著 LLM 的使用繼續(xù)增長,檢測機器生成的文本的相應系統(tǒng)的重要性將變得越來越關鍵。DetectGPT 是一種很有前途的方法,可以在許多領域產(chǎn)生重大影響,它的進一步發(fā)展可能對許多領域都有利。
更多信息可以來這里獲取==>>電子技術應用-AET<<