引言
自然語言處理(Natural Language Processing,NLP)是人工智能的重點(diǎn)研究方向,其研究目標(biāo)是賦予計(jì)算機(jī)理解、解析及生成人類語言的能力,是實(shí)現(xiàn)人機(jī)自然交互的關(guān)鍵技術(shù)。早期 NLP 研究主要依賴規(guī)則系統(tǒng)與統(tǒng)計(jì)方法,隨著深度學(xué)習(xí)技術(shù)的興起,逐步發(fā)展為基于神經(jīng)網(wǎng)絡(luò)的表示學(xué)習(xí)范式,而當(dāng)前大規(guī)模預(yù)訓(xùn)練語言模型已成為該領(lǐng)域的主流研究方向[1-2]。這一系列技術(shù)演進(jìn)推動(dòng)了智能客服、搜索引擎、智能助手等應(yīng)用的廣泛落地,顯著革新了人機(jī)交互模式[3-5]。
在 NLP 的諸多任務(wù)中,意圖識(shí)別是對(duì)話系統(tǒng)的基礎(chǔ)環(huán)節(jié)[6]。意圖識(shí)別旨在確定用戶輸入的文字中所蘊(yùn)含的意圖或目的,即對(duì)用戶的話語進(jìn)行語義理解,以便更好地回答用戶的問題或提供相關(guān)的服務(wù)。然而,意圖識(shí)別通常面臨著一系列問題的挑戰(zhàn),包括用戶語言表達(dá)的易混淆性、意圖在不同上下文語境中的差異性以及持續(xù)出現(xiàn)的新意圖等。
研究人員針對(duì)意圖識(shí)別問題開展了大量的研究,主要集中在傳統(tǒng)機(jī)器學(xué)習(xí)方法[4]、深度學(xué)習(xí)方法[2,7]與基于大模型的意圖識(shí)別方法。傳統(tǒng)機(jī)器學(xué)習(xí)方法如支持向量機(jī)(Support Vector Machine, SVM)、條件隨機(jī)場(chǎng)(Conditional Random Field, CRF)等依賴人工特征工程,難以有效捕捉復(fù)雜的語義關(guān)系。深度學(xué)習(xí)方法主要包括基于卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(如長(zhǎng)短期記憶網(wǎng)絡(luò))、 Transformer模型的方法。盡管這些方法在特征自動(dòng)提取方面展現(xiàn)出顯著優(yōu)勢(shì),但仍面臨標(biāo)注數(shù)據(jù)依賴性強(qiáng)[8]、上下文建模能力不足[9]、領(lǐng)域遷移適應(yīng)性弱[5]及跨語言場(chǎng)景泛化能力有限[6]等挑戰(zhàn)。
近年來,意圖識(shí)別方法逐漸成為研究熱點(diǎn)[10]?,F(xiàn)有工作通常提前設(shè)定好所有可能的意圖類別,模型在這些預(yù)設(shè)的類別中進(jìn)行識(shí)別。然而,在開放環(huán)境下,模型需要應(yīng)對(duì)持續(xù)出現(xiàn)的新意圖類別帶來的挑戰(zhàn)。在預(yù)訓(xùn)練模型時(shí)代,Nogueira等人[11]的研究具有標(biāo)志性意義,他們系統(tǒng)論證了上下文詞嵌入對(duì)意圖表征的增強(qiáng)作用。隨后,Zhang等人[12]針對(duì)開放世界假設(shè)下的意圖識(shí)別問題,提出了基于深度語義特征空間的自適應(yīng)決策邊界算法,實(shí)現(xiàn)了已知與未知意圖的有效區(qū)分[13]。隨著大語言模型在動(dòng)態(tài)提示工程與自主推理方面的進(jìn)展,基于智能體架構(gòu)的意圖發(fā)現(xiàn)方法開始涌現(xiàn),初步驗(yàn)證了其在開放域場(chǎng)景下的有效性[14]。隨后Cheng等人[15]構(gòu)建了交互意圖基準(zhǔn),訓(xùn)練出可主動(dòng)評(píng)估任務(wù)模糊性、與用戶交互以明確意圖的模型,從而明確輸入意圖,進(jìn)而提升識(shí)別的準(zhǔn)確性與系統(tǒng)交互性。然而,這些方法的有效性通常依賴于大量標(biāo)記數(shù)據(jù)和多階段訓(xùn)練,實(shí)現(xiàn)此類方法需要人類專家注釋來完成定義相關(guān)意圖的挑戰(zhàn)性任務(wù)。
面對(duì)傳統(tǒng)意圖識(shí)別方法依賴大量標(biāo)注數(shù)據(jù)、難以適應(yīng)開放環(huán)境下新意圖涌現(xiàn)等問題,本文提出基于大語言模型的意圖識(shí)別方法AutoIntent,可在少樣本條件下有效識(shí)別不斷出現(xiàn)的新意圖。本文主要貢獻(xiàn)包括:
(1)提出基于上下文學(xué)習(xí)的大模型意圖識(shí)別框架AutoIntent,借助提示詞構(gòu)建與意圖反饋機(jī)制,實(shí)現(xiàn)在少樣本下高效靈活的意圖識(shí)別;
(2)在意圖發(fā)現(xiàn)對(duì)比實(shí)驗(yàn)的常用數(shù)據(jù)集上,將AutoIntent與領(lǐng)域內(nèi)最新方法展開對(duì)比,結(jié)果顯示出AutoIntent在意圖發(fā)現(xiàn)任務(wù)上的優(yōu)勢(shì);
(3)針對(duì)意圖識(shí)別任務(wù)構(gòu)建了復(fù)雜度更高的評(píng)測(cè)數(shù)據(jù)集并開展驗(yàn)證,實(shí)驗(yàn)結(jié)果進(jìn)一步驗(yàn)證了AutoIntent在復(fù)雜場(chǎng)景下的有效性。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006860
作者信息:
孫顥原1,劉瑩君2,于莉娜2,紀(jì)濤2,張圳錫1,吳繼冰1
(1.國(guó)防科技大學(xué)大數(shù)據(jù)與決策國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙410073;
2.智能空間信息國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室,北京100029)

