《電子技術應用》
您所在的位置:首頁 > 其他 > 设计应用 > 基于大模型上下文学习的未知意图识别方法
基于大模型上下文学习的未知意图识别方法
网络安全与数据治理
孙颢原1,刘莹君2,于莉娜2,纪涛2,张圳锡1,吴继冰1
1.国防科技大学大数据与决策国家级重点实验室; 2.智能空间信息国家级重点实验室
摘要: 面对现代化战争的复杂态势,精准的意图识别技术可实现对指挥人员需求的高效理解与精准捕捉,提升决策准确率和敏捷性。现有意图识别方法通常需要大量人工标注的数据进行训练,带来了高昂的成本,并且对于新意图的识别效果较差。为此,提出了基于大语言模型(Large Language Models,LLMs)上下文学习的创新解决办法,充分利用大模型的通用语言能力和指令遵循能力,仅需使用少量样本并无需训练,便可完成已知意图识别与新意图发现任务,为意图识别提供了一种新型高效的解决方案。
中圖分類號:TP181.132文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.11.007引用格式:孫顥原,劉瑩君,于莉娜,等. 基于大模型上下文學習的未知意圖識別方法[J].網絡安全與數據治理,2025,44(11):38-44.
Intent recognition method based on incontext learning of large language models
Sun Haoyuan1, Liu Yingjun2,Yu Lina2,Ji Tao2,Zhang Zhenxi1, Wu Jibing1
1. National Key Laboratory of Big Data and Decision, National University of Defense Technology; 2. National Key Laboratory of Intelligent Geospatial Information
Abstract: In the face of the complex situation of modern warfare, accurate intent recognition technology can achieve efficient understanding and precise capture of commanders′ needs, thereby enhancing the accuracy and agility of military decision-making. Existing intent recognition methods typically require large amounts of manually annotated data for training, which incurs high costs and performs poorly in recognizing novel intents. To address these issues, this paper proposes an innovative solution based on large language models (LLMs) and their in-context learning capability. By leveraging the general language understanding and instruction-following abilities of LLMs, the proposed approach can accomplish both known intent recognition and novel intent discovery tasks using only a small number of examples without requiring additional training, thus offering a new and efficient solution for intent recognition.
Key words : large language model; incontext learning; prompt engineering;intent recognition

引言

自然語言處理(Natural Language Processing,NLP)是人工智能的重點研究方向,其研究目標是賦予計算機理解、解析及生成人類語言的能力,是實現人機自然交互的關鍵技術。早期 NLP 研究主要依賴規(guī)則系統與統計方法,隨著深度學習技術的興起,逐步發(fā)展為基于神經網絡的表示學習范式,而當前大規(guī)模預訓練語言模型已成為該領域的主流研究方向[1-2]。這一系列技術演進推動了智能客服、搜索引擎、智能助手等應用的廣泛落地,顯著革新了人機交互模式[3-5]。

在 NLP 的諸多任務中,意圖識別是對話系統的基礎環(huán)節(jié)[6]。意圖識別旨在確定用戶輸入的文字中所蘊含的意圖或目的,即對用戶的話語進行語義理解,以便更好地回答用戶的問題或提供相關的服務。然而,意圖識別通常面臨著一系列問題的挑戰(zhàn),包括用戶語言表達的易混淆性、意圖在不同上下文語境中的差異性以及持續(xù)出現的新意圖等。

研究人員針對意圖識別問題開展了大量的研究,主要集中在傳統機器學習方法[4]、深度學習方法[2,7]與基于大模型的意圖識別方法。傳統機器學習方法如支持向量機(Support Vector Machine, SVM)、條件隨機場(Conditional Random Field, CRF)等依賴人工特征工程,難以有效捕捉復雜的語義關系。深度學習方法主要包括基于卷積神經網絡、循環(huán)神經網絡(如長短期記憶網絡)、 Transformer模型的方法。盡管這些方法在特征自動提取方面展現出顯著優(yōu)勢,但仍面臨標注數據依賴性強[8]、上下文建模能力不足[9]、領域遷移適應性弱[5]及跨語言場景泛化能力有限[6]等挑戰(zhàn)。

近年來,意圖識別方法逐漸成為研究熱點[10]。現有工作通常提前設定好所有可能的意圖類別,模型在這些預設的類別中進行識別。然而,在開放環(huán)境下,模型需要應對持續(xù)出現的新意圖類別帶來的挑戰(zhàn)。在預訓練模型時代,Nogueira等人[11]的研究具有標志性意義,他們系統論證了上下文詞嵌入對意圖表征的增強作用。隨后,Zhang等人[12]針對開放世界假設下的意圖識別問題,提出了基于深度語義特征空間的自適應決策邊界算法,實現了已知與未知意圖的有效區(qū)分[13]。隨著大語言模型在動態(tài)提示工程與自主推理方面的進展,基于智能體架構的意圖發(fā)現方法開始涌現,初步驗證了其在開放域場景下的有效性[14]。隨后Cheng等人[15]構建了交互意圖基準,訓練出可主動評估任務模糊性、與用戶交互以明確意圖的模型,從而明確輸入意圖,進而提升識別的準確性與系統交互性。然而,這些方法的有效性通常依賴于大量標記數據和多階段訓練,實現此類方法需要人類專家注釋來完成定義相關意圖的挑戰(zhàn)性任務。

面對傳統意圖識別方法依賴大量標注數據、難以適應開放環(huán)境下新意圖涌現等問題,本文提出基于大語言模型的意圖識別方法AutoIntent,可在少樣本條件下有效識別不斷出現的新意圖。本文主要貢獻包括:

(1)提出基于上下文學習的大模型意圖識別框架AutoIntent,借助提示詞構建與意圖反饋機制,實現在少樣本下高效靈活的意圖識別;

(2)在意圖發(fā)現對比實驗的常用數據集上,將AutoIntent與領域內最新方法展開對比,結果顯示出AutoIntent在意圖發(fā)現任務上的優(yōu)勢;

(3)針對意圖識別任務構建了復雜度更高的評測數據集并開展驗證,實驗結果進一步驗證了AutoIntent在復雜場景下的有效性。


本文詳細內容請下載:

http://ihrv.cn/resource/share/2000006860


作者信息:

孫顥原1,劉瑩君2,于莉娜2,紀濤2,張圳錫1,吳繼冰1

(1.國防科技大學大數據與決策國家級重點實驗室,湖南長沙410073;

2.智能空間信息國家級重點實驗室,北京100029)


subscribe.jpg

此內容為AET網站原創(chuàng),未經授權禁止轉載。