| 大語言模型問答任務(wù)準(zhǔn)確性評價方法及基于微調(diào)的垂直領(lǐng)域優(yōu)化研究 | |
| 所屬分類:技術(shù)論文 | |
| 上傳者:wwei | |
| 文檔大小:5136 K | |
| 標(biāo)簽: 大語言模型 問答任務(wù) 語料庫 | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:隨著自然語言處理技術(shù)的進步,大語言模型展現(xiàn)了強大的語義理解和生成能力,但在實際應(yīng)用中,其問答準(zhǔn)確性仍面臨諸多挑戰(zhàn),特別是垂直領(lǐng)域應(yīng)用。首先梳理了通用大語言模型問答生成能力常見的評價指標(biāo),其次,從基于詞匯的自動評價方法、人工評價方法和基于大語言模型的評價方法三方面,闡述通用大語言模型問答任務(wù)準(zhǔn)確性評價方法,而后,針對通用大語言模型垂直領(lǐng)域問答準(zhǔn)確性較低的問題,以ChatGLM36B和國防動員領(lǐng)域為例,提出了構(gòu)建垂直領(lǐng)域語料庫、精細化處理數(shù)據(jù)、定制化微調(diào)的“三步走”優(yōu)化方法,通過人工評價和基于詞匯的自動評價的方式進行3輪測試評估,解決了通用大語言模型垂直領(lǐng)域問答精度較低的問題,顯著提升問答準(zhǔn)確性。相關(guān)成果有望為其他通用大語言模型和垂直領(lǐng)域應(yīng)用提供參考。 | |
| 現(xiàn)在下載 | |
| VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2