大語言模型問答任務(wù)準(zhǔn)確性評價(jià)方法及基于微調(diào)的垂直領(lǐng)域優(yōu)化研究
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>5136 K
標(biāo)簽: 大語言模型 問答任務(wù) 語料庫
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著自然語言處理技術(shù)的進(jìn)步,大語言模型展現(xiàn)了強(qiáng)大的語義理解和生成能力,但在實(shí)際應(yīng)用中,其問答準(zhǔn)確性仍面臨諸多挑戰(zhàn),特別是垂直領(lǐng)域應(yīng)用。首先梳理了通用大語言模型問答生成能力常見的評價(jià)指標(biāo),其次,從基于詞匯的自動評價(jià)方法、人工評價(jià)方法和基于大語言模型的評價(jià)方法三方面,闡述通用大語言模型問答任務(wù)準(zhǔn)確性評價(jià)方法,而后,針對通用大語言模型垂直領(lǐng)域問答準(zhǔn)確性較低的問題,以ChatGLM36B和國防動員領(lǐng)域?yàn)槔?,提出了?gòu)建垂直領(lǐng)域語料庫、精細(xì)化處理數(shù)據(jù)、定制化微調(diào)的“三步走”優(yōu)化方法,通過人工評價(jià)和基于詞匯的自動評價(jià)的方式進(jìn)行3輪測試評估,解決了通用大語言模型垂直領(lǐng)域問答精度較低的問題,顯著提升問答準(zhǔn)確性。相關(guān)成果有望為其他通用大語言模型和垂直領(lǐng)域應(yīng)用提供參考。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。