大语言模型问答任务准确性评价方法及基于微调的垂直领域优化研究
所屬分類:技术论文
上傳者:wwei
文檔大?。?span>5136 K
標(biāo)簽: 大语言模型 问答任务 语料库
所需積分:0分積分不夠怎么辦?
文檔介紹:随着自然语言处理技术的进步,大语言模型展现了强大的语义理解和生成能力,但在实际应用中,其问答准确性仍面临诸多挑战,特别是垂直领域应用。首先梳理了通用大语言模型问答生成能力常见的评价指标,其次,从基于词汇的自动评价方法、人工评价方法和基于大语言模型的评价方法三方面,阐述通用大语言模型问答任务准确性评价方法,而后,针对通用大语言模型垂直领域问答准确性较低的问题,以ChatGLM36B和国防动员领域为例,提出了构建垂直领域语料库、精细化处理数据、定制化微调的“三步走”优化方法,通过人工评价和基于词汇的自动评价的方式进行3轮测试评估,解决了通用大语言模型垂直领域问答精度较低的问题,显著提升问答准确性。相关成果有望为其他通用大语言模型和垂直领域应用提供参考。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。