引言
近年來,大語言模型[1-2]的發(fā)展呈現出蓬勃的態(tài)勢。雖然中文模型正在快速崛起,但在權威的全球語言模型基準測試平臺Chatbot Arena[3]的排行中,顯著體現出一個現象:當前位居前列的先進大語言模型[4-6]均為英文模型。其中,Meta的LLaMA3[7]模型在代碼生成、邏輯推理、文本創(chuàng)作和摘要提煉等方面相較于同參數量級的競爭對手展現出了顯著的性能提升。然而,值得注意的是,其應用場景主要聚焦于英文環(huán)境。盡管其訓練數據涵蓋了超過30種語言,但非英文的多語種數據在整體訓練數據中的占比僅達到5%。英文大模型主要訓練語料為英文,在英文場景下智能程度顯著高于其他語種,直接將此類模型應用于特定語言場景將面臨諸多挑戰(zhàn)。
大模型英文能力顯著高于其他語種的現象與預訓練時學習語料的不平衡有直接關系,特別是在涉及各國各地區(qū)獨特的知識能力和安全價值觀時尤為顯著。當非主要訓練語言的用戶與這些大模型進行交互時,往往會出現理解偏差甚至錯誤回答的情況。因此,大模型不僅需要深入掌握英文語境下的通用知識,具備基本的推理、計算、翻譯、分類、生成等能力,而且必須能夠因地制宜,根據用戶所屬特定文化下的知識能力和安全價值觀進行精準交互,以確保信息傳達的準確性和有效性。
在大模型的實際應用中,如何維持其英文能力的卓越性,同時確保其在特定文化下的知識能力與安全價值觀的對齊,是一項亟待解決的挑戰(zhàn)。通過觀察外國專家在華的成功適應案例(如圖1所示),本文得以獲得啟示。以醫(yī)學專家馬海德為例,他作為瑞士日內瓦大學的醫(yī)學博士,于1933年來華從事醫(yī)學研究。他不僅積極投入診療與調研,而且迅速掌握了普通話及陜北方言,進而成功協(xié)助創(chuàng)建了中央皮膚性病研究所,并參與制定了針對性病和麻風病的防治計劃,將其專業(yè)知識貢獻于中國。馬海德的事例表明,通過針對特定語言文化環(huán)境的能力提升和安全價值觀調整,即便在文化背景與價值觀存在差異的情況下,也能有效利用外國專家的專業(yè)知識。這一經驗為大模型領域提供了借鑒:開發(fā)適應特定文化背景的能力增強與價值觀再造方法,以高效地優(yōu)化現有的英文大模型,使其更好地服務于全球不同文化背景下的用戶。

圖1外國專家(英文專家)中文本土化改造學習路線圖
針對英文大模型在特定文化背景下的快速適配問題,本文提出一種基于特定文化下知識能力和安全價值觀數據的指令微調流程與方法。該方法無需預訓練,即可使模型在短期內實現對于特定國家與地區(qū)文化的快速適配。以中國文化為例,本文采用LLaMA38B作為待改造的英文大語言模型,深入探討了指令微調策略在促進模型快速適配中文語境下基礎能力與安全價值觀的有效性。評估結果表明,經過知識能力與安全價值觀改造后的大模型,不僅成功保留了其原先優(yōu)越的專業(yè)知識,還顯著增強了特定文化下的知識和能力,同時確保完全符合特定社會文化下的價值觀和安全標準。
本文詳細內容請下載:
http://ihrv.cn/resource/share/2000006856
作者信息:
張文靜1,2,肖思琪1,2,雷雪嬌1,2,王寧1,2,
張華正1,2,安美娟1,2,楊必琨1,2,
劉兆祥1,2,王愷1,2,廉士國1,2
(1.中國聯通數據科學與人工智能研究院,北京100033;
2.聯通數據智能有限公司,北京100033)

