融入翻譯記憶庫的法律領域神經(jīng)機器翻譯方法* | |
所屬分類:技術論文 | |
上傳者:zhoubin333 | |
文檔大小:3666 K | |
標簽: 神經(jīng)機器翻譯 語義信息 結(jié)構信息 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:面向法律領域的神經(jīng)機器翻譯對于合同文本翻譯等應用場景具有重要價值。由于法律領域雙語對齊語料稀缺,翻譯效果還不理想。針對該問題,目前有效的方法是融入翻譯記憶或翻譯模版等外部信息,但法律領域的文本多具有固定的表達結(jié)構且用詞準確規(guī)范,在翻譯記憶庫中同時利用翻譯結(jié)構信息和語義信息能夠進一步提升法律領域翻譯性能?;诖?,提出一種融入翻譯記憶庫的法律領域機器翻譯方法。提出了一種新的法律領域翻譯記憶庫,首先基于語義和結(jié)構信息的相似性訓練跨語言檢索模型以充分利用單語數(shù)據(jù),然后從翻譯記憶庫中檢索與輸入源句相關的一組翻譯記憶和翻譯模版,進而引導翻譯模型生成目標句子。實驗表明,在MHLAW數(shù)據(jù)集上,提出的方法可以使譯文較基線模型提升1.28個BLEU點。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權所有 京ICP備10017138號-2