基于詞匯增強和表格填充的中文命名實體識別 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大?。?span>3582 K | |
標簽: 詞匯增強 中文命名實體識別 表格填充 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:中文命名實體識別主要包括中文平面命名實體識別和中文嵌套命名實體識別兩個任務(wù),其中中文嵌套命名實體識別任務(wù)難度更大。提出了一個基于詞匯增強和表格填充的統(tǒng)一模型TLEXNER,該模型能夠同時處理上述任務(wù)。該模型首先針對中文語料分詞困難的問題,使用詞典適配器將詞匯信息融合到BERT預(yù)訓(xùn)練模型,并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中;然后通過條件層歸一化和雙仿射模型構(gòu)造并預(yù)測字符對表格,使用表格建模字符與字符之間的關(guān)系,得到平面實體與嵌套實體的統(tǒng)一表示;最后根據(jù)字符對表格上三角區(qū)域的數(shù)值判斷實體類別。提出的模型在平面實體的公開數(shù)據(jù)集Resume和自行標注的軍事領(lǐng)域嵌套實體數(shù)據(jù)集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2