基于詞匯增強(qiáng)和表格填充的中文命名實(shí)體識別
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>3582 K
標(biāo)簽: 詞匯增強(qiáng) 中文命名實(shí)體識別 表格填充
所需積分:0分積分不夠怎么辦?
文檔介紹:中文命名實(shí)體識別主要包括中文平面命名實(shí)體識別和中文嵌套命名實(shí)體識別兩個任務(wù),其中中文嵌套命名實(shí)體識別任務(wù)難度更大。提出了一個基于詞匯增強(qiáng)和表格填充的統(tǒng)一模型TLEXNER,該模型能夠同時(shí)處理上述任務(wù)。該模型首先針對中文語料分詞困難的問題,使用詞典適配器將詞匯信息融合到BERT預(yù)訓(xùn)練模型,并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中;然后通過條件層歸一化和雙仿射模型構(gòu)造并預(yù)測字符對表格,使用表格建模字符與字符之間的關(guān)系,得到平面實(shí)體與嵌套實(shí)體的統(tǒng)一表示;最后根據(jù)字符對表格上三角區(qū)域的數(shù)值判斷實(shí)體類別。提出的模型在平面實(shí)體的公開數(shù)據(jù)集Resume和自行標(biāo)注的軍事領(lǐng)域嵌套實(shí)體數(shù)據(jù)集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。