基于詞匯增強(qiáng)和表格填充的中文命名實(shí)體識別 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大?。?span>3582 K | |
標(biāo)簽: 詞匯增強(qiáng) 中文命名實(shí)體識別 表格填充 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:中文命名實(shí)體識別主要包括中文平面命名實(shí)體識別和中文嵌套命名實(shí)體識別兩個任務(wù),其中中文嵌套命名實(shí)體識別任務(wù)難度更大。提出了一個基于詞匯增強(qiáng)和表格填充的統(tǒng)一模型TLEXNER,該模型能夠同時(shí)處理上述任務(wù)。該模型首先針對中文語料分詞困難的問題,使用詞典適配器將詞匯信息融合到BERT預(yù)訓(xùn)練模型,并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中;然后通過條件層歸一化和雙仿射模型構(gòu)造并預(yù)測字符對表格,使用表格建模字符與字符之間的關(guān)系,得到平面實(shí)體與嵌套實(shí)體的統(tǒng)一表示;最后根據(jù)字符對表格上三角區(qū)域的數(shù)值判斷實(shí)體類別。提出的模型在平面實(shí)體的公開數(shù)據(jù)集Resume和自行標(biāo)注的軍事領(lǐng)域嵌套實(shí)體數(shù)據(jù)集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2