基于RoBERTa和多層次特征的中文事件抽取方法
所屬分類:技術(shù)論文
上傳者:
文檔大?。?span>4556 K
標(biāo)簽: 事件抽取 RoBERTa預(yù)訓(xùn)練模型 多層次特征
所需積分:0分積分不夠怎么辦?
文檔介紹:針對(duì)中文事件抽取中語義表征不充分、特征提取不全面等問題,提出一種基于RoBERTa和多層次特征的中文事件抽取方法。通過RoBERTa預(yù)訓(xùn)練模型構(gòu)建字向量,并基于詞性標(biāo)注和觸發(fā)詞語義信息融入進(jìn)行字向量擴(kuò)展;其次使用雙向長短時(shí)記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)抽取全局特征和局部特征,并通過自注意力機(jī)制捕捉不同特征之間的關(guān)聯(lián),加強(qiáng)對(duì)重要特征的利用;最后通過條件隨機(jī)場實(shí)現(xiàn)BIO序列標(biāo)注,完成事件抽取。在DuEE1.0數(shù)據(jù)集上,觸發(fā)詞抽取和事件論元抽取的F1值達(dá)到86.9%和68.0%,優(yōu)于現(xiàn)有常用事件抽取模型,驗(yàn)證了該方法的有效性。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。