引言
方面級情感分類是情感分析任務的一個分支,旨在確定句子中特定方面詞的情感極性。給定句子“Lots of extra space but the keyboard is ridiculously small.”,方面級情感分類(ASC)的任務是對句子中給定的方面詞“space”和“keyboard”,應該可以得出對應的情感極性分別為積極和消極。
之前的研究通過將循環(huán)神將網(wǎng)絡(RNN)與注意力機制[1]進行結合,可以明顯提高此類任務的性能。但是注意力機制很容易受到噪聲的影響。局部上下文聚焦機制[2](LCF)發(fā)現(xiàn)方面詞自身周圍的單詞對其情感極性的判別更加重要,通過使用LCF捕獲局部上下文,并使用動態(tài)距離掩碼(CDM)或動態(tài)距離加權(CDW)可以捕獲方面詞周圍的重要信息。同時,隨著預訓練模型BERT[3]的出現(xiàn),對BERT結構做出針對性的調整也成為了研究方向。盡管上述方法已經(jīng)取得了顯著的成績,但是仍然存在以下兩點問題。(1)未充分挖掘BERT語義信息。Ganesh等人[4]發(fā)現(xiàn)BERT自身高層的語義信息已經(jīng)足夠豐富,如何更好地利用這些信息仍有待進一步研究。(2)局部關鍵特征提取不充分。在使用LCF的模型中使用固定閾值劃分局部上下文,其范圍不夠精確;同時在兩類上下文中使用的特征提取方法未能很好地提取局部關鍵信息。
為了解決上述問題,本文提出了一個全新的模型,通過結合BERT語義融合和關鍵詞特征提取進行方面級情感分類。一是提出BERT語義融合模塊,利用門控函數(shù)將BERT編碼器不同層的表示向量進行融合。二是提出關鍵字特征提取模塊,根據(jù)句子長度動態(tài)確定局部上下文和非局部上下文的范圍,并通過句法二次掩碼和距離感知注意力提取兩類上下文的關鍵特征。三是引入?yún)f(xié)同注意力模塊,將局部特征、全局特征和方面詞特征融合,得到融合局部信息和方面詞信息的全局特征。
本文的主要貢獻總結如下:
(1)將BERT編碼器的第9~12層通過針對性設計的門控函數(shù)進行語義融合,提取到了包含豐富語義的句子初始的上下文表示向量。
(2)提出了關鍵字特征提取模塊。該模塊通過句子長度動態(tài)確定局部上下文和非局部上下文,并用句法二次掩碼和距離感知注意力來分別提取對應區(qū)域的局部關鍵特征。
(3)設計了全新的協(xié)同注意力。通過使用注意力機制融合全局特征、局部特征和方面詞特征來獲得包含豐富語義信息的全新特征。
本文詳細內容請下載:
http://ihrv.cn/resource/share/2000006226
作者信息:
胡耀庭,韓雨橋,石宇航,高宣,彭玉青
(河北工業(yè)大學人工智能與數(shù)據(jù)科學學院,天津300401)