引言
方面級(jí)情感分類是情感分析任務(wù)的一個(gè)分支,旨在確定句子中特定方面詞的情感極性。給定句子“Lots of extra space but the keyboard is ridiculously small.”,方面級(jí)情感分類(ASC)的任務(wù)是對(duì)句子中給定的方面詞“space”和“keyboard”,應(yīng)該可以得出對(duì)應(yīng)的情感極性分別為積極和消極。
之前的研究通過(guò)將循環(huán)神將網(wǎng)絡(luò)(RNN)與注意力機(jī)制[1]進(jìn)行結(jié)合,可以明顯提高此類任務(wù)的性能。但是注意力機(jī)制很容易受到噪聲的影響。局部上下文聚焦機(jī)制[2](LCF)發(fā)現(xiàn)方面詞自身周圍的單詞對(duì)其情感極性的判別更加重要,通過(guò)使用LCF捕獲局部上下文,并使用動(dòng)態(tài)距離掩碼(CDM)或動(dòng)態(tài)距離加權(quán)(CDW)可以捕獲方面詞周圍的重要信息。同時(shí),隨著預(yù)訓(xùn)練模型BERT[3]的出現(xiàn),對(duì)BERT結(jié)構(gòu)做出針對(duì)性的調(diào)整也成為了研究方向。盡管上述方法已經(jīng)取得了顯著的成績(jī),但是仍然存在以下兩點(diǎn)問(wèn)題。(1)未充分挖掘BERT語(yǔ)義信息。Ganesh等人[4]發(fā)現(xiàn)BERT自身高層的語(yǔ)義信息已經(jīng)足夠豐富,如何更好地利用這些信息仍有待進(jìn)一步研究。(2)局部關(guān)鍵特征提取不充分。在使用LCF的模型中使用固定閾值劃分局部上下文,其范圍不夠精確;同時(shí)在兩類上下文中使用的特征提取方法未能很好地提取局部關(guān)鍵信息。
為了解決上述問(wèn)題,本文提出了一個(gè)全新的模型,通過(guò)結(jié)合BERT語(yǔ)義融合和關(guān)鍵詞特征提取進(jìn)行方面級(jí)情感分類。一是提出BERT語(yǔ)義融合模塊,利用門控函數(shù)將BERT編碼器不同層的表示向量進(jìn)行融合。二是提出關(guān)鍵字特征提取模塊,根據(jù)句子長(zhǎng)度動(dòng)態(tài)確定局部上下文和非局部上下文的范圍,并通過(guò)句法二次掩碼和距離感知注意力提取兩類上下文的關(guān)鍵特征。三是引入?yún)f(xié)同注意力模塊,將局部特征、全局特征和方面詞特征融合,得到融合局部信息和方面詞信息的全局特征。
本文的主要貢獻(xiàn)總結(jié)如下:
(1)將BERT編碼器的第9~12層通過(guò)針對(duì)性設(shè)計(jì)的門控函數(shù)進(jìn)行語(yǔ)義融合,提取到了包含豐富語(yǔ)義的句子初始的上下文表示向量。
(2)提出了關(guān)鍵字特征提取模塊。該模塊通過(guò)句子長(zhǎng)度動(dòng)態(tài)確定局部上下文和非局部上下文,并用句法二次掩碼和距離感知注意力來(lái)分別提取對(duì)應(yīng)區(qū)域的局部關(guān)鍵特征。
(3)設(shè)計(jì)了全新的協(xié)同注意力。通過(guò)使用注意力機(jī)制融合全局特征、局部特征和方面詞特征來(lái)獲得包含豐富語(yǔ)義信息的全新特征。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006226
作者信息:
胡耀庭,韓雨橋,石宇航,高宣,彭玉青
(河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津300401)