《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 設(shè)計(jì)應(yīng)用 > 基于因果關(guān)系和特征對(duì)齊的圖像分類(lèi)域泛化模型
基于因果關(guān)系和特征對(duì)齊的圖像分類(lèi)域泛化模型
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 8期
明水根,張洪
(1.中國(guó)科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院,安徽合肥230026; 2.中國(guó)科學(xué)技術(shù)大學(xué)管理學(xué)院,安徽合肥230026)
摘要: 針對(duì)現(xiàn)有域泛化方法性能較差或缺乏理論可解釋性的缺點(diǎn),提出了一種基于因果關(guān)系和特征對(duì)齊的圖像分類(lèi)域泛化模型,并證明了該模型的可識(shí)別性。該模型利用域泛化中的因果關(guān)系來(lái)學(xué)習(xí)含有不同信息的特征,將域泛化問(wèn)題轉(zhuǎn)化為特征相關(guān)分布的偏移,再利用特征對(duì)齊消除偏移。為提高模型的性能,采用對(duì)抗訓(xùn)練進(jìn)一步優(yōu)化學(xué)到的特征。在公共數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,新提出的模型與目前最優(yōu)的方法性能相當(dāng),表明該模型具有理論可解釋性的同時(shí),還有不俗的實(shí)際性能表現(xiàn)。
中圖分類(lèi)號(hào):TP183、
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式:明水根,張洪.基于因果關(guān)系和特征對(duì)齊的圖像分類(lèi)域泛化模型[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(8):59-65.
Domain generalization model in image classification based on causality and feature alignment
Ming Shuigen1,Zhang Hong2
(1School of Big Data, University of Science and Technology of China, Hefei 230026, China; 2School of Management, University of Science and Technology of China, Hefei 230026, China)
Abstract: Aiming at the shortcomings of poor performance or lack of theoretical interpretability of existing domain generalization methods, a novel domain generalization model for image classification based on causality and feature alignment is proposed, and the model′s identifiability is demonstrated. The model uses causal relationships in domain generalization to learn features containing different information, transforms the domain generalization problem into the biases of featurerelated distributions, and then eliminates the biases by aligning features. To improve the performance of the model, adversarial training is used to further optimize the learned features. Experimental results on public datasets show that the newly proposed model performs comparably with the stateoftheart models, indicating that the model has theoretical interpretability as well as decent practical performance.
Key words : domain generalization; variational autoencoder; causality; feature alignment; adversarial training

0引言


深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等領(lǐng)域都取得了驚人的成就。傳統(tǒng)的深度學(xué)習(xí)方法基于一個(gè)基本假設(shè):訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是獨(dú)立且同分布的(Independent and Identically Distribution,IID)。但是,在現(xiàn)實(shí)任務(wù)中,如醫(yī)學(xué)成像和自主駕駛等領(lǐng)域,這種IID假設(shè)通常不成立。當(dāng)訓(xùn)練數(shù)據(jù)的分布(也稱(chēng)為域)與測(cè)試數(shù)據(jù)的分布不同時(shí),由于存在分布差距,訓(xùn)練出的模型通常表現(xiàn)不佳。訓(xùn)練數(shù)據(jù)的域與測(cè)試數(shù)據(jù)的域不同的現(xiàn)象也被稱(chēng)為域偏移。上述觀點(diǎn)促進(jìn)了域適應(yīng)(Domain Adaptation,DA)和域泛化(Domain Generalization,DG)的研究。域泛化的目標(biāo)是從多個(gè)相似分布(也稱(chēng)為源域)中學(xué)習(xí)一種通用表征。一般數(shù)據(jù)都存在某些與輸出(即標(biāo)簽)相關(guān)且在不同域間都保持不變的特征,那么就可以將這種特征遷移到具有未見(jiàn)過(guò)分布(也稱(chēng)為目標(biāo)域)的測(cè)試數(shù)據(jù)上。域泛化任務(wù)的示例如圖1所示。

大多數(shù)域泛化研究集中在學(xué)習(xí)不受域干擾的表征,從而得到所謂的域不變特征。例如,Li等[1]采用了域適應(yīng)研究中的思想,使用對(duì)抗訓(xùn)練來(lái)學(xué)習(xí)域不變特征以解決域泛化問(wèn)題。盡管這些基于學(xué)習(xí)策略的方法在真實(shí)世界的任務(wù)中表現(xiàn)良好,但缺乏理論可解釋性。Ilse等[2]和Peng等[3]采用特征解耦方法來(lái)學(xué)習(xí)標(biāo)簽的特定特征,并希望這些特征是關(guān)于域不變的。這種基于特征解耦的方法在理論上是可解釋的,但在實(shí)際的域泛化任務(wù)中表現(xiàn)不佳。因此,研究既具有理論可解釋性又在真實(shí)的域泛化任務(wù)中表現(xiàn)良好的方法非常重要。

本文提出了一種稱(chēng)為對(duì)抗域不變變分自動(dòng)編碼器(Adversarial Domain Invariant Variational AutoEncoder,ADIVA)的模型來(lái)解決域泛化問(wèn)題。該模型先使用變分自動(dòng)編碼器[4](Variational AutoEncoder,VAE)框架將輸入數(shù)據(jù)解耦成三個(gè)潛在因子:域信息因子、標(biāo)簽信息因子和包含任何殘留信息的因子,然后,將因果關(guān)系引入到域泛化任務(wù)中,將域偏移問(wèn)題拆分為兩個(gè)相關(guān)分布的偏移問(wèn)題。為了修正這些偏移,本文采用特征對(duì)齊方法來(lái)學(xué)習(xí)域不變特征。此外,為了解決VAE中存在的解耦不完全問(wèn)題,本文采用對(duì)抗訓(xùn)練來(lái)消除潛在因子中的混淆信息,以進(jìn)一步提高模型的實(shí)際表現(xiàn)。本文在兩個(gè)域泛化公開(kāi)數(shù)據(jù)集——Rotated MNIST和PACS上,對(duì)ADIVA進(jìn)行了大量實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,ADIVA在域泛化表現(xiàn)方面具有與目前最優(yōu)方法相當(dāng)?shù)母?jìng)爭(zhēng)力。本文的主要貢獻(xiàn)有:其一,本文基于域泛化中的因果關(guān)系使用特征對(duì)齊來(lái)解決域偏移問(wèn)題;其二,本文采用對(duì)抗訓(xùn)練來(lái)解決VAE特征解耦不完全的問(wèn)題,提升ADIVA在實(shí)際任務(wù)中的性能;其三,本文證明了ADIVA的可識(shí)別性理論。



本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000005468




作者信息:

明水根1,張洪2

(1.中國(guó)科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院,安徽合肥230026;2.中國(guó)科學(xué)技術(shù)大學(xué)管理學(xué)院,安徽合肥230026)


微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。