《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 基于因果關(guān)系和特征對齊的圖像分類域泛化模型
基于因果關(guān)系和特征對齊的圖像分類域泛化模型
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 8期
明水根,張洪
(1.中國科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院,安徽合肥230026; 2.中國科學(xué)技術(shù)大學(xué)管理學(xué)院,安徽合肥230026)
摘要: 針對現(xiàn)有域泛化方法性能較差或缺乏理論可解釋性的缺點,提出了一種基于因果關(guān)系和特征對齊的圖像分類域泛化模型,并證明了該模型的可識別性。該模型利用域泛化中的因果關(guān)系來學(xué)習(xí)含有不同信息的特征,將域泛化問題轉(zhuǎn)化為特征相關(guān)分布的偏移,再利用特征對齊消除偏移。為提高模型的性能,采用對抗訓(xùn)練進一步優(yōu)化學(xué)到的特征。在公共數(shù)據(jù)集上的實驗結(jié)果表明,新提出的模型與目前最優(yōu)的方法性能相當(dāng),表明該模型具有理論可解釋性的同時,還有不俗的實際性能表現(xiàn)。
中圖分類號:TP183、
文獻標(biāo)識碼:A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式:明水根,張洪.基于因果關(guān)系和特征對齊的圖像分類域泛化模型[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(8):59-65.
Domain generalization model in image classification based on causality and feature alignment
Ming Shuigen1,Zhang Hong2
(1School of Big Data, University of Science and Technology of China, Hefei 230026, China; 2School of Management, University of Science and Technology of China, Hefei 230026, China)
Abstract: Aiming at the shortcomings of poor performance or lack of theoretical interpretability of existing domain generalization methods, a novel domain generalization model for image classification based on causality and feature alignment is proposed, and the model′s identifiability is demonstrated. The model uses causal relationships in domain generalization to learn features containing different information, transforms the domain generalization problem into the biases of featurerelated distributions, and then eliminates the biases by aligning features. To improve the performance of the model, adversarial training is used to further optimize the learned features. Experimental results on public datasets show that the newly proposed model performs comparably with the stateoftheart models, indicating that the model has theoretical interpretability as well as decent practical performance.
Key words : domain generalization; variational autoencoder; causality; feature alignment; adversarial training

0引言


深度學(xué)習(xí)在計算機視覺和自然語言處理等領(lǐng)域都取得了驚人的成就。傳統(tǒng)的深度學(xué)習(xí)方法基于一個基本假設(shè):訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)是獨立且同分布的(Independent and Identically Distribution,IID)。但是,在現(xiàn)實任務(wù)中,如醫(yī)學(xué)成像和自主駕駛等領(lǐng)域,這種IID假設(shè)通常不成立。當(dāng)訓(xùn)練數(shù)據(jù)的分布(也稱為域)與測試數(shù)據(jù)的分布不同時,由于存在分布差距,訓(xùn)練出的模型通常表現(xiàn)不佳。訓(xùn)練數(shù)據(jù)的域與測試數(shù)據(jù)的域不同的現(xiàn)象也被稱為域偏移。上述觀點促進了域適應(yīng)(Domain Adaptation,DA)和域泛化(Domain Generalization,DG)的研究。域泛化的目標(biāo)是從多個相似分布(也稱為源域)中學(xué)習(xí)一種通用表征。一般數(shù)據(jù)都存在某些與輸出(即標(biāo)簽)相關(guān)且在不同域間都保持不變的特征,那么就可以將這種特征遷移到具有未見過分布(也稱為目標(biāo)域)的測試數(shù)據(jù)上。域泛化任務(wù)的示例如圖1所示。

大多數(shù)域泛化研究集中在學(xué)習(xí)不受域干擾的表征,從而得到所謂的域不變特征。例如,Li等[1]采用了域適應(yīng)研究中的思想,使用對抗訓(xùn)練來學(xué)習(xí)域不變特征以解決域泛化問題。盡管這些基于學(xué)習(xí)策略的方法在真實世界的任務(wù)中表現(xiàn)良好,但缺乏理論可解釋性。Ilse等[2]和Peng等[3]采用特征解耦方法來學(xué)習(xí)標(biāo)簽的特定特征,并希望這些特征是關(guān)于域不變的。這種基于特征解耦的方法在理論上是可解釋的,但在實際的域泛化任務(wù)中表現(xiàn)不佳。因此,研究既具有理論可解釋性又在真實的域泛化任務(wù)中表現(xiàn)良好的方法非常重要。

本文提出了一種稱為對抗域不變變分自動編碼器(Adversarial Domain Invariant Variational AutoEncoder,ADIVA)的模型來解決域泛化問題。該模型先使用變分自動編碼器[4](Variational AutoEncoder,VAE)框架將輸入數(shù)據(jù)解耦成三個潛在因子:域信息因子、標(biāo)簽信息因子和包含任何殘留信息的因子,然后,將因果關(guān)系引入到域泛化任務(wù)中,將域偏移問題拆分為兩個相關(guān)分布的偏移問題。為了修正這些偏移,本文采用特征對齊方法來學(xué)習(xí)域不變特征。此外,為了解決VAE中存在的解耦不完全問題,本文采用對抗訓(xùn)練來消除潛在因子中的混淆信息,以進一步提高模型的實際表現(xiàn)。本文在兩個域泛化公開數(shù)據(jù)集——Rotated MNIST和PACS上,對ADIVA進行了大量實驗。實驗結(jié)果表明,ADIVA在域泛化表現(xiàn)方面具有與目前最優(yōu)方法相當(dāng)?shù)母偁幜?。本文的主要貢獻有:其一,本文基于域泛化中的因果關(guān)系使用特征對齊來解決域偏移問題;其二,本文采用對抗訓(xùn)練來解決VAE特征解耦不完全的問題,提升ADIVA在實際任務(wù)中的性能;其三,本文證明了ADIVA的可識別性理論。



本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000005468




作者信息:

明水根1,張洪2

(1.中國科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院,安徽合肥230026;2.中國科學(xué)技術(shù)大學(xué)管理學(xué)院,安徽合肥230026)


微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。