123,123

基于因果关系和特征对齐的图像分类域泛化模型

网络安全与数据治理 8期

明水根，张洪

（1.中国科学技术大学大数据学院，安徽合肥230026； 2.中国科学技术大学管理学院，安徽合肥230026）

摘要： 针对现有域泛化方法性能较差或缺乏理论可解释性的缺点，提出了一种基于因果关系和特征对齐的图像分类域泛化模型，并证明了该模型的可识别性。该模型利用域泛化中的因果关系来学习含有不同信息的特征，将域泛化问题转化为特征相关分布的偏移，再利用特征对齐消除偏移。为提高模型的性能，采用对抗训练进一步优化学到的特征。在公共数据集上的实验结果表明，新提出的模型与目前最优的方法性能相当，表明该模型具有理论可解释性的同时，还有不俗的实际性能表现。

關(guān)鍵詞： 域泛化变分自编码器因果关系特征对齐对抗训练

中圖分類號：TP183、
文獻(xiàn)標(biāo)識碼：A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式：明水根，張洪.基于因果關(guān)系和特征對齊的圖像分類域泛化模型［J］.網(wǎng)絡(luò)安全與數(shù)據(jù)治理，2023，42（8）：59-65.

Domain generalization model in image classification based on causality and feature alignment

Ming Shuigen1，Zhang Hong2

(1School of Big Data, University of Science and Technology of China, Hefei 230026, China; 2School of Management, University of Science and Technology of China, Hefei 230026, China)

Abstract： Aiming at the shortcomings of poor performance or lack of theoretical interpretability of existing domain generalization methods, a novel domain generalization model for image classification based on causality and feature alignment is proposed, and the model′s identifiability is demonstrated. The model uses causal relationships in domain generalization to learn features containing different information, transforms the domain generalization problem into the biases of featurerelated distributions, and then eliminates the biases by aligning features. To improve the performance of the model, adversarial training is used to further optimize the learned features. Experimental results on public datasets show that the newly proposed model performs comparably with the stateoftheart models, indicating that the model has theoretical interpretability as well as decent practical performance.

Key words : domain generalization; variational autoencoder; causality; feature alignment; adversarial training

0引言

深度學(xué)習(xí)在計算機(jī)視覺和自然語言處理等領(lǐng)域都取得了驚人的成就。傳統(tǒng)的深度學(xué)習(xí)方法基于一個基本假設(shè)：訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)是獨(dú)立且同分布的（Independent and Identically Distribution，IID）。但是，在現(xiàn)實(shí)任務(wù)中，如醫(yī)學(xué)成像和自主駕駛等領(lǐng)域，這種IID假設(shè)通常不成立。當(dāng)訓(xùn)練數(shù)據(jù)的分布（也稱為域）與測試數(shù)據(jù)的分布不同時，由于存在分布差距，訓(xùn)練出的模型通常表現(xiàn)不佳。訓(xùn)練數(shù)據(jù)的域與測試數(shù)據(jù)的域不同的現(xiàn)象也被稱為域偏移。上述觀點(diǎn)促進(jìn)了域適應(yīng)（Domain Adaptation，DA）和域泛化（Domain Generalization，DG）的研究。域泛化的目標(biāo)是從多個相似分布（也稱為源域）中學(xué)習(xí)一種通用表征。一般數(shù)據(jù)都存在某些與輸出（即標(biāo)簽）相關(guān)且在不同域間都保持不變的特征，那么就可以將這種特征遷移到具有未見過分布（也稱為目標(biāo)域）的測試數(shù)據(jù)上。域泛化任務(wù)的示例如圖1所示。

大多數(shù)域泛化研究集中在學(xué)習(xí)不受域干擾的表征，從而得到所謂的域不變特征。例如，Li等［1］采用了域適應(yīng)研究中的思想，使用對抗訓(xùn)練來學(xué)習(xí)域不變特征以解決域泛化問題。盡管這些基于學(xué)習(xí)策略的方法在真實(shí)世界的任務(wù)中表現(xiàn)良好，但缺乏理論可解釋性。Ilse等［2］和Peng等［3］采用特征解耦方法來學(xué)習(xí)標(biāo)簽的特定特征，并希望這些特征是關(guān)于域不變的。這種基于特征解耦的方法在理論上是可解釋的，但在實(shí)際的域泛化任務(wù)中表現(xiàn)不佳。因此，研究既具有理論可解釋性又在真實(shí)的域泛化任務(wù)中表現(xiàn)良好的方法非常重要。

本文提出了一種稱為對抗域不變變分自動編碼器（Adversarial Domain Invariant Variational AutoEncoder，ADIVA）的模型來解決域泛化問題。該模型先使用變分自動編碼器［4］（Variational AutoEncoder，VAE）框架將輸入數(shù)據(jù)解耦成三個潛在因子：域信息因子、標(biāo)簽信息因子和包含任何殘留信息的因子，然后，將因果關(guān)系引入到域泛化任務(wù)中，將域偏移問題拆分為兩個相關(guān)分布的偏移問題。為了修正這些偏移，本文采用特征對齊方法來學(xué)習(xí)域不變特征。此外，為了解決VAE中存在的解耦不完全問題，本文采用對抗訓(xùn)練來消除潛在因子中的混淆信息，以進(jìn)一步提高模型的實(shí)際表現(xiàn)。本文在兩個域泛化公開數(shù)據(jù)集——Rotated MNIST和PACS上，對ADIVA進(jìn)行了大量實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明，ADIVA在域泛化表現(xiàn)方面具有與目前最優(yōu)方法相當(dāng)?shù)母偁幜?。本文的主要貢獻(xiàn)有：其一，本文基于域泛化中的因果關(guān)系使用特征對齊來解決域偏移問題；其二，本文采用對抗訓(xùn)練來解決VAE特征解耦不完全的問題，提升ADIVA在實(shí)際任務(wù)中的性能；其三，本文證明了ADIVA的可識別性理論。

本文詳細(xì)內(nèi)容請下載：http://ihrv.cn/resource/share/2000005468

作者信息：

明水根1，張洪2

（1.中國科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院，安徽合肥230026；2.中國科學(xué)技術(shù)大學(xué)管理學(xué)院，安徽合肥230026）

微信圖片_20210517164139.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容