文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.19358/j.issn.2097-1788.2023.08.010
引用格式:明水根,張洪.基于因果關(guān)系和特征對(duì)齊的圖像分類(lèi)域泛化模型[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(8):59-65.
0引言
深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等領(lǐng)域都取得了驚人的成就。傳統(tǒng)的深度學(xué)習(xí)方法基于一個(gè)基本假設(shè):訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是獨(dú)立且同分布的(Independent and Identically Distribution,IID)。但是,在現(xiàn)實(shí)任務(wù)中,如醫(yī)學(xué)成像和自主駕駛等領(lǐng)域,這種IID假設(shè)通常不成立。當(dāng)訓(xùn)練數(shù)據(jù)的分布(也稱(chēng)為域)與測(cè)試數(shù)據(jù)的分布不同時(shí),由于存在分布差距,訓(xùn)練出的模型通常表現(xiàn)不佳。訓(xùn)練數(shù)據(jù)的域與測(cè)試數(shù)據(jù)的域不同的現(xiàn)象也被稱(chēng)為域偏移。上述觀點(diǎn)促進(jìn)了域適應(yīng)(Domain Adaptation,DA)和域泛化(Domain Generalization,DG)的研究。域泛化的目標(biāo)是從多個(gè)相似分布(也稱(chēng)為源域)中學(xué)習(xí)一種通用表征。一般數(shù)據(jù)都存在某些與輸出(即標(biāo)簽)相關(guān)且在不同域間都保持不變的特征,那么就可以將這種特征遷移到具有未見(jiàn)過(guò)分布(也稱(chēng)為目標(biāo)域)的測(cè)試數(shù)據(jù)上。域泛化任務(wù)的示例如圖1所示。
大多數(shù)域泛化研究集中在學(xué)習(xí)不受域干擾的表征,從而得到所謂的域不變特征。例如,Li等[1]采用了域適應(yīng)研究中的思想,使用對(duì)抗訓(xùn)練來(lái)學(xué)習(xí)域不變特征以解決域泛化問(wèn)題。盡管這些基于學(xué)習(xí)策略的方法在真實(shí)世界的任務(wù)中表現(xiàn)良好,但缺乏理論可解釋性。Ilse等[2]和Peng等[3]采用特征解耦方法來(lái)學(xué)習(xí)標(biāo)簽的特定特征,并希望這些特征是關(guān)于域不變的。這種基于特征解耦的方法在理論上是可解釋的,但在實(shí)際的域泛化任務(wù)中表現(xiàn)不佳。因此,研究既具有理論可解釋性又在真實(shí)的域泛化任務(wù)中表現(xiàn)良好的方法非常重要。
本文提出了一種稱(chēng)為對(duì)抗域不變變分自動(dòng)編碼器(Adversarial Domain Invariant Variational AutoEncoder,ADIVA)的模型來(lái)解決域泛化問(wèn)題。該模型先使用變分自動(dòng)編碼器[4](Variational AutoEncoder,VAE)框架將輸入數(shù)據(jù)解耦成三個(gè)潛在因子:域信息因子、標(biāo)簽信息因子和包含任何殘留信息的因子,然后,將因果關(guān)系引入到域泛化任務(wù)中,將域偏移問(wèn)題拆分為兩個(gè)相關(guān)分布的偏移問(wèn)題。為了修正這些偏移,本文采用特征對(duì)齊方法來(lái)學(xué)習(xí)域不變特征。此外,為了解決VAE中存在的解耦不完全問(wèn)題,本文采用對(duì)抗訓(xùn)練來(lái)消除潛在因子中的混淆信息,以進(jìn)一步提高模型的實(shí)際表現(xiàn)。本文在兩個(gè)域泛化公開(kāi)數(shù)據(jù)集——Rotated MNIST和PACS上,對(duì)ADIVA進(jìn)行了大量實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,ADIVA在域泛化表現(xiàn)方面具有與目前最優(yōu)方法相當(dāng)?shù)母?jìng)爭(zhēng)力。本文的主要貢獻(xiàn)有:其一,本文基于域泛化中的因果關(guān)系使用特征對(duì)齊來(lái)解決域偏移問(wèn)題;其二,本文采用對(duì)抗訓(xùn)練來(lái)解決VAE特征解耦不完全的問(wèn)題,提升ADIVA在實(shí)際任務(wù)中的性能;其三,本文證明了ADIVA的可識(shí)別性理論。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000005468
作者信息:
明水根1,張洪2
(1.中國(guó)科學(xué)技術(shù)大學(xué)大數(shù)據(jù)學(xué)院,安徽合肥230026;2.中國(guó)科學(xué)技術(shù)大學(xué)管理學(xué)院,安徽合肥230026)