《電子技術(shù)應用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應用 > 基于生成對抗網(wǎng)絡(luò)的小樣本圖像數(shù)據(jù)增強技術(shù)
基于生成對抗網(wǎng)絡(luò)的小樣本圖像數(shù)據(jù)增強技術(shù)
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 6期
楊鵬坤,李金龍,郝潤來
(中國科學技術(shù)大學計算機科學與技術(shù)學院,安徽合肥230026)
摘要: 基于生成對抗網(wǎng)絡(luò)(GANs)的圖像數(shù)據(jù)增強方法在近年來展現(xiàn)出了巨大的潛力。然而生成高分辨率、高保真圖像通常需要大量訓練數(shù)據(jù),這和缺乏訓練數(shù)據(jù)的現(xiàn)狀背道而馳。為解決這一問題,提出了一種能夠在小樣本、高分辨率圖像數(shù)據(jù)集上穩(wěn)定訓練的條件生成對抗網(wǎng)絡(luò)模型,并且將該模型用于數(shù)據(jù)增強。實驗結(jié)果表明,在基準數(shù)據(jù)集上,該模型與當前最新模型相比能夠生成更加逼真的圖像并取得了最低的FID值;在圖像分類任務中使用其進行數(shù)據(jù)增強能夠有效緩解分類器的過擬合問題。
中圖分類號:TP391
文獻標識碼:A
DOI:10.19358/j.issn.2097-1788.2023.06.013
引用格式:楊鵬坤,李金龍,郝潤來.基于生成對抗網(wǎng)絡(luò)的小樣本圖像數(shù)據(jù)增強技術(shù)[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(6):79-84,102.
Few-shot image data augmentation based on generative adversarial networks
Yang Pengkun,Li Jinlong,Hao Runlai
(School of Computer Science and Technology, University of Science and Technology of China, Hefei 230026, China)
Abstract: In recent years, image data augmentation methods based on Generative Adversarial Networks (GANs) have shown great potential. However, generating highresolution, highfidelity images typically requires a large amount of training data, which contradicts the current lack of training data situation. To address this issue, a conditional GAN model that can stably train on fewshot, highresolution image datasets has been proposed for data augmentation. Experimental results on benchmark datasets indicate that this model, compared to the current stateoftheart models, is capable of generating more realistic images and achieving the lowest Fréchet Inception Distance (FID) score. Furthermore, using this model for data augmentation in image classification tasks effectively mitigates overfitting issues in classifiers.
Key words : generative adversarial networks; data augmentation; image classification

0    引言

視覺深度學習的成功不僅僅取決于高容量的模型,還依賴于大規(guī)模標注數(shù)據(jù)的可用性。許多優(yōu)秀的模型在大規(guī)模數(shù)據(jù)集上取得了良好的性能。然而,對于視覺識別任務,由于數(shù)據(jù)的收集和標注耗費巨大,通常在沒有足夠樣本的場景下訓練模型,往往會導致模型過擬合,從而降低其泛化性能。

為了解決這些問題,數(shù)據(jù)增強是常用的緩解數(shù)據(jù)匱乏的手段之一。雖然傳統(tǒng)的圖像增強技術(shù)(如旋轉(zhuǎn)和隨機裁剪)的確有效果,但一些轉(zhuǎn)換可能是無意義的,甚至會導致圖像語義上的改變。如數(shù)字‘6’旋轉(zhuǎn)180°變成了‘9’,改變了語義,這需要專家經(jīng)驗進行評估。最近的研究表明,使用生成對抗網(wǎng)絡(luò)(GANs)進行數(shù)據(jù)增強具有巨大潛力。生成對抗網(wǎng)絡(luò)是一種隱式生成模型,通過對真實樣本的數(shù)據(jù)分布進行建模,可以根據(jù)已有數(shù)據(jù)集的高維特征組合生成與訓練集完全不同的圖像,能夠為深度學習模型提供更多的圖像特征,以緩解過擬合問題。Mirza等人提出的條件生成對抗網(wǎng)絡(luò)(cGAN)可以通過控制類別生成對應類別的樣本,因此可以得到帶有標簽的樣本。



本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000005378




作者信息:

楊鵬坤,李金龍,郝潤來

(中國科學技術(shù)大學計算機科學與技術(shù)學院,安徽合肥230026)


微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。