亚洲国产在线精品国自产拍愿 ,亚洲专区无码天堂中文字幕,久久99久久99精品免视看

基于雙注意力和多區(qū)域檢測的細(xì)粒度圖像分類

2022年電子技術(shù)應(yīng)用第8期

潘新辰，楊小健，秦嶺

南京工業(yè)大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院，江蘇南京211816

摘要： 有效地檢測具有辨別性的局部區(qū)域和更準(zhǔn)確地提取圖像的細(xì)粒度特征有助于提高細(xì)粒度圖像的分類效果。為此，提出了一種結(jié)合雙注意力機(jī)制和多區(qū)域檢測的細(xì)粒度圖像分類方法。多區(qū)域檢測旨在通過類別標(biāo)簽學(xué)習(xí)定位到具有辨別性的圖像區(qū)域，然后通過特征提取網(wǎng)絡(luò)提取辨別性局部區(qū)域的特征并與全局特征相融合。同樣，更精確的特征提取網(wǎng)絡(luò)能夠提取圖像細(xì)粒度的特征。因此，通過將雙注意力機(jī)制和多區(qū)域檢測相結(jié)合，所提出的方法在3個公開的細(xì)粒度圖像數(shù)據(jù)集CUB-200-2011、StanfordCars和FGVC Aircraft上分別達(dá)到了88.3%、94.5%和92.3%的準(zhǔn)確率。

關(guān)鍵詞： 細(xì)粒度圖像分類注意力機(jī)制區(qū)域檢測卷積神經(jīng)網(wǎng)絡(luò) 特征提取

中圖分類號： TP301.6
文獻(xiàn)標(biāo)識碼： A
DOI：10.16157/j.issn.0258-7998.211980
中文引用格式： 潘新辰，楊小健，秦嶺. 基于雙注意力和多區(qū)域檢測的細(xì)粒度圖像分類[J].電子技術(shù)應(yīng)用，2022，48(8)：117-122.
英文引用格式： Pan Xinchen，Yang Xiaojian，Qin Ling. Fine-grained image classification based on dual attentions and multi-region detection[J]. Application of Electronic Technique，2022，48(8)：117-122.

Fine-grained image classification based on dual attentions and multi-region detection

Pan Xinchen，Yang Xiaojian，Qin Ling

Computer Science and Technology，Nanjing University of Technology，Nanjing 211816，China

Abstract： Effectively detecting discriminative local areas and more accurately extracting fine-grained features of images will help improve the classification effect of fine-grained images. For this reason, a fine-grained image classification method combining dual attention mechanism and multi-region detection is proposed. Multi-region detection aims to locate discriminative image regions through class label learning, and then extract the features of the discriminative local regions through a feature extraction network and merge them with global features. Similarly, a more precise feature extraction network can extract fine-grained features of an image. Therefore, by combining the dual attention mechanism and multi-region detection, the proposed method respectively achieves 88.3%, 94.5% and 92.3% accuracy on three public fine-grained image datasets, CUB-200-2011, StanfordCars and FGVC Aircraft.

Key words : fine-grained image classification；attention mechanism；regional detection；convolutional neural network；feature extraction；feature group

0 引言

目前，深度學(xué)習(xí)技術(shù)已被廣泛應(yīng)用于圖像分類領(lǐng)域，細(xì)粒度圖像分類旨在區(qū)分同種對象的不同類別。相較于傳統(tǒng)圖像分類，細(xì)粒度圖像分類的難點在于：(1)不同類別之間的高相似性，難以找到具有辨別性的區(qū)域并提取細(xì)節(jié)特征；(2)同一種類別之間由于圖像視角、光照、背景和遮擋等因素的變化也存在著一定的差異性。因此，如何定位具有辨別性的局部區(qū)域，以及如何更精確地提取細(xì)粒度特征，成為目前細(xì)粒度圖像分類方法的主要研究方向。

為了檢測具有辨別性的局部區(qū)域，一些方法^[1-2]通過人工標(biāo)注的方式對細(xì)粒度圖像中具有辨別性的區(qū)域進(jìn)行標(biāo)注，然后通過網(wǎng)絡(luò)學(xué)習(xí)定位辨別性局部區(qū)域，從而提高網(wǎng)絡(luò)模型的分類準(zhǔn)確性，需要花費大量的時間、人力對圖像進(jìn)行標(biāo)注，成本太大。還有一些方法^[3-4]利用類別標(biāo)簽以弱監(jiān)督的方式來學(xué)習(xí)具有辨別性的局部區(qū)域，這類方法雖然不能夠達(dá)到使用人工標(biāo)注的標(biāo)簽進(jìn)行監(jiān)督學(xué)習(xí)的效果，但額外成本幾乎為零。

注意力機(jī)制作為提升網(wǎng)絡(luò)特征提取能力的重要手段^[5]主要分為通道注意力機(jī)制和空間注意力機(jī)制，通道注意力機(jī)制可以學(xué)習(xí)到不同通道間的權(quán)重關(guān)系，空間注意力機(jī)制可以學(xué)習(xí)不同像素間的依賴關(guān)系。合理利用以上兩個注意力機(jī)制能夠更細(xì)粒度提取圖像的特征，從而能夠更好地進(jìn)行分類。

本文詳細(xì)內(nèi)容請下載：http://ihrv.cn/resource/share/2000004663。

作者信息：

潘新辰，楊小健，秦嶺

(南京工業(yè)大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院，江蘇南京211816)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容