《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識(shí)別方法
一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識(shí)別方法
信息技術(shù)與網(wǎng)絡(luò)安全
余慧明,周志祥,彭 楊,崔志斌
(武漢興圖新科電子股份有限公司 平臺(tái)產(chǎn)品部,湖北 武漢430073)
摘要: 目標(biāo)識(shí)別技術(shù)作為機(jī)器視覺領(lǐng)域的一個(gè)重要分支,在各個(gè)領(lǐng)域有著重要的應(yīng)用。鑒于一般的目標(biāo)識(shí)別模型在遙感圖片中表現(xiàn)不佳,另外需要識(shí)別的目標(biāo)數(shù)量較多,尺寸大小不一,因此在經(jīng)典的目標(biāo)識(shí)別Mask R-CNN模型的基礎(chǔ)上,提出了一種融合了通道注意力機(jī)制和數(shù)據(jù)增強(qiáng)技術(shù)的模型Mask R-CNN模型。在輸入圖片數(shù)據(jù)時(shí),首先通過Random-Batch images操作對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)處理,提高模型對(duì)尺寸大小不一的目標(biāo)識(shí)別的準(zhǔn)確率;然后提取特征時(shí),將原Mask R-CNN模型中的FPN改進(jìn)為BiFPN,使提取到的特征能更好體現(xiàn)原本的圖片信息;在最后的Mask階段,增加了通道注意力機(jī)制,使得模型更多地得到需要的信息。經(jīng)過實(shí)驗(yàn)表明,此模型在遙感圖像的特殊目標(biāo)細(xì)粒度識(shí)別中有良好的表現(xiàn)。對(duì)于同一個(gè)數(shù)據(jù)集,其評(píng)價(jià)指標(biāo)在各個(gè)方面都要優(yōu)于其他對(duì)比算法。
中圖分類號(hào): TP389.1
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.03.007
引用格式: 余慧明,周志祥,彭?xiàng)?,? 一種基于改進(jìn)Mask R-CNN模型的遙感圖像目標(biāo)識(shí)別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(3):38-42,47.
A remote sensing image target recognition method based on improved Mask R-CNN model
Yu Huiming,Zhou Zhixiang,Peng Yang,Cui Zhibin
(Wuhan Xing Tu Xin Ke Co.,Ltd.,Platform Products Department,Wuhan 430073,China)
Abstract: As an important branch in the field of machine vision, target recognition technology has important applications in various fields. In view of the fact that the general target recognition model does not perform well in remote sensing images, the number of targets that need to be recognized is large, and the sizes are different, based on the classic target recognition Mask R-CNN model, a Mask R-CNN model fusing channel attention mechanism and data enhancement technology is proposed. When inputting image data, the data through the Random-Batch images operation to improve the accuracy of the model′s recognition of targets of different sizes is first enhanced; then, when extracting features, the FPN in the original Mask R-CNN model is improved to BiFPN, so that the extracted features can better reflect the original picture information; in the final Mask stage, the channel attention mechanism is added, so that the model can get more information. Experiments show that this model is used in remote sensing images. It has a good performance in the fine-grained recognition of special targets. For the same data set, its evaluation indicators are superior to other comparison algorithms in all aspects.
Key words : target recognition;Mask R-CNN;channel attention;data enhancement

0 引言

隨著人工智能的興起,深度學(xué)習(xí)[1]算法各個(gè)領(lǐng)域的優(yōu)勢(shì)被體現(xiàn)出來。對(duì)視頻、圖像中的多目標(biāo)、細(xì)粒度的目標(biāo)識(shí)別技術(shù),可以方便人們?cè)趶?fù)雜的情景中快速定位到所需要的檢測(cè)目標(biāo)。隨著場(chǎng)景的復(fù)雜度加深,基于基礎(chǔ)模型的各種改進(jìn)版本層出不窮。

在過去近10年中,目標(biāo)識(shí)別技術(shù)又有了飛速的發(fā)展,從最開始的機(jī)器學(xué)習(xí)算法,再到目前主流的深度學(xué)習(xí)目標(biāo)識(shí)別算法,如RCNN[2]、SSP-Net[3]、Fast R-CNN[4]、Faster R-CNN[5],目標(biāo)識(shí)別技術(shù)已經(jīng)在各個(gè)領(lǐng)域都有了很好的應(yīng)用。但是,由于數(shù)據(jù)集的制約,針對(duì)遙感圖像的軍事目標(biāo)識(shí)別卻是一個(gè)例外。另外,軍事碼頭物體數(shù)量眾多,需要檢測(cè)的目標(biāo)與其他物體交錯(cuò)相間,大大降低了模型的準(zhǔn)確性。對(duì)于一些密集型的目標(biāo)檢測(cè),PAN X[6]等人提出了一個(gè)由特征選擇模塊(Feature Selection Module,F(xiàn)SM)和動(dòng)態(tài)優(yōu)化頭(Dynamic Refinement Head,DRH)組成的動(dòng)態(tài)優(yōu)化網(wǎng)絡(luò)。FSM使神經(jīng)元能夠根據(jù)目標(biāo)物體的形狀和方向調(diào)整接受野,而DRH使模型能夠以一種對(duì)象感知的方式動(dòng)態(tài)地改進(jìn)預(yù)測(cè)。何代毅[7]等人就提出了一種基于改進(jìn) Mask-RCNN[8]的建筑物自動(dòng)提取方法,在網(wǎng)絡(luò)的設(shè)計(jì)中添加了路徑聚合網(wǎng)絡(luò)和特征增強(qiáng)功能,通過監(jiān)督和遷移學(xué)習(xí)的方式在Inria航空影像標(biāo)簽數(shù)據(jù)集中進(jìn)行多線程迭代訓(xùn)練與模型優(yōu)化學(xué)習(xí),實(shí)現(xiàn)了建筑物的自動(dòng)精確分割和提取。對(duì)于數(shù)據(jù)集缺乏等問題,林通[9]等人通過遷移姿態(tài)生成對(duì)抗網(wǎng)絡(luò)生成姿態(tài)不同的行人圖片,對(duì)數(shù)據(jù)集進(jìn)行了擴(kuò)充。


本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003422




作者信息:

余慧明,周志祥,彭  楊,崔志斌

(武漢興圖新科電子股份有限公司 平臺(tái)產(chǎn)品部,湖北 武漢430073)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。