中文引用格式: 何兆蓉,郭健,徐琦,等. 基于改進(jìn)Mask R-CNN的非結(jié)構(gòu)環(huán)境小目標(biāo)語義分割算法[J]. 電子技術(shù)應(yīng)用,2024,50(10):76-81.
英文引用格式: He Zhaorong,Guo Jian,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,2024,50(10):76-81.
引言
隨著計算機技術(shù)的持續(xù)進(jìn)步,傳統(tǒng)的語義分割算法對于大規(guī)模的對象檢測網(wǎng)絡(luò)模型具有很高的識別精度,但是,這些算法在識別小目標(biāo)對象時面臨著不少的挑戰(zhàn),如存在錯誤識別或者由于候選框之間相互重疊而無法識別的相關(guān)問題。在非結(jié)構(gòu)環(huán)境中,處理零部件的數(shù)據(jù)存在許多挑戰(zhàn),如缺陷樣本的數(shù)量較少、狀態(tài)特征存在顯著差異、特征粒度差異性較小等。傳統(tǒng)的語義分割方法檢測的性能比較容易受到環(huán)境因素的影響,如照明強度、場景遮擋等,從而導(dǎo)致檢測的準(zhǔn)確性較低、適應(yīng)能力較弱。深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)具有許多優(yōu)勢,包括強大的泛化能力、高檢測準(zhǔn)確性以及對環(huán)境照明變化的抵抗力強等,因此,深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入整合到小目標(biāo)零件的檢測中。
在復(fù)雜環(huán)境下針對小目標(biāo)的語義分割研究中,魏永超等[1]提出了一種基于Mask R-CNN 算法的改進(jìn)算法,以解決對缺陷類型的有限和對非結(jié)構(gòu)化環(huán)境中對小目標(biāo)缺陷的語義分割效果差強人意的問題。通過添加SENet模塊并改善NMS算法,使新模型的準(zhǔn)確性得到了顯著提高。文韜[2]解決了傳統(tǒng)Mask R-CNN中小目標(biāo)對象的低識別率的問題,并使用GFPN作為Mask R-CNN模型的功能采集。該模型通過融合從GFPN獲得的特征來設(shè)置各種特征的權(quán)重。茍軍年等[3]解決了復(fù)雜背景、小像素目標(biāo)以及Mask R-CNN模型對于傳輸電路中絕緣子缺陷檢測不充分的問題。將卷積注意力模塊(Convolutional Block Attention Module, CBAM)引入特征提取網(wǎng)絡(luò)中,以達(dá)到從空間和通道角度提高小目標(biāo)的特征保留。
本文以空間衛(wèi)星作為非結(jié)構(gòu)環(huán)境的實驗場景,以衛(wèi)星帆板展開機構(gòu)的爆炸螺栓作為待檢測的小目標(biāo)物體。衛(wèi)星帆板展開異常是空間衛(wèi)星故障中最常見的形式之一,造成這種故障的原因主要是爆炸螺栓未完全。此時解決故障的方式一般是通過識別未完全爆炸或未爆炸的螺栓進(jìn)行補充剪切操作。針對衛(wèi)星帆板的維修任務(wù),首先需要檢測并識別出空間衛(wèi)星中的一些目標(biāo)物體,如衛(wèi)星帆板的反光板面以及未完全爆炸的螺栓等。
針對小目標(biāo)零件的語義分割研究,程敦誠等[4]使用U-net8將螺母、螺桿和其他信息標(biāo)記成為不同顏色,并對其圖片進(jìn)行語義分割,以檢測螺栓是否處于正常的狀態(tài)。羅隆福等[5]提出一種基于深度學(xué)習(xí)的螺栓裂紋檢測方法,該方法使用DeepLab v3 plus 算法在螺栓上執(zhí)行語義分割。李紅衛(wèi)等[6]利用深度學(xué)習(xí)框架Mask R-CNN[7]智能分析了通過機械臂視覺傳感器獲得的視覺信息,并根據(jù)RGB圖像數(shù)據(jù)實現(xiàn)了小目標(biāo)零部件的語義分割。
本文在上述研究的基礎(chǔ)上,結(jié)合衛(wèi)星帆板中爆炸螺栓的結(jié)構(gòu)特征,提出了一種基于注意力機制的Mask R-CNN語義分割優(yōu)化算法,在改進(jìn)模型中完成對爆炸螺栓的語義分割,并與原Mask R-CNN的網(wǎng)絡(luò)模型進(jìn)行性能對比,改進(jìn)后模型優(yōu)勢顯著。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006182
作者信息:
何兆蓉,郭健,徐琦,韓銳
(南京理工大學(xué) 自動化學(xué)院,江蘇 南京 210094)