中文引用格式: 何兆蓉,郭健,徐琦,等. 基于改進Mask R-CNN的非結構環(huán)境小目標語義分割算法[J]. 電子技術應用,2024,50(10):76-81.
英文引用格式: He Zhaorong,Guo Jian,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,2024,50(10):76-81.
引言
隨著計算機技術的持續(xù)進步,傳統(tǒng)的語義分割算法對于大規(guī)模的對象檢測網(wǎng)絡模型具有很高的識別精度,但是,這些算法在識別小目標對象時面臨著不少的挑戰(zhàn),如存在錯誤識別或者由于候選框之間相互重疊而無法識別的相關問題。在非結構環(huán)境中,處理零部件的數(shù)據(jù)存在許多挑戰(zhàn),如缺陷樣本的數(shù)量較少、狀態(tài)特征存在顯著差異、特征粒度差異性較小等。傳統(tǒng)的語義分割方法檢測的性能比較容易受到環(huán)境因素的影響,如照明強度、場景遮擋等,從而導致檢測的準確性較低、適應能力較弱。深度學習卷積神經(jīng)網(wǎng)絡具有許多優(yōu)勢,包括強大的泛化能力、高檢測準確性以及對環(huán)境照明變化的抵抗力強等,因此,深度學習卷積神經(jīng)網(wǎng)絡已經(jīng)被引入整合到小目標零件的檢測中。
在復雜環(huán)境下針對小目標的語義分割研究中,魏永超等[1]提出了一種基于Mask R-CNN 算法的改進算法,以解決對缺陷類型的有限和對非結構化環(huán)境中對小目標缺陷的語義分割效果差強人意的問題。通過添加SENet模塊并改善NMS算法,使新模型的準確性得到了顯著提高。文韜[2]解決了傳統(tǒng)Mask R-CNN中小目標對象的低識別率的問題,并使用GFPN作為Mask R-CNN模型的功能采集。該模型通過融合從GFPN獲得的特征來設置各種特征的權重。茍軍年等[3]解決了復雜背景、小像素目標以及Mask R-CNN模型對于傳輸電路中絕緣子缺陷檢測不充分的問題。將卷積注意力模塊(Convolutional Block Attention Module, CBAM)引入特征提取網(wǎng)絡中,以達到從空間和通道角度提高小目標的特征保留。
本文以空間衛(wèi)星作為非結構環(huán)境的實驗場景,以衛(wèi)星帆板展開機構的爆炸螺栓作為待檢測的小目標物體。衛(wèi)星帆板展開異常是空間衛(wèi)星故障中最常見的形式之一,造成這種故障的原因主要是爆炸螺栓未完全。此時解決故障的方式一般是通過識別未完全爆炸或未爆炸的螺栓進行補充剪切操作。針對衛(wèi)星帆板的維修任務,首先需要檢測并識別出空間衛(wèi)星中的一些目標物體,如衛(wèi)星帆板的反光板面以及未完全爆炸的螺栓等。
針對小目標零件的語義分割研究,程敦誠等[4]使用U-net8將螺母、螺桿和其他信息標記成為不同顏色,并對其圖片進行語義分割,以檢測螺栓是否處于正常的狀態(tài)。羅隆福等[5]提出一種基于深度學習的螺栓裂紋檢測方法,該方法使用DeepLab v3 plus 算法在螺栓上執(zhí)行語義分割。李紅衛(wèi)等[6]利用深度學習框架Mask R-CNN[7]智能分析了通過機械臂視覺傳感器獲得的視覺信息,并根據(jù)RGB圖像數(shù)據(jù)實現(xiàn)了小目標零部件的語義分割。
本文在上述研究的基礎上,結合衛(wèi)星帆板中爆炸螺栓的結構特征,提出了一種基于注意力機制的Mask R-CNN語義分割優(yōu)化算法,在改進模型中完成對爆炸螺栓的語義分割,并與原Mask R-CNN的網(wǎng)絡模型進行性能對比,改進后模型優(yōu)勢顯著。
本文詳細內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006182
作者信息:
何兆蓉,郭健,徐琦,韓銳
(南京理工大學 自動化學院,江蘇 南京 210094)