中文引用格式: 付為剛,彭奕舜. 基于YOLOv11改進(jìn)算法的金屬缺陷識(shí)別檢測(cè)[J]. 電子技術(shù)應(yīng)用,2026,52(3):32-40.
英文引用格式: Fu Weigang,Peng Yishun. Metal defect recognition and detection based on improved YOLOv11 algorithm[J]. Application of Electronic Technique,2026,52(3):32-40.
引言
目標(biāo)檢測(cè)作為連接圖像感知與高層決策的核心橋梁,其性能優(yōu)劣直接決定了智能制造、自動(dòng)駕駛等關(guān)鍵領(lǐng)域的智能化水平。在工業(yè)質(zhì)檢場(chǎng)景中,金屬表面缺陷(如微米級(jí)裂紋、不規(guī)則夾雜)的精準(zhǔn)檢測(cè)更是保障高端裝備可靠性的核心環(huán)節(jié)[1-2]。據(jù)中國(guó)機(jī)械工程學(xué)會(huì)2024年報(bào)告顯示,我國(guó)每年因金屬表面缺陷導(dǎo)致的報(bào)廢率達(dá)3%~5%,對(duì)應(yīng)經(jīng)濟(jì)損失超500億元[3],而傳統(tǒng)人工檢測(cè)(效率20~30件/小時(shí),漏檢率隨時(shí)長(zhǎng)指數(shù)上升)與傳統(tǒng)機(jī)器視覺(jué)(復(fù)雜工況誤檢率超20%)已難以滿足工業(yè)4.0的“零缺陷”需求。在此背景下,基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)檢測(cè)技術(shù)成為突破瓶頸的關(guān)鍵,其中YOLO系列算法[4]憑借“端到端”架構(gòu)與高效推理特性,成為工業(yè)級(jí)部署的主流選擇,但在微小缺陷捕捉、復(fù)雜紋理抗干擾、精度和速度的平衡仍需優(yōu)化[5]。
在相關(guān)工作與技術(shù)瓶頸上,目標(biāo)檢測(cè)算法的演進(jìn)始終圍繞“特征表征能力”與“定位精度”兩大核心展開(kāi)。在單階段檢測(cè)器領(lǐng)域,YOLOv1開(kāi)創(chuàng)實(shí)時(shí)檢測(cè)范式但定位誤差大;YOLOv3[6]通過(guò)多尺度特征融合提升小目標(biāo)性能,卻依賴人工設(shè)計(jì)錨框?qū)е路夯允芟?;YOLOv5[7]的自適應(yīng)錨框與CSP結(jié)構(gòu)優(yōu)化了效率,但其特征提取對(duì)復(fù)雜背景魯棒性不足;YOLOv7[8]的ELAN結(jié)構(gòu)增強(qiáng)了特征學(xué)習(xí)能力,卻仍難以捕捉微米級(jí)缺陷的細(xì)微特征;最新的YOLOv11[9]通過(guò)C3k2模塊與動(dòng)態(tài)通道剪枝實(shí)現(xiàn)輕量化,但其在局部上下文關(guān)聯(lián)建模與極端比例目標(biāo)回歸上仍有提升空間。
金屬缺陷檢測(cè)作為高端制造領(lǐng)域質(zhì)量控制的核心環(huán)節(jié),其技術(shù)發(fā)展始終與工業(yè)現(xiàn)代化進(jìn)程深度耦合。國(guó)內(nèi)外研究在技術(shù)演進(jìn)中形成了既同源共生又各具特色的發(fā)展路徑。早期研究普遍依賴傳統(tǒng)圖像處理方法,國(guó)外學(xué)者通過(guò)閾值分割與形態(tài)學(xué)處理實(shí)現(xiàn)規(guī)則缺陷的初步識(shí)別[10],國(guó)內(nèi)研究者則在邊緣梯度分析領(lǐng)域進(jìn)行優(yōu)化,如基于Sobel算子的裂紋增強(qiáng)算法[11],但這類方法對(duì)低對(duì)比度缺陷和復(fù)雜背景的適應(yīng)性有限。隨著硬件設(shè)施與人工智能技術(shù)的發(fā)展,基于計(jì)算機(jī)視覺(jué)的檢測(cè)方法逐漸成為主流,其成本低、操作簡(jiǎn)便的優(yōu)勢(shì)使其在鋼、鋁、銅板等平面材料檢測(cè)中廣泛應(yīng)用。國(guó)內(nèi)研究呈現(xiàn)出鮮明的應(yīng)用導(dǎo)向特征,在數(shù)據(jù)增強(qiáng)與模型輕量化領(lǐng)域形成獨(dú)特優(yōu)勢(shì)。WANG K等人[12]針對(duì)工業(yè)領(lǐng)域金屬表面缺陷檢測(cè)中現(xiàn)有算法僅面向少數(shù)缺陷類型且不同尺度(尤其小尺度)缺陷表現(xiàn)欠佳的問(wèn)題,設(shè)計(jì)改進(jìn)YOLOv5檢測(cè)網(wǎng)絡(luò),有效損失函數(shù)解決小尺度缺陷引發(fā)的數(shù)據(jù)不平衡。張曙文等人[13]針對(duì)工業(yè)干擾環(huán)境下金屬齒輪表面缺陷自動(dòng)化檢測(cè)易出現(xiàn)誤檢和漏檢的問(wèn)題,提出改進(jìn)YOLOx算法,通過(guò)ASFF提高抗干擾能力,借助ECA模塊增強(qiáng)特征提取能力。改進(jìn)后網(wǎng)絡(luò)較原版在召回率、準(zhǔn)確率和平均精度均值均有所提升。竇智等人[14]針對(duì)鋼板制造行業(yè)傷痕類型多、次品少、檢測(cè)要求高導(dǎo)致傳統(tǒng)算法不滿足需求,且行業(yè)數(shù)據(jù)公開(kāi)率低、訓(xùn)練樣本不足使深度學(xué)習(xí)難應(yīng)用的問(wèn)題,提出小樣本驅(qū)動(dòng)的訓(xùn)練樣本生成方法及改進(jìn)YOLOv7算法,優(yōu)化ELAN模塊,采用ACmix注意力模塊,引入WIoU優(yōu)化損失函數(shù),成功應(yīng)用于小樣本鋼板缺陷檢測(cè)。但這兩種方法均未充分驗(yàn)證在金屬表面灰度不均、微小形變和缺陷等復(fù)雜工業(yè)場(chǎng)景,適用性仍需進(jìn)一步驗(yàn)證。
因此,當(dāng)前領(lǐng)域仍面臨三重核心挑戰(zhàn):金屬表面高反射率導(dǎo)致的灰度不均問(wèn)題,高速生產(chǎn)線5.12 Gb/s峰值數(shù)據(jù)率帶來(lái)的實(shí)時(shí)處理壓力,以及微小缺陷與隨機(jī)彈性變形造成的特征混淆。針對(duì)上述瓶頸,本文以YOLOv11為基線,聚焦金屬表面缺陷檢測(cè)的核心需求,提出三項(xiàng)協(xié)同優(yōu)化策略,其創(chuàng)新點(diǎn)與先進(jìn)性具體體現(xiàn)為:
(1)針對(duì)傳統(tǒng)C3k2模塊局部上下文建模不足的問(wèn)題,在殘差路徑中嵌入多尺度局部上下文注意力(MLCA),通過(guò)3×3/5×5并行卷積捕捉不同感受野特征,并結(jié)合通道注意力動(dòng)態(tài)加權(quán),既保留SE模塊的通道級(jí)特征篩選能力,又彌補(bǔ)其缺乏空間關(guān)聯(lián)建模的缺陷。相比Deformable DETR[15]的可變形注意力,MLCA將計(jì)算復(fù)雜度從O(N2)降至O(N),實(shí)現(xiàn)65 FPS的推理速度。
(2)EIoU損失函數(shù)適配:針對(duì)CIoU[16]對(duì)寬高差異約束薄弱的問(wèn)題,引入EIoU損失[17],在CIoU的基礎(chǔ)上分離寬高懲罰項(xiàng),通過(guò)計(jì)算預(yù)測(cè)框與真實(shí)框的寬、高差異平方和,顯式約束極端比例缺陷的回歸精度。實(shí)驗(yàn)表明,EIoU在長(zhǎng)寬比大于5:1的缺陷上定位誤差降低42%,在金屬缺陷檢測(cè)模型上優(yōu)于常用的損失函數(shù)SIoU[18]與ShapeIoU[19]。
(3)Detect_LADH輕量檢測(cè)頭:針對(duì)傳統(tǒng)檢測(cè)頭特征融合冗余的問(wèn)題,采用深度可分離卷積替代普通卷積,并設(shè)計(jì)動(dòng)態(tài)權(quán)重生成器(基于缺陷尺度自適應(yīng)分配P3/P4/P5特征權(quán)重)。相比PAN結(jié)構(gòu),其 FLOPs減少35%,推理速度提升至72 FPS,同時(shí)通過(guò)跨層特征動(dòng)態(tài)融合,將復(fù)雜紋理下的誤檢率從25%降至8.3%,優(yōu)于YOLO-World的靜態(tài)融合策略(誤檢率12.6%)。
在本文研究貢獻(xiàn)與結(jié)構(gòu)安排上,核心價(jià)值在于為單階段檢測(cè)器在高精度實(shí)時(shí)工業(yè)場(chǎng)景中的應(yīng)用提供了可推廣的技術(shù)范式。實(shí)驗(yàn)驗(yàn)證表明在自建數(shù)據(jù)集上,改進(jìn)模型較YOLOv11基線mAP@0.5提升8.9%,推理時(shí)間為1.4 ms。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006998
作者信息:
付為剛,彭奕舜
(中國(guó)民用航空飛行學(xué)院 航空工程學(xué)院, 四川 廣漢 618307)

