中文引用格式: 付為剛,彭奕舜. 基于YOLOv11改進算法的金屬缺陷識別檢測[J]. 電子技術(shù)應用,2026,52(3):32-40.
英文引用格式: Fu Weigang,Peng Yishun. Metal defect recognition and detection based on improved YOLOv11 algorithm[J]. Application of Electronic Technique,2026,52(3):32-40.
引言
目標檢測作為連接圖像感知與高層決策的核心橋梁,其性能優(yōu)劣直接決定了智能制造、自動駕駛等關鍵領域的智能化水平。在工業(yè)質(zhì)檢場景中,金屬表面缺陷(如微米級裂紋、不規(guī)則夾雜)的精準檢測更是保障高端裝備可靠性的核心環(huán)節(jié)[1-2]。據(jù)中國機械工程學會2024年報告顯示,我國每年因金屬表面缺陷導致的報廢率達3%~5%,對應經(jīng)濟損失超500億元[3],而傳統(tǒng)人工檢測(效率20~30件/小時,漏檢率隨時長指數(shù)上升)與傳統(tǒng)機器視覺(復雜工況誤檢率超20%)已難以滿足工業(yè)4.0的“零缺陷”需求。在此背景下,基于深度學習的實時目標檢測技術(shù)成為突破瓶頸的關鍵,其中YOLO系列算法[4]憑借“端到端”架構(gòu)與高效推理特性,成為工業(yè)級部署的主流選擇,但在微小缺陷捕捉、復雜紋理抗干擾、精度和速度的平衡仍需優(yōu)化[5]。
在相關工作與技術(shù)瓶頸上,目標檢測算法的演進始終圍繞“特征表征能力”與“定位精度”兩大核心展開。在單階段檢測器領域,YOLOv1開創(chuàng)實時檢測范式但定位誤差大;YOLOv3[6]通過多尺度特征融合提升小目標性能,卻依賴人工設計錨框?qū)е路夯允芟?;YOLOv5[7]的自適應錨框與CSP結(jié)構(gòu)優(yōu)化了效率,但其特征提取對復雜背景魯棒性不足;YOLOv7[8]的ELAN結(jié)構(gòu)增強了特征學習能力,卻仍難以捕捉微米級缺陷的細微特征;最新的YOLOv11[9]通過C3k2模塊與動態(tài)通道剪枝實現(xiàn)輕量化,但其在局部上下文關聯(lián)建模與極端比例目標回歸上仍有提升空間。
金屬缺陷檢測作為高端制造領域質(zhì)量控制的核心環(huán)節(jié),其技術(shù)發(fā)展始終與工業(yè)現(xiàn)代化進程深度耦合。國內(nèi)外研究在技術(shù)演進中形成了既同源共生又各具特色的發(fā)展路徑。早期研究普遍依賴傳統(tǒng)圖像處理方法,國外學者通過閾值分割與形態(tài)學處理實現(xiàn)規(guī)則缺陷的初步識別[10],國內(nèi)研究者則在邊緣梯度分析領域進行優(yōu)化,如基于Sobel算子的裂紋增強算法[11],但這類方法對低對比度缺陷和復雜背景的適應性有限。隨著硬件設施與人工智能技術(shù)的發(fā)展,基于計算機視覺的檢測方法逐漸成為主流,其成本低、操作簡便的優(yōu)勢使其在鋼、鋁、銅板等平面材料檢測中廣泛應用。國內(nèi)研究呈現(xiàn)出鮮明的應用導向特征,在數(shù)據(jù)增強與模型輕量化領域形成獨特優(yōu)勢。WANG K等人[12]針對工業(yè)領域金屬表面缺陷檢測中現(xiàn)有算法僅面向少數(shù)缺陷類型且不同尺度(尤其小尺度)缺陷表現(xiàn)欠佳的問題,設計改進YOLOv5檢測網(wǎng)絡,有效損失函數(shù)解決小尺度缺陷引發(fā)的數(shù)據(jù)不平衡。張曙文等人[13]針對工業(yè)干擾環(huán)境下金屬齒輪表面缺陷自動化檢測易出現(xiàn)誤檢和漏檢的問題,提出改進YOLOx算法,通過ASFF提高抗干擾能力,借助ECA模塊增強特征提取能力。改進后網(wǎng)絡較原版在召回率、準確率和平均精度均值均有所提升。竇智等人[14]針對鋼板制造行業(yè)傷痕類型多、次品少、檢測要求高導致傳統(tǒng)算法不滿足需求,且行業(yè)數(shù)據(jù)公開率低、訓練樣本不足使深度學習難應用的問題,提出小樣本驅(qū)動的訓練樣本生成方法及改進YOLOv7算法,優(yōu)化ELAN模塊,采用ACmix注意力模塊,引入WIoU優(yōu)化損失函數(shù),成功應用于小樣本鋼板缺陷檢測。但這兩種方法均未充分驗證在金屬表面灰度不均、微小形變和缺陷等復雜工業(yè)場景,適用性仍需進一步驗證。
因此,當前領域仍面臨三重核心挑戰(zhàn):金屬表面高反射率導致的灰度不均問題,高速生產(chǎn)線5.12 Gb/s峰值數(shù)據(jù)率帶來的實時處理壓力,以及微小缺陷與隨機彈性變形造成的特征混淆。針對上述瓶頸,本文以YOLOv11為基線,聚焦金屬表面缺陷檢測的核心需求,提出三項協(xié)同優(yōu)化策略,其創(chuàng)新點與先進性具體體現(xiàn)為:
(1)針對傳統(tǒng)C3k2模塊局部上下文建模不足的問題,在殘差路徑中嵌入多尺度局部上下文注意力(MLCA),通過3×3/5×5并行卷積捕捉不同感受野特征,并結(jié)合通道注意力動態(tài)加權(quán),既保留SE模塊的通道級特征篩選能力,又彌補其缺乏空間關聯(lián)建模的缺陷。相比Deformable DETR[15]的可變形注意力,MLCA將計算復雜度從O(N2)降至O(N),實現(xiàn)65 FPS的推理速度。
(2)EIoU損失函數(shù)適配:針對CIoU[16]對寬高差異約束薄弱的問題,引入EIoU損失[17],在CIoU的基礎上分離寬高懲罰項,通過計算預測框與真實框的寬、高差異平方和,顯式約束極端比例缺陷的回歸精度。實驗表明,EIoU在長寬比大于5:1的缺陷上定位誤差降低42%,在金屬缺陷檢測模型上優(yōu)于常用的損失函數(shù)SIoU[18]與ShapeIoU[19]。
(3)Detect_LADH輕量檢測頭:針對傳統(tǒng)檢測頭特征融合冗余的問題,采用深度可分離卷積替代普通卷積,并設計動態(tài)權(quán)重生成器(基于缺陷尺度自適應分配P3/P4/P5特征權(quán)重)。相比PAN結(jié)構(gòu),其 FLOPs減少35%,推理速度提升至72 FPS,同時通過跨層特征動態(tài)融合,將復雜紋理下的誤檢率從25%降至8.3%,優(yōu)于YOLO-World的靜態(tài)融合策略(誤檢率12.6%)。
在本文研究貢獻與結(jié)構(gòu)安排上,核心價值在于為單階段檢測器在高精度實時工業(yè)場景中的應用提供了可推廣的技術(shù)范式。實驗驗證表明在自建數(shù)據(jù)集上,改進模型較YOLOv11基線mAP@0.5提升8.9%,推理時間為1.4 ms。
本文詳細內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006998
作者信息:
付為剛,彭奕舜
(中國民用航空飛行學院 航空工程學院, 四川 廣漢 618307)

