123,123,123

基于YOLOv11改进算法的金属缺陷识别检测

电子技术应用

付为刚，彭奕舜

中国民用航空飞行学院航空工程学院

摘要： 在工业自动化生产中，金属表面缺陷检测面临小目标漏检、定位精度不足等挑战。为此，对YOLOv11模型实施三方面优化。首先，构建C3k2_MLCA模块融合多尺度局部上下文注意力机制，增强网络对细微特征的捕捉。其次，将损失函数由CIoU改进为EIoU，显式约束目标框宽高差异以提升回归精度。最后，设计Detect_LADH 检测头，通过轻量级自适应特征聚合结构优化多尺度缺陷识别。在自建数据集上实验表明，改进模型的mAP@0.5较原始模型提升8.9%，每张图片的推理时间降低至1.4 ms，为工业缺陷检测提供了高精度、高鲁棒性的技术方案。

關(guān)鍵詞： 目标检测 YOLOv11 金属缺陷注意力机制深度学习

中圖分類號：TP391.4 文獻標志碼：A DOI: 10.16157/j.issn.0258-7998.257225
中文引用格式： 付為剛，彭奕舜. 基于YOLOv11改進算法的金屬缺陷識別檢測[J]. 電子技術(shù)應(yīng)用，2026，52(3)：32-40.
英文引用格式： Fu Weigang，Peng Yishun. Metal defect recognition and detection based on improved YOLOv11 algorithm[J]. Application of Electronic Technique，2026，52(3)：32-40.

Metal defect recognition and detection based on improved YOLOv11 algorithm

Fu Weigang，Peng Yishun

College of Aeronautical Engineering，Civil Aviation Flight University of China

Abstract： In industrial automated production, metal surface defect detection faces challenges such as small target missed detection and insufficient positioning accuracy. To address these challenges, this paper proposes three optimizations for the YOLOv11 model. Firstly, a C3k2_MLCA module is constructed, which integrates a multi-scale local contextual attention mechanism to enhance the network's ability to capture subtle features. Secondly, the loss function is improved from CIoU to EIoU, which explicitly constrains the width-height differences of bounding boxes to improve regression accuracy. Finally, a Detect_LADH detection head is designed, which optimizes multi-scale defect recognition through a lightweight adaptive feature aggregation structure. Experiments on the self-constructed dataset show that the mAP@0.5 of the improved model is 8.9% higher than that of the original model, with the inference time remaining at 1.4 ms per picture. It provides a high-precision and high-robustness technical solution for industrial defect detection.

Key words : object detection；YOLOv11；metal surface defects；attention mechanism；deep learning；detection head improvement

引言

目標檢測作為連接圖像感知與高層決策的核心橋梁，其性能優(yōu)劣直接決定了智能制造、自動駕駛等關(guān)鍵領(lǐng)域的智能化水平。在工業(yè)質(zhì)檢場景中，金屬表面缺陷（如微米級裂紋、不規(guī)則夾雜）的精準檢測更是保障高端裝備可靠性的核心環(huán)節(jié)[1-2]。據(jù)中國機械工程學會2024年報告顯示，我國每年因金屬表面缺陷導致的報廢率達3%~5%，對應(yīng)經(jīng)濟損失超500億元[3]，而傳統(tǒng)人工檢測（效率20~30件/小時，漏檢率隨時長指數(shù)上升）與傳統(tǒng)機器視覺（復雜工況誤檢率超20%）已難以滿足工業(yè)4.0的“零缺陷”需求。在此背景下，基于深度學習的實時目標檢測技術(shù)成為突破瓶頸的關(guān)鍵，其中YOLO系列算法[4]憑借“端到端”架構(gòu)與高效推理特性，成為工業(yè)級部署的主流選擇，但在微小缺陷捕捉、復雜紋理抗干擾、精度和速度的平衡仍需優(yōu)化[5]。

在相關(guān)工作與技術(shù)瓶頸上，目標檢測算法的演進始終圍繞“特征表征能力”與“定位精度”兩大核心展開。在單階段檢測器領(lǐng)域，YOLOv1開創(chuàng)實時檢測范式但定位誤差大；YOLOv3[6]通過多尺度特征融合提升小目標性能，卻依賴人工設(shè)計錨框?qū)е路夯允芟?；YOLOv5[7]的自適應(yīng)錨框與CSP結(jié)構(gòu)優(yōu)化了效率，但其特征提取對復雜背景魯棒性不足；YOLOv7[8]的ELAN結(jié)構(gòu)增強了特征學習能力，卻仍難以捕捉微米級缺陷的細微特征；最新的YOLOv11[9]通過C3k2模塊與動態(tài)通道剪枝實現(xiàn)輕量化，但其在局部上下文關(guān)聯(lián)建模與極端比例目標回歸上仍有提升空間。

金屬缺陷檢測作為高端制造領(lǐng)域質(zhì)量控制的核心環(huán)節(jié)，其技術(shù)發(fā)展始終與工業(yè)現(xiàn)代化進程深度耦合。國內(nèi)外研究在技術(shù)演進中形成了既同源共生又各具特色的發(fā)展路徑。早期研究普遍依賴傳統(tǒng)圖像處理方法，國外學者通過閾值分割與形態(tài)學處理實現(xiàn)規(guī)則缺陷的初步識別[10]，國內(nèi)研究者則在邊緣梯度分析領(lǐng)域進行優(yōu)化，如基于Sobel算子的裂紋增強算法[11]，但這類方法對低對比度缺陷和復雜背景的適應(yīng)性有限。隨著硬件設(shè)施與人工智能技術(shù)的發(fā)展，基于計算機視覺的檢測方法逐漸成為主流，其成本低、操作簡便的優(yōu)勢使其在鋼、鋁、銅板等平面材料檢測中廣泛應(yīng)用。國內(nèi)研究呈現(xiàn)出鮮明的應(yīng)用導向特征，在數(shù)據(jù)增強與模型輕量化領(lǐng)域形成獨特優(yōu)勢。WANG K等人[12]針對工業(yè)領(lǐng)域金屬表面缺陷檢測中現(xiàn)有算法僅面向少數(shù)缺陷類型且不同尺度（尤其小尺度）缺陷表現(xiàn)欠佳的問題，設(shè)計改進YOLOv5檢測網(wǎng)絡(luò)，有效損失函數(shù)解決小尺度缺陷引發(fā)的數(shù)據(jù)不平衡。張曙文等人[13]針對工業(yè)干擾環(huán)境下金屬齒輪表面缺陷自動化檢測易出現(xiàn)誤檢和漏檢的問題，提出改進YOLOx算法，通過ASFF提高抗干擾能力，借助ECA模塊增強特征提取能力。改進后網(wǎng)絡(luò)較原版在召回率、準確率和平均精度均值均有所提升。竇智等人[14]針對鋼板制造行業(yè)傷痕類型多、次品少、檢測要求高導致傳統(tǒng)算法不滿足需求，且行業(yè)數(shù)據(jù)公開率低、訓練樣本不足使深度學習難應(yīng)用的問題，提出小樣本驅(qū)動的訓練樣本生成方法及改進YOLOv7算法，優(yōu)化ELAN模塊，采用ACmix注意力模塊，引入WIoU優(yōu)化損失函數(shù)，成功應(yīng)用于小樣本鋼板缺陷檢測。但這兩種方法均未充分驗證在金屬表面灰度不均、微小形變和缺陷等復雜工業(yè)場景，適用性仍需進一步驗證。

因此，當前領(lǐng)域仍面臨三重核心挑戰(zhàn)：金屬表面高反射率導致的灰度不均問題，高速生產(chǎn)線5.12 Gb/s峰值數(shù)據(jù)率帶來的實時處理壓力，以及微小缺陷與隨機彈性變形造成的特征混淆。針對上述瓶頸，本文以YOLOv11為基線，聚焦金屬表面缺陷檢測的核心需求，提出三項協(xié)同優(yōu)化策略，其創(chuàng)新點與先進性具體體現(xiàn)為：

（1）針對傳統(tǒng)C3k2模塊局部上下文建模不足的問題，在殘差路徑中嵌入多尺度局部上下文注意力（MLCA），通過3×3/5×5并行卷積捕捉不同感受野特征，并結(jié)合通道注意力動態(tài)加權(quán)，既保留SE模塊的通道級特征篩選能力，又彌補其缺乏空間關(guān)聯(lián)建模的缺陷。相比Deformable DETR[15]的可變形注意力，MLCA將計算復雜度從O(N2)降至O(N)，實現(xiàn)65 FPS的推理速度。

（2）EIoU損失函數(shù)適配：針對CIoU[16]對寬高差異約束薄弱的問題，引入EIoU損失[17]，在CIoU的基礎(chǔ)上分離寬高懲罰項，通過計算預測框與真實框的寬、高差異平方和，顯式約束極端比例缺陷的回歸精度。實驗表明，EIoU在長寬比大于5:1的缺陷上定位誤差降低42%，在金屬缺陷檢測模型上優(yōu)于常用的損失函數(shù)SIoU[18]與ShapeIoU[19]。

（3）Detect_LADH輕量檢測頭：針對傳統(tǒng)檢測頭特征融合冗余的問題，采用深度可分離卷積替代普通卷積，并設(shè)計動態(tài)權(quán)重生成器（基于缺陷尺度自適應(yīng)分配P3/P4/P5特征權(quán)重）。相比PAN結(jié)構(gòu)，其 FLOPs減少35%，推理速度提升至72 FPS，同時通過跨層特征動態(tài)融合，將復雜紋理下的誤檢率從25%降至8.3%，優(yōu)于YOLO-World的靜態(tài)融合策略（誤檢率12.6%）。

在本文研究貢獻與結(jié)構(gòu)安排上，核心價值在于為單階段檢測器在高精度實時工業(yè)場景中的應(yīng)用提供了可推廣的技術(shù)范式。實驗驗證表明在自建數(shù)據(jù)集上，改進模型較YOLOv11基線mAP@0.5提升8.9%，推理時間為1.4 ms。

本文詳細內(nèi)容請下載：

http://ihrv.cn/resource/share/2000006998

作者信息：

付為剛，彭奕舜

（中國民用航空飛行學院航空工程學院，四川廣漢 618307）

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容