《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 设计应用 > 基于YOLOv11改进算法的金属缺陷识别检测
基于YOLOv11改进算法的金属缺陷识别检测
电子技术应用
付为刚,彭奕舜
中国民用航空飞行学院 航空工程学院
摘要: 在工业自动化生产中,金属表面缺陷检测面临小目标漏检、定位精度不足等挑战。为此,对YOLOv11模型实施三方面优化。首先,构建C3k2_MLCA模块融合多尺度局部上下文注意力机制,增强网络对细微特征的捕捉。其次,将损失函数由CIoU改进为EIoU,显式约束目标框宽高差异以提升回归精度。最后,设计Detect_LADH 检测头,通过轻量级自适应特征聚合结构优化多尺度缺陷识别。在自建数据集上实验表明,改进模型的mAP@0.5较原始模型提升8.9%,每张图片的推理时间降低至1.4 ms,为工业缺陷检测提供了高精度、高鲁棒性的技术方案。
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.257225
中文引用格式: 付為剛,彭奕舜. 基于YOLOv11改進(jìn)算法的金屬缺陷識(shí)別檢測(cè)[J]. 電子技術(shù)應(yīng)用,2026,52(3):32-40.
英文引用格式: Fu Weigang,Peng Yishun. Metal defect recognition and detection based on improved YOLOv11 algorithm[J]. Application of Electronic Technique,2026,52(3):32-40.
Metal defect recognition and detection based on improved YOLOv11 algorithm
Fu Weigang,Peng Yishun
College of Aeronautical Engineering,Civil Aviation Flight University of China
Abstract: In industrial automated production, metal surface defect detection faces challenges such as small target missed detection and insufficient positioning accuracy. To address these challenges, this paper proposes three optimizations for the YOLOv11 model. Firstly, a C3k2_MLCA module is constructed, which integrates a multi-scale local contextual attention mechanism to enhance the network's ability to capture subtle features. Secondly, the loss function is improved from CIoU to EIoU, which explicitly constrains the width-height differences of bounding boxes to improve regression accuracy. Finally, a Detect_LADH detection head is designed, which optimizes multi-scale defect recognition through a lightweight adaptive feature aggregation structure. Experiments on the self-constructed dataset show that the mAP@0.5 of the improved model is 8.9% higher than that of the original model, with the inference time remaining at 1.4 ms per picture. It provides a high-precision and high-robustness technical solution for industrial defect detection.
Key words : object detection;YOLOv11;metal surface defects;attention mechanism;deep learning;detection head improvement

引言

目標(biāo)檢測(cè)作為連接圖像感知與高層決策的核心橋梁,其性能優(yōu)劣直接決定了智能制造、自動(dòng)駕駛等關(guān)鍵領(lǐng)域的智能化水平。在工業(yè)質(zhì)檢場(chǎng)景中,金屬表面缺陷(如微米級(jí)裂紋、不規(guī)則夾雜)的精準(zhǔn)檢測(cè)更是保障高端裝備可靠性的核心環(huán)節(jié)[1-2]。據(jù)中國(guó)機(jī)械工程學(xué)會(huì)2024年報(bào)告顯示,我國(guó)每年因金屬表面缺陷導(dǎo)致的報(bào)廢率達(dá)3%~5%,對(duì)應(yīng)經(jīng)濟(jì)損失超500億元[3],而傳統(tǒng)人工檢測(cè)(效率20~30件/小時(shí),漏檢率隨時(shí)長(zhǎng)指數(shù)上升)與傳統(tǒng)機(jī)器視覺(jué)(復(fù)雜工況誤檢率超20%)已難以滿足工業(yè)4.0的“零缺陷”需求。在此背景下,基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)檢測(cè)技術(shù)成為突破瓶頸的關(guān)鍵,其中YOLO系列算法[4]憑借“端到端”架構(gòu)與高效推理特性,成為工業(yè)級(jí)部署的主流選擇,但在微小缺陷捕捉、復(fù)雜紋理抗干擾、精度和速度的平衡仍需優(yōu)化[5]。

在相關(guān)工作與技術(shù)瓶頸上,目標(biāo)檢測(cè)算法的演進(jìn)始終圍繞“特征表征能力”與“定位精度”兩大核心展開(kāi)。在單階段檢測(cè)器領(lǐng)域,YOLOv1開(kāi)創(chuàng)實(shí)時(shí)檢測(cè)范式但定位誤差大;YOLOv3[6]通過(guò)多尺度特征融合提升小目標(biāo)性能,卻依賴人工設(shè)計(jì)錨框?qū)е路夯允芟?;YOLOv5[7]的自適應(yīng)錨框與CSP結(jié)構(gòu)優(yōu)化了效率,但其特征提取對(duì)復(fù)雜背景魯棒性不足;YOLOv7[8]的ELAN結(jié)構(gòu)增強(qiáng)了特征學(xué)習(xí)能力,卻仍難以捕捉微米級(jí)缺陷的細(xì)微特征;最新的YOLOv11[9]通過(guò)C3k2模塊與動(dòng)態(tài)通道剪枝實(shí)現(xiàn)輕量化,但其在局部上下文關(guān)聯(lián)建模與極端比例目標(biāo)回歸上仍有提升空間。

金屬缺陷檢測(cè)作為高端制造領(lǐng)域質(zhì)量控制的核心環(huán)節(jié),其技術(shù)發(fā)展始終與工業(yè)現(xiàn)代化進(jìn)程深度耦合。國(guó)內(nèi)外研究在技術(shù)演進(jìn)中形成了既同源共生又各具特色的發(fā)展路徑。早期研究普遍依賴傳統(tǒng)圖像處理方法,國(guó)外學(xué)者通過(guò)閾值分割與形態(tài)學(xué)處理實(shí)現(xiàn)規(guī)則缺陷的初步識(shí)別[10],國(guó)內(nèi)研究者則在邊緣梯度分析領(lǐng)域進(jìn)行優(yōu)化,如基于Sobel算子的裂紋增強(qiáng)算法[11],但這類方法對(duì)低對(duì)比度缺陷和復(fù)雜背景的適應(yīng)性有限。隨著硬件設(shè)施與人工智能技術(shù)的發(fā)展,基于計(jì)算機(jī)視覺(jué)的檢測(cè)方法逐漸成為主流,其成本低、操作簡(jiǎn)便的優(yōu)勢(shì)使其在鋼、鋁、銅板等平面材料檢測(cè)中廣泛應(yīng)用。國(guó)內(nèi)研究呈現(xiàn)出鮮明的應(yīng)用導(dǎo)向特征,在數(shù)據(jù)增強(qiáng)與模型輕量化領(lǐng)域形成獨(dú)特優(yōu)勢(shì)。WANG K等人[12]針對(duì)工業(yè)領(lǐng)域金屬表面缺陷檢測(cè)中現(xiàn)有算法僅面向少數(shù)缺陷類型且不同尺度(尤其小尺度)缺陷表現(xiàn)欠佳的問(wèn)題,設(shè)計(jì)改進(jìn)YOLOv5檢測(cè)網(wǎng)絡(luò),有效損失函數(shù)解決小尺度缺陷引發(fā)的數(shù)據(jù)不平衡。張曙文等人[13]針對(duì)工業(yè)干擾環(huán)境下金屬齒輪表面缺陷自動(dòng)化檢測(cè)易出現(xiàn)誤檢和漏檢的問(wèn)題,提出改進(jìn)YOLOx算法,通過(guò)ASFF提高抗干擾能力,借助ECA模塊增強(qiáng)特征提取能力。改進(jìn)后網(wǎng)絡(luò)較原版在召回率、準(zhǔn)確率和平均精度均值均有所提升。竇智等人[14]針對(duì)鋼板制造行業(yè)傷痕類型多、次品少、檢測(cè)要求高導(dǎo)致傳統(tǒng)算法不滿足需求,且行業(yè)數(shù)據(jù)公開(kāi)率低、訓(xùn)練樣本不足使深度學(xué)習(xí)難應(yīng)用的問(wèn)題,提出小樣本驅(qū)動(dòng)的訓(xùn)練樣本生成方法及改進(jìn)YOLOv7算法,優(yōu)化ELAN模塊,采用ACmix注意力模塊,引入WIoU優(yōu)化損失函數(shù),成功應(yīng)用于小樣本鋼板缺陷檢測(cè)。但這兩種方法均未充分驗(yàn)證在金屬表面灰度不均、微小形變和缺陷等復(fù)雜工業(yè)場(chǎng)景,適用性仍需進(jìn)一步驗(yàn)證。

因此,當(dāng)前領(lǐng)域仍面臨三重核心挑戰(zhàn):金屬表面高反射率導(dǎo)致的灰度不均問(wèn)題,高速生產(chǎn)線5.12 Gb/s峰值數(shù)據(jù)率帶來(lái)的實(shí)時(shí)處理壓力,以及微小缺陷與隨機(jī)彈性變形造成的特征混淆。針對(duì)上述瓶頸,本文以YOLOv11為基線,聚焦金屬表面缺陷檢測(cè)的核心需求,提出三項(xiàng)協(xié)同優(yōu)化策略,其創(chuàng)新點(diǎn)與先進(jìn)性具體體現(xiàn)為:

(1)針對(duì)傳統(tǒng)C3k2模塊局部上下文建模不足的問(wèn)題,在殘差路徑中嵌入多尺度局部上下文注意力(MLCA),通過(guò)3×3/5×5并行卷積捕捉不同感受野特征,并結(jié)合通道注意力動(dòng)態(tài)加權(quán),既保留SE模塊的通道級(jí)特征篩選能力,又彌補(bǔ)其缺乏空間關(guān)聯(lián)建模的缺陷。相比Deformable DETR[15]的可變形注意力,MLCA將計(jì)算復(fù)雜度從O(N2)降至O(N),實(shí)現(xiàn)65 FPS的推理速度。

(2)EIoU損失函數(shù)適配:針對(duì)CIoU[16]對(duì)寬高差異約束薄弱的問(wèn)題,引入EIoU損失[17],在CIoU的基礎(chǔ)上分離寬高懲罰項(xiàng),通過(guò)計(jì)算預(yù)測(cè)框與真實(shí)框的寬、高差異平方和,顯式約束極端比例缺陷的回歸精度。實(shí)驗(yàn)表明,EIoU在長(zhǎng)寬比大于5:1的缺陷上定位誤差降低42%,在金屬缺陷檢測(cè)模型上優(yōu)于常用的損失函數(shù)SIoU[18]與ShapeIoU[19]。

(3)Detect_LADH輕量檢測(cè)頭:針對(duì)傳統(tǒng)檢測(cè)頭特征融合冗余的問(wèn)題,采用深度可分離卷積替代普通卷積,并設(shè)計(jì)動(dòng)態(tài)權(quán)重生成器(基于缺陷尺度自適應(yīng)分配P3/P4/P5特征權(quán)重)。相比PAN結(jié)構(gòu),其 FLOPs減少35%,推理速度提升至72 FPS,同時(shí)通過(guò)跨層特征動(dòng)態(tài)融合,將復(fù)雜紋理下的誤檢率從25%降至8.3%,優(yōu)于YOLO-World的靜態(tài)融合策略(誤檢率12.6%)。

在本文研究貢獻(xiàn)與結(jié)構(gòu)安排上,核心價(jià)值在于為單階段檢測(cè)器在高精度實(shí)時(shí)工業(yè)場(chǎng)景中的應(yīng)用提供了可推廣的技術(shù)范式。實(shí)驗(yàn)驗(yàn)證表明在自建數(shù)據(jù)集上,改進(jìn)模型較YOLOv11基線mAP@0.5提升8.9%,推理時(shí)間為1.4 ms。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006998


作者信息:

付為剛,彭奕舜

(中國(guó)民用航空飛行學(xué)院 航空工程學(xué)院, 四川 廣漢 618307)

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。