《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 基于改進(jìn)U-Net的瀝青拌合站混合料裝車語義分割
基于改進(jìn)U-Net的瀝青拌合站混合料裝車語義分割
電子技術(shù)應(yīng)用
李東麗1,成高立1,郭濤2,夏曉華2
1.陜西高速機(jī)械化工程有限公司; 2.長安大學(xué) 道路施工技術(shù)與裝備教育部重點實驗室
摘要: 針對現(xiàn)有的瀝青拌合站混合料裝車語義分割方法平均交并比(Mean Intersection over Union,mIoU)值較低、檢測速度較慢等問題,提出一種輕量化網(wǎng)絡(luò)RCS-UNet對瀝青拌合站混合料裝車狀態(tài)進(jìn)行語義分割。首先在U-Net網(wǎng)絡(luò)中加入殘差連接以緩解梯度消失的問題,使網(wǎng)絡(luò)在訓(xùn)練過程中更加穩(wěn)定,提高模型的收斂速度和泛化能力;其次加入坐標(biāo)注意力(Coordinate Attention,CA)機(jī)制,增強(qiáng)位置與通道的信息感知,提高模型的特征提取能力,使模型更加關(guān)注圖像中的重要區(qū)域;最后將U-Net網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積修改為深度可分離卷積,以減小模型的體積和參數(shù)量,使得模型在保持較高性能的同時,具有更低的資源消耗和更快的推理速度。實驗結(jié)果表明,改進(jìn)模型的準(zhǔn)確率、mIoU值以及FPS值分別為99.20%、98.41%和22.98,與經(jīng)典模型和當(dāng)前先進(jìn)模型相比三個指標(biāo)均為最高,取得了最優(yōu)的語義分割效果。
中圖分類號:U415 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.245955
中文引用格式: 李東麗,成高立,郭濤,等. 基于改進(jìn)U-Net的瀝青拌合站混合料裝車語義分割[J]. 電子技術(shù)應(yīng)用,2025,51(4):29-34.
英文引用格式: Li Dongli,Cheng Gaoli,Guo Tao,et al. Semantic segmentation of mix loading at asphalt mixing plant based on improved U-Net[J]. Application of Electronic Technique,2025,51(4):29-34.
Semantic segmentation of mix loading at asphalt mixing plant based on improved U-Net
Li Dongli1,Cheng Gaoli1,Guo Tao2,Xia Xiaohua2
1.Shaanxi Expressway Mechanization Engineering Limited Company; 2.Key Laboratory of Road Construction Technology and Equipment of MOE, Chang'an University
Abstract: Aiming at the existing asphalt mixing plant mixture loading semantic segmentation methods with low Mean Intersection over Union(mIoU) values and slow detection speed, a lightweight network RCS-UNet is proposed for semantic segmentation of asphalt mixing plant mixture loading state.Firstly, residual connections are integrated into the U-Net network to mitigate the gradient vanishing issue, promoting stability during training, enhancing convergence speed, and improving generalization abilities. Secondly, the Coordinate Attention(CA) mechanism is incorporated to boost the perception of positional and channel information, refining feature extraction and enabling a sharper focus on critical regions within the image. Finally, the standard convolution in the U-Net network is modified to depth-separable convolution in order to reduce the size and parameters of the model, so that the model has a lower resource consumption and a faster inference speed while maintaining a higher performance. The experimental results show that the accuracy, mIoU, and FPS of the improved model are 99.20%, 98.41% and 22.98, respectively, which are the highest compared with the classical model and the current state-of-the-art model. The best segmentation results are obtained.
Key words : residual connectivity;CA;depth-separable convolution;semantic segmentation;asphalt mixing plant

引言

隨著科技的進(jìn)步,工業(yè)領(lǐng)域?qū)τ谥悄芑妥詣踊男枨笕找嬖鰪?qiáng)。瀝青拌合站作為道路建設(shè)中的關(guān)鍵設(shè)備[1],其智能化和自動化水平的提升對于提高道路建設(shè)效率、保證建設(shè)質(zhì)量以及降低運營成本都具有重要意義。

目前,瀝青拌合站混合料裝車的狀態(tài)主要依靠人工監(jiān)測,這種監(jiān)測方法不僅效率低下,而且容易出現(xiàn)誤差[2]。此外,工人長期工作在瀝青煙氣的環(huán)境中,嚴(yán)重影響其身心健康。隨著計算機(jī)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的語義分割技術(shù)逐漸應(yīng)用到瀝青拌合站混合料裝車的狀態(tài)識別。Wang等[3]提出了M-DeepLabV3+模型對瀝青拌合站混合料裝車圖像進(jìn)行語義分割,通過計算料堆最高點與車輛擋板的高度差判斷車輛是否裝滿,實現(xiàn)了深度學(xué)習(xí)在瀝青拌合站混合料裝車狀態(tài)識別上的首次應(yīng)用。李許峰等[4]提出一種輕量級的語義分割網(wǎng)絡(luò)S-DeepLabV3+,將原DeepLabV3+的主干網(wǎng)絡(luò)Xception替換為ShuffleNetV2,實現(xiàn)了瀝青拌合站裝車的自動化監(jiān)測。以上方法雖然對瀝青拌合站混合料裝車狀態(tài)的智能識別做出了貢獻(xiàn),但都存在語義分割mIoU值較低、檢測速度較慢等問題。

針對上述問題,本文對U-Net[5]模型進(jìn)行改進(jìn),提出了一種輕量化模型RCS-UNet。首先在U-Net網(wǎng)絡(luò)中加入殘差連接[6]以緩解梯度消失的問題,其次加入CA注意力機(jī)制[7]提高模型的特征提取能力,最后將U-Net網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積修改為深度可分離卷積[8]以減小模型體積,提高模型的檢測速度。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000006390


作者信息:

李東麗1,成高立1,郭濤2,夏曉華2

(1.陜西高速機(jī)械化工程有限公司,陜西 西安 710038;

2.長安大學(xué) 道路施工技術(shù)與裝備教育部重點實驗室,陜西 西安710064)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。