《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于YOLO改進(jìn)殘差網(wǎng)絡(luò)結(jié)構(gòu)的車(chē)輛檢測(cè)方法
基于YOLO改進(jìn)殘差網(wǎng)絡(luò)結(jié)構(gòu)的車(chē)輛檢測(cè)方法
2020年信息技術(shù)與網(wǎng)絡(luò)安全第9期
胡臣辰,陳賢富
中國(guó)科學(xué)技術(shù)大學(xué) 微電子學(xué)院,安徽 合肥230027
摘要: 針對(duì)車(chē)輛檢測(cè)任務(wù),設(shè)計(jì)更高效、精確的網(wǎng)絡(luò)模型是行業(yè)研究的熱點(diǎn),深層網(wǎng)絡(luò)模型具有比淺層網(wǎng)絡(luò)模型更好的特征提取能力,但構(gòu)建深層網(wǎng)絡(luò)模型時(shí)將導(dǎo)致梯度消失、模型過(guò)擬合等問(wèn)題,應(yīng)用殘差網(wǎng)絡(luò)結(jié)構(gòu)可以緩解此類(lèi)問(wèn)題。基于YOLO算法,改進(jìn)殘差網(wǎng)絡(luò)結(jié)構(gòu),加深網(wǎng)絡(luò)層數(shù),設(shè)計(jì)了一種含有68個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)模型,同時(shí)對(duì)輸入圖像進(jìn)行預(yù)處理,保證目標(biāo)在圖像上不變形失真,最后在自定義的車(chē)輛數(shù)據(jù)集上對(duì)模型進(jìn)行訓(xùn)練與測(cè)試,并將實(shí)驗(yàn)結(jié)果與YOLOV3模型進(jìn)行對(duì)比,實(shí)驗(yàn)表明,本文設(shè)計(jì)的模型檢測(cè)精準(zhǔn)度(AP)達(dá)90.63%,較YOLOV3提高了4.6%。
中圖分類(lèi)號(hào): TP393
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.09.011
引用格式: 胡臣辰,陳賢富. 基于YOLO改進(jìn)殘差網(wǎng)絡(luò)結(jié)構(gòu)的車(chē)輛檢測(cè)方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(9):56-60.
Vehicle detection method based on improved residual network structure of based on YOLO
Hu Chenchen,Chen Xianfu
Institute of Microelectronics,University of Science and Technology of China,Hefei 230027,China
Abstract: For vehicle detection task, the design of more efficient and accurate network model is a hot research. Deep network model has better feature extraction capabilities than shallow network model, but will cause the gradient to disappear and the model to overfit and other problems. Application of residual network structure can alleviate such problems. Based on the YOLO algorithm, this paper improves the residual network structure and deepens the number of network layers. A convolutional neural network model with 68 convolutional layers is designed. At the same time, the input image is preprocessed to ensure that the target is not deformed or distorted on the image. Finally, the model is trained and tested on a custom vehicle data set, and the experimental results are compared with the YOLOV3 model. The experiment shows that the model detection accuracy(AP) designed in this paper reaches 90.63%, which is 4.6% higher than YOLOV3.
Key words : object detection;YOLO;residual network;deep learning

0 引言

    車(chē)輛是目標(biāo)檢測(cè)任務(wù)中的重要對(duì)象之一,在自動(dòng)駕駛、目標(biāo)追蹤等領(lǐng)域有著十分重要的應(yīng)用。以梯度方向直方圖(Histogram of Oriented Gradient,HOG)和支持向量機(jī)(Support Vector Machine,SVM)結(jié)合的傳統(tǒng)目標(biāo)檢測(cè)算法先計(jì)算候選框內(nèi)圖像梯度的方向信息統(tǒng)計(jì)值,再通過(guò)正負(fù)樣本訓(xùn)練SVM,使用傳統(tǒng)方法受限于候選框提取效率、HOG特征尺度魯棒性,在實(shí)時(shí)性以及遮擋目標(biāo)檢測(cè)等諸多方面有著明顯缺陷[1]。近年來(lái),基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法以強(qiáng)特征提取能力、高檢測(cè)率取得了驚人的成果。近年來(lái)深度學(xué)習(xí)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)上因AlexNet在2012年的ImageNet大賽中大放異彩而進(jìn)入飛速發(fā)展。2014年VGGNet在追求深層網(wǎng)絡(luò)的性能時(shí),發(fā)現(xiàn)增加網(wǎng)絡(luò)的深度會(huì)提高性能,但是與此同時(shí)帶來(lái)的梯度消失問(wèn)題不可避免。2015年ResNet網(wǎng)絡(luò)較好地解決了這個(gè)問(wèn)題,深層殘差網(wǎng)絡(luò)可以減少模型收斂時(shí)間、改善尋優(yōu)過(guò)程,但應(yīng)用尺度大的卷積核的同時(shí)增加了網(wǎng)絡(luò)模型的參數(shù)量與計(jì)算量,降低了模型的訓(xùn)練與檢測(cè)速度[2]。

    計(jì)算機(jī)視覺(jué)中的目標(biāo)檢測(cè)任務(wù)關(guān)注圖像中特定目標(biāo)的位置信息,現(xiàn)有方法分為two-stage和one-stage兩類(lèi)。two-stage方法先產(chǎn)生包含目標(biāo)的候選框,再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)進(jìn)行分類(lèi),常見(jiàn)的方法有RCNN、Fast-RCNN、Faster-RCNN。one-stage方法直接使用一個(gè)卷積網(wǎng)絡(luò)對(duì)給定輸入圖像給出檢測(cè)結(jié)果,以YOLO為代表的one-stage目標(biāo)檢測(cè)方法在檢測(cè)時(shí),將候選框的生成與目標(biāo)的分類(lèi)回歸合并成一步,基于YOLO的檢測(cè)算法大大提高了檢測(cè)速度,但檢測(cè)精度仍有待提高[3]。本文選擇在基于YOLO方法的基礎(chǔ)上改進(jìn)主干網(wǎng)絡(luò)的殘差網(wǎng)絡(luò)結(jié)構(gòu),設(shè)計(jì)了一種新的網(wǎng)絡(luò)模型,經(jīng)實(shí)驗(yàn)表明提高了檢測(cè)準(zhǔn)確率。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003099




作者信息:

胡臣辰,陳賢富

(中國(guó)科學(xué)技術(shù)大學(xué) 微電子學(xué)院,安徽 合肥230027)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。