《電子技術應用》
您所在的位置:首頁 > 测试测量 > 设计应用 > 基于YOLO改进残差网络结构的车辆检测方法
基于YOLO改进残差网络结构的车辆检测方法
2020年信息技术与网络安全第9期
胡臣辰,陈贤富
中国科学技术大学 微电子学院,安徽 合肥230027
摘要: 针对车辆检测任务,设计更高效、精确的网络模型是行业研究的热点,深层网络模型具有比浅层网络模型更好的特征提取能力,但构建深层网络模型时将导致梯度消失、模型过拟合等问题,应用残差网络结构可以缓解此类问题。基于YOLO算法,改进残差网络结构,加深网络层数,设计了一种含有68个卷积层的卷积神经网络模型,同时对输入图像进行预处理,保证目标在图像上不变形失真,最后在自定义的车辆数据集上对模型进行训练与测试,并将实验结果与YOLOV3模型进行对比,实验表明,本文设计的模型检测精准度(AP)达90.63%,较YOLOV3提高了4.6%。
中圖分類號: TP393
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.09.011
引用格式: 胡臣辰,陳賢富. 基于YOLO改進殘差網(wǎng)絡結構的車輛檢測方法[J].信息技術與網(wǎng)絡安全,2020,39(9):56-60.
Vehicle detection method based on improved residual network structure of based on YOLO
Hu Chenchen,Chen Xianfu
Institute of Microelectronics,University of Science and Technology of China,Hefei 230027,China
Abstract: For vehicle detection task, the design of more efficient and accurate network model is a hot research. Deep network model has better feature extraction capabilities than shallow network model, but will cause the gradient to disappear and the model to overfit and other problems. Application of residual network structure can alleviate such problems. Based on the YOLO algorithm, this paper improves the residual network structure and deepens the number of network layers. A convolutional neural network model with 68 convolutional layers is designed. At the same time, the input image is preprocessed to ensure that the target is not deformed or distorted on the image. Finally, the model is trained and tested on a custom vehicle data set, and the experimental results are compared with the YOLOV3 model. The experiment shows that the model detection accuracy(AP) designed in this paper reaches 90.63%, which is 4.6% higher than YOLOV3.
Key words : object detection;YOLO;residual network;deep learning

0 引言

    車輛是目標檢測任務中的重要對象之一,在自動駕駛、目標追蹤等領域有著十分重要的應用。以梯度方向直方圖(Histogram of Oriented Gradient,HOG)和支持向量機(Support Vector Machine,SVM)結合的傳統(tǒng)目標檢測算法先計算候選框內(nèi)圖像梯度的方向信息統(tǒng)計值,再通過正負樣本訓練SVM,使用傳統(tǒng)方法受限于候選框提取效率、HOG特征尺度魯棒性,在實時性以及遮擋目標檢測等諸多方面有著明顯缺陷[1]。近年來,基于深度學習的目標檢測方法以強特征提取能力、高檢測率取得了驚人的成果。近年來深度學習網(wǎng)絡在計算機視覺上因AlexNet在2012年的ImageNet大賽中大放異彩而進入飛速發(fā)展。2014年VGGNet在追求深層網(wǎng)絡的性能時,發(fā)現(xiàn)增加網(wǎng)絡的深度會提高性能,但是與此同時帶來的梯度消失問題不可避免。2015年ResNet網(wǎng)絡較好地解決了這個問題,深層殘差網(wǎng)絡可以減少模型收斂時間、改善尋優(yōu)過程,但應用尺度大的卷積核的同時增加了網(wǎng)絡模型的參數(shù)量與計算量,降低了模型的訓練與檢測速度[2]。

    計算機視覺中的目標檢測任務關注圖像中特定目標的位置信息,現(xiàn)有方法分為two-stage和one-stage兩類。two-stage方法先產(chǎn)生包含目標的候選框,再通過卷積神經(jīng)網(wǎng)絡對目標進行分類,常見的方法有RCNN、Fast-RCNN、Faster-RCNN。one-stage方法直接使用一個卷積網(wǎng)絡對給定輸入圖像給出檢測結果,以YOLO為代表的one-stage目標檢測方法在檢測時,將候選框的生成與目標的分類回歸合并成一步,基于YOLO的檢測算法大大提高了檢測速度,但檢測精度仍有待提高[3]。本文選擇在基于YOLO方法的基礎上改進主干網(wǎng)絡的殘差網(wǎng)絡結構,設計了一種新的網(wǎng)絡模型,經(jīng)實驗表明提高了檢測準確率。




本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000003099




作者信息:

胡臣辰,陳賢富

(中國科學技術大學 微電子學院,安徽 合肥230027)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。