《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 设计应用 > 一种基于SSD与FRN相结合的密集连接行人检测算法
一种基于SSD与FRN相结合的密集连接行人检测算法
2020年信息技术与网络安全第12期
冯婷婷,葛华勇,孙家慧
东华大学 信息科学与技术学院,上海201620
摘要: 现实场景行人的复杂性和多样性使得行人检测成为计算机视觉领域中一个既具有研究价值又极具挑战性的热门课题,为提高其准确性,提出一种基于SSD(Single Shot Multibox Detector)与FRN(Filter Response Normalization)相结合的密集连接行人检测算法,将串联式的SSD基础网络修改为引入上下文语义信息的多层融合的密集连接的FRN网络结构,运用聚类思想设置适宜行人尺度的候选框,并且根据行人尺寸的统计分布规律调整不同检测层的缩放因子,从而实现端到端训练。在融合数据集和VOC2007TEST数据集上验证该模型的性能,相比于SSD方法,该方法准确率AP(Average Precision)分别提高5.8%、2.9%,具有更高的准确性和鲁棒性。
中圖分類號(hào): TP301.6
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 馮婷婷,葛華勇,孫家慧. 一種基于SSD與FRN相結(jié)合的密集連接行人檢測(cè)算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(12):56-60,66.
A densely connected pedestrian detection algorithm based on the combination of SSD and FRN
Feng Tingting,Ge Huayong,Sun Jiahui
School of Information Science and Technology,Donghua University,Shanghai 201620,China
Abstract: The complexity and diversity of pedestrians in real scenes make pedestrian detection a hot topic with both research value and challenge in the field of computer vision. In order to improve its accuracy, this paper proposes a densely connected pedestrian detection algorithm based on the combination of SSD and FRN, modifies the serial SSD basic network into a multi-layered densely-connected FRN network structure that introduces contextual semantic information, and uses clustering ideas to set candidate boxes suitable for pedestrian scale, and adjusts the scaling factors of different detection layers according to the statistical distribution law of pedestrian size, so as to achieve end-to-end training. The performance of the model is verified on the fusion dataset and the VOC2007TEST dataset. Compared with the SSD method, the accuracy of the method AP is improved by 5.8% and 2.9% respectively, with higher accuracy and robustness.
Key words : pedestrian detection;dense connection;clustering algorithm;SSD;FRN

0 引言

    行人檢測(cè)作為計(jì)算機(jī)視覺(jué)技術(shù)的重要分支和智能化產(chǎn)品的核心技術(shù),受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,其能夠從圖像或視頻中識(shí)別出行人,并給出其具體的位置,在車輛輔助駕駛和行人重識(shí)別技術(shù)等方面有巨大的研究?jī)r(jià)值和應(yīng)用前景。行人檢測(cè)作為車輛輔助駕駛技術(shù)中不可或缺的一部分,可以及時(shí)檢測(cè)出車輛前方的行人并針對(duì)實(shí)際狀況及時(shí)提醒司機(jī)或者緊急制動(dòng),從而避免交通事故的發(fā)生;在刑偵工作中,刑偵人員經(jīng)常要瀏覽多個(gè)攝像頭中的視頻,此時(shí)先進(jìn)行行人檢測(cè)判斷視頻中是否存在行人,把視頻中的行人篩選出來(lái),再利用行人重識(shí)別技術(shù)查找某個(gè)特定的行人在哪些攝像頭曾經(jīng)出現(xiàn)過(guò),可為刑偵工作帶來(lái)便利。

    近十幾年間,基于深度學(xué)習(xí)的行人檢測(cè)技術(shù)取得了巨大進(jìn)步,能夠自動(dòng)學(xué)習(xí)從圖像像素中提取的基于邊緣的低級(jí)特征和基于語(yǔ)義信息的高級(jí)特征。其分為兩階段檢測(cè)算法和單階段檢測(cè)算法。在兩階段檢測(cè)算法中,文獻(xiàn)[1]提出了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(Region based Convolutional Neural Network,R-CNN),文獻(xiàn)[2]提出了空間金字塔池化(Spatial Pyramid Pooling,SPP)網(wǎng)絡(luò),文獻(xiàn)[3]提出了快速基于區(qū)域的卷積網(wǎng)絡(luò)方法(Fast-RCNN),文獻(xiàn)[4-5]提出了Faster-RCNN。這些目標(biāo)檢測(cè)算法的訓(xùn)練過(guò)程步驟繁瑣,檢測(cè)速度慢,沒(méi)有達(dá)到實(shí)時(shí)的檢測(cè)標(biāo)準(zhǔn)?;诖耍訰EDMON J[6]提出的統(tǒng)一實(shí)時(shí)目標(biāo)檢測(cè)框架(You only look once,Yolo)和以Liu Wei[7]提出的單階段多尺度檢測(cè)器(Single Shot MultiBox Detector,SSD)框架為代表的單階段檢測(cè)算法由此產(chǎn)生。Yolo存在定位精度、召回率等較低的問(wèn)題,泛化能力相對(duì)較弱,為了解決該算法的缺陷,2016年Liu Wei等提出SSD算法進(jìn)行多尺度檢測(cè),在保證速度的同時(shí)提高了檢測(cè)精度,但是其對(duì)于小目標(biāo)檢測(cè)不精準(zhǔn),加之在實(shí)際生活中,由于行人穿著、姿態(tài)、尺度、視角、光照和復(fù)雜背景等多方面原因,在檢測(cè)精度及速度方面的提高仍是研究重點(diǎn)。由此針對(duì)行人多尺度問(wèn)題,本文提出一種FRN提升模型性能的密集連接的SSD行人檢測(cè)算法,嘗試引入不依賴批尺寸大小的上下文語(yǔ)義信息的多層特征融合的密集連接網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合行人檢測(cè)任務(wù)特點(diǎn)進(jìn)行優(yōu)化與改進(jìn)。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003230




作者信息:

馮婷婷,葛華勇,孫家慧

(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。