《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 一種基于SSD與FRN相結(jié)合的密集連接行人檢測(cè)算法
一種基于SSD與FRN相結(jié)合的密集連接行人檢測(cè)算法
2020年信息技術(shù)與網(wǎng)絡(luò)安全第12期
馮婷婷,葛華勇,孫家慧
東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620
摘要: 現(xiàn)實(shí)場(chǎng)景行人的復(fù)雜性和多樣性使得行人檢測(cè)成為計(jì)算機(jī)視覺(jué)領(lǐng)域中一個(gè)既具有研究?jī)r(jià)值又極具挑戰(zhàn)性的熱門(mén)課題,為提高其準(zhǔn)確性,提出一種基于SSD(Single Shot Multibox Detector)與FRN(Filter Response Normalization)相結(jié)合的密集連接行人檢測(cè)算法,將串聯(lián)式的SSD基礎(chǔ)網(wǎng)絡(luò)修改為引入上下文語(yǔ)義信息的多層融合的密集連接的FRN網(wǎng)絡(luò)結(jié)構(gòu),運(yùn)用聚類(lèi)思想設(shè)置適宜行人尺度的候選框,并且根據(jù)行人尺寸的統(tǒng)計(jì)分布規(guī)律調(diào)整不同檢測(cè)層的縮放因子,從而實(shí)現(xiàn)端到端訓(xùn)練。在融合數(shù)據(jù)集和VOC2007TEST數(shù)據(jù)集上驗(yàn)證該模型的性能,相比于SSD方法,該方法準(zhǔn)確率AP(Average Precision)分別提高5.8%、2.9%,具有更高的準(zhǔn)確性和魯棒性。
中圖分類(lèi)號(hào): TP301.6
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 馮婷婷,葛華勇,孫家慧. 一種基于SSD與FRN相結(jié)合的密集連接行人檢測(cè)算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(12):56-60,66.
A densely connected pedestrian detection algorithm based on the combination of SSD and FRN
Feng Tingting,Ge Huayong,Sun Jiahui
School of Information Science and Technology,Donghua University,Shanghai 201620,China
Abstract: The complexity and diversity of pedestrians in real scenes make pedestrian detection a hot topic with both research value and challenge in the field of computer vision. In order to improve its accuracy, this paper proposes a densely connected pedestrian detection algorithm based on the combination of SSD and FRN, modifies the serial SSD basic network into a multi-layered densely-connected FRN network structure that introduces contextual semantic information, and uses clustering ideas to set candidate boxes suitable for pedestrian scale, and adjusts the scaling factors of different detection layers according to the statistical distribution law of pedestrian size, so as to achieve end-to-end training. The performance of the model is verified on the fusion dataset and the VOC2007TEST dataset. Compared with the SSD method, the accuracy of the method AP is improved by 5.8% and 2.9% respectively, with higher accuracy and robustness.
Key words : pedestrian detection;dense connection;clustering algorithm;SSD;FRN

0 引言

    行人檢測(cè)作為計(jì)算機(jī)視覺(jué)技術(shù)的重要分支和智能化產(chǎn)品的核心技術(shù),受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,其能夠從圖像或視頻中識(shí)別出行人,并給出其具體的位置,在車(chē)輛輔助駕駛和行人重識(shí)別技術(shù)等方面有巨大的研究?jī)r(jià)值和應(yīng)用前景。行人檢測(cè)作為車(chē)輛輔助駕駛技術(shù)中不可或缺的一部分,可以及時(shí)檢測(cè)出車(chē)輛前方的行人并針對(duì)實(shí)際狀況及時(shí)提醒司機(jī)或者緊急制動(dòng),從而避免交通事故的發(fā)生;在刑偵工作中,刑偵人員經(jīng)常要瀏覽多個(gè)攝像頭中的視頻,此時(shí)先進(jìn)行行人檢測(cè)判斷視頻中是否存在行人,把視頻中的行人篩選出來(lái),再利用行人重識(shí)別技術(shù)查找某個(gè)特定的行人在哪些攝像頭曾經(jīng)出現(xiàn)過(guò),可為刑偵工作帶來(lái)便利。

    近十幾年間,基于深度學(xué)習(xí)的行人檢測(cè)技術(shù)取得了巨大進(jìn)步,能夠自動(dòng)學(xué)習(xí)從圖像像素中提取的基于邊緣的低級(jí)特征和基于語(yǔ)義信息的高級(jí)特征。其分為兩階段檢測(cè)算法和單階段檢測(cè)算法。在兩階段檢測(cè)算法中,文獻(xiàn)[1]提出了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(Region based Convolutional Neural Network,R-CNN),文獻(xiàn)[2]提出了空間金字塔池化(Spatial Pyramid Pooling,SPP)網(wǎng)絡(luò),文獻(xiàn)[3]提出了快速基于區(qū)域的卷積網(wǎng)絡(luò)方法(Fast-RCNN),文獻(xiàn)[4-5]提出了Faster-RCNN。這些目標(biāo)檢測(cè)算法的訓(xùn)練過(guò)程步驟繁瑣,檢測(cè)速度慢,沒(méi)有達(dá)到實(shí)時(shí)的檢測(cè)標(biāo)準(zhǔn)?;诖?,以REDMON J[6]提出的統(tǒng)一實(shí)時(shí)目標(biāo)檢測(cè)框架(You only look once,Yolo)和以Liu Wei[7]提出的單階段多尺度檢測(cè)器(Single Shot MultiBox Detector,SSD)框架為代表的單階段檢測(cè)算法由此產(chǎn)生。Yolo存在定位精度、召回率等較低的問(wèn)題,泛化能力相對(duì)較弱,為了解決該算法的缺陷,2016年Liu Wei等提出SSD算法進(jìn)行多尺度檢測(cè),在保證速度的同時(shí)提高了檢測(cè)精度,但是其對(duì)于小目標(biāo)檢測(cè)不精準(zhǔn),加之在實(shí)際生活中,由于行人穿著、姿態(tài)、尺度、視角、光照和復(fù)雜背景等多方面原因,在檢測(cè)精度及速度方面的提高仍是研究重點(diǎn)。由此針對(duì)行人多尺度問(wèn)題,本文提出一種FRN提升模型性能的密集連接的SSD行人檢測(cè)算法,嘗試引入不依賴批尺寸大小的上下文語(yǔ)義信息的多層特征融合的密集連接網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合行人檢測(cè)任務(wù)特點(diǎn)進(jìn)行優(yōu)化與改進(jìn)。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003230




作者信息:

馮婷婷,葛華勇,孫家慧

(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。