文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 馮婷婷,葛華勇,孫家慧. 一種基于SSD與FRN相結(jié)合的密集連接行人檢測(cè)算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(12):56-60,66.
0 引言
行人檢測(cè)作為計(jì)算機(jī)視覺(jué)技術(shù)的重要分支和智能化產(chǎn)品的核心技術(shù),受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,其能夠從圖像或視頻中識(shí)別出行人,并給出其具體的位置,在車(chē)輛輔助駕駛和行人重識(shí)別技術(shù)等方面有巨大的研究?jī)r(jià)值和應(yīng)用前景。行人檢測(cè)作為車(chē)輛輔助駕駛技術(shù)中不可或缺的一部分,可以及時(shí)檢測(cè)出車(chē)輛前方的行人并針對(duì)實(shí)際狀況及時(shí)提醒司機(jī)或者緊急制動(dòng),從而避免交通事故的發(fā)生;在刑偵工作中,刑偵人員經(jīng)常要瀏覽多個(gè)攝像頭中的視頻,此時(shí)先進(jìn)行行人檢測(cè)判斷視頻中是否存在行人,把視頻中的行人篩選出來(lái),再利用行人重識(shí)別技術(shù)查找某個(gè)特定的行人在哪些攝像頭曾經(jīng)出現(xiàn)過(guò),可為刑偵工作帶來(lái)便利。
近十幾年間,基于深度學(xué)習(xí)的行人檢測(cè)技術(shù)取得了巨大進(jìn)步,能夠自動(dòng)學(xué)習(xí)從圖像像素中提取的基于邊緣的低級(jí)特征和基于語(yǔ)義信息的高級(jí)特征。其分為兩階段檢測(cè)算法和單階段檢測(cè)算法。在兩階段檢測(cè)算法中,文獻(xiàn)[1]提出了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(Region based Convolutional Neural Network,R-CNN),文獻(xiàn)[2]提出了空間金字塔池化(Spatial Pyramid Pooling,SPP)網(wǎng)絡(luò),文獻(xiàn)[3]提出了快速基于區(qū)域的卷積網(wǎng)絡(luò)方法(Fast-RCNN),文獻(xiàn)[4-5]提出了Faster-RCNN。這些目標(biāo)檢測(cè)算法的訓(xùn)練過(guò)程步驟繁瑣,檢測(cè)速度慢,沒(méi)有達(dá)到實(shí)時(shí)的檢測(cè)標(biāo)準(zhǔn)?;诖?,以REDMON J[6]提出的統(tǒng)一實(shí)時(shí)目標(biāo)檢測(cè)框架(You only look once,Yolo)和以Liu Wei[7]提出的單階段多尺度檢測(cè)器(Single Shot MultiBox Detector,SSD)框架為代表的單階段檢測(cè)算法由此產(chǎn)生。Yolo存在定位精度、召回率等較低的問(wèn)題,泛化能力相對(duì)較弱,為了解決該算法的缺陷,2016年Liu Wei等提出SSD算法進(jìn)行多尺度檢測(cè),在保證速度的同時(shí)提高了檢測(cè)精度,但是其對(duì)于小目標(biāo)檢測(cè)不精準(zhǔn),加之在實(shí)際生活中,由于行人穿著、姿態(tài)、尺度、視角、光照和復(fù)雜背景等多方面原因,在檢測(cè)精度及速度方面的提高仍是研究重點(diǎn)。由此針對(duì)行人多尺度問(wèn)題,本文提出一種FRN提升模型性能的密集連接的SSD行人檢測(cè)算法,嘗試引入不依賴批尺寸大小的上下文語(yǔ)義信息的多層特征融合的密集連接網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合行人檢測(cè)任務(wù)特點(diǎn)進(jìn)行優(yōu)化與改進(jìn)。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003230
作者信息:
馮婷婷,葛華勇,孫家慧
(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620)