《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于ROI區(qū)域強分辨力HOG特征的視頻行人檢測
基于ROI區(qū)域強分辨力HOG特征的視頻行人檢測
來源:微型機與應(yīng)用2013年第7期
張 璐,陳淑榮
(上海海事大學 信息工程學院,上海 201306)
摘要: 針對傳統(tǒng)梯度方向直方圖(HOG)行人檢測系統(tǒng)中檢測窗掃描區(qū)域過大、HOG特征維度大而引起的檢測速度慢問題,提出了改進的視頻行人檢測算法。通過運動信息提取感興趣(ROI)目標區(qū)域,利用Fisher準則和多尺度特性選取具有強分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(SVM)檢測行人。實驗結(jié)果表明,本文方法在保證視頻行人檢測的準確率的同時,有效地提高了行人檢測的速率。
Abstract:
Key words :

摘  要: 針對傳統(tǒng)梯度方向直方圖(HOG)行人檢測系統(tǒng)中檢測窗掃描區(qū)域過大、HOG特征維度大而引起的檢測速度慢問題,提出了改進的視頻行人檢測算法。通過運動信息提取感興趣(ROI)目標區(qū)域,利用Fisher準則和多尺度特性選取具有強分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(SVM)檢測行人。實驗結(jié)果表明,本文方法在保證視頻行人檢測的準確率的同時,有效地提高了行人檢測的速率。
關(guān)鍵詞: 行人檢測;感興趣區(qū)域;梯度方向直方圖;Fisher準則

 行人檢測是計算機視覺和模式識別領(lǐng)域中的研究熱點,在視頻監(jiān)控中有廣泛的應(yīng)用。目前,用于行人檢測的方法主要分為3類:(1)基于運動信息的方法[1-2],根據(jù)行人運動信息(如步態(tài))實現(xiàn)行人檢測,實時性好但只限于運動行人;(2)基于先驗知識建模的方法[3],利用已知先驗知識構(gòu)建人體模板和待測目標進行匹配,但模板的初始參數(shù)難以獲?。唬?)基于特征統(tǒng)計分類的方法[4-9],根據(jù)訓練數(shù)據(jù)獲取有效分類器對輸入檢測窗口進行檢測,實現(xiàn)簡單且檢測效果較好,是目前靜態(tài)圖像行人檢測的主流方法,但對視頻行人檢測速度較慢。因此,如何保證視頻行人檢測的準確率,并提高檢測速度是一個急需解決的問題。
1 本文行人檢測方法
 視頻錄像中行人的不同姿勢、復雜的背景變化對算法的檢測準確率和檢測速度都提出了嚴格要求。本文提出利用視頻中的運動信息獲取ROI區(qū)域,結(jié)合Fisher準則挑選強分辨力行人HOG特征,并結(jié)合SVM分類器檢測行人。其中,訓練部分采用正負樣本庫提取強分辨力HOG行人特征,并通過SVM訓練得到強分辨力HOG特征的行人分類器。檢測時利用幀間信息獲得ROI區(qū)域,通過多層次縮放ROI區(qū)域獲取所有檢測窗,并利用強分辨力行人HOG特征來表征檢測窗中行人,通過訓練好的分類器實現(xiàn)對視頻中行人的檢測。該算法框架如圖1所示。
1.1 視頻圖像ROI目標區(qū)域提取
 視頻幀圖像中存在大量的非人區(qū)域,全局掃描需要很多冗余計算。本文采用三幀差分法獲取運動目標前景,進行二值化處理、形態(tài)學處理和前景塊擴展,獲取ROI目標區(qū)域。具體實現(xiàn)步驟如下。

其中,u是0~1的一個值,w、h分別表示前景塊的寬、高。
(5)標記擴展后的行人目標前景塊集合,構(gòu)建ROI區(qū)域以進行后續(xù)的特征提取和檢測。ROI目標區(qū)域提取如圖2所示。

1.2 強分辨力行人特征提取
1.2.1 多尺度HOG特征
 HOG特征是通過計算局部區(qū)域的梯度方向直方圖描述目標形狀特征,對光照變化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的檢測窗內(nèi)提取105個16×16等大小的Block特征塊,利用這些特征塊構(gòu)成描述符來訓練和檢測行人。
 等大小的基本HOG特征塊對描述行人較大的部位(如頭部、身體等)的整體信息能力有限,因此本文構(gòu)建HOG特征時采用了多尺度[6]方法,對于64×128檢測窗,Block塊的大小選取依次從16×16到64×128,寬高比(w∶h)分別取1∶1、1∶2和2∶1,共獲得452個不同尺度的Block塊。
 在特征塊提取過程中,為避免特征塊交疊而引起的重復計算,引入“積分圖[6]”思想,每個像素點的特征由9維向量表示,即:

2 實驗及結(jié)果分析
 本文實驗在MATLAB2008a上實現(xiàn),計算機環(huán)境配置為3 GHz CPU和2 GB內(nèi)存。采用的數(shù)據(jù)來源于INRIA行人數(shù)據(jù)庫和PETS2006視頻庫。在提取強分辨力行人特征時,分別將INRIA樣本庫中的1 000個正、負樣本用于訓練和檢測,并利用強分辨力HOG行人特征分類器對PETS2006視頻庫的視頻行人進行檢測。實驗采用libsvm工具包,選用線性SVM訓練分類器。
 文中通過對單尺度基本HOG擴展,得到Block數(shù)為452的多尺度HOG,并利用Fisher準則分別對不同尺度HOG進行降維處理,獲得不同維數(shù)的強分辨力特征,結(jié)合SVM分類器驗證不同尺度、不同維度的特征檢測效果。實驗結(jié)果如表1所示。

 實驗表明,擴展后的多尺度HOG特征,SVM分類準確率顯著提高;相同特征維數(shù)下(表中只列出Block數(shù)為105、30、10的特征),多尺度特征比單尺度特征具有更高的檢測準確率且降維幅度越大,多尺度特征優(yōu)勢越明顯。
 文中采用設(shè)定最低檢測率來提高檢測速率,利用SVM分類的效果來選擇最佳分辨力特征。如表1所示,在多尺度下,當選取特征塊數(shù)為10時,保證了行人檢測的準確率,提取、檢測的速率比基本HOG都有所提高,檢測速率提高了9.7倍。本文取多尺度下Block數(shù)為10的特征集作為f′select,訓練分類器進行行人檢測和分類。
 實驗通過ROI目標區(qū)域提取,大大降低了檢測窗口數(shù)量,并與傳統(tǒng)HOG全局掃描算法、Adaboost[3,8]算法作比較。由于本文算法ROI目標區(qū)域大小直接受行人數(shù)量、大小影響,實驗選取統(tǒng)一的單行人視頻序列進行測試,幀像素大小為720×480。實驗結(jié)果如表2所示。

 參考文獻[3,8]提到的Adaboost算法是利用一系列弱分類器組合強分類器,根據(jù)每個樣本分類結(jié)果修改權(quán)值進行下一層分類訓練,訓練分類器時依次對每個特征集單獨訓練,耗費時間很長。本文算法采用Fisher準則提取的強分辨力行人特征訓練分類器,特征整體一次投影實現(xiàn)一次分類,具有優(yōu)勢。
實驗證明,本文算法比全局掃描減少了檢測窗數(shù)量,顯著提高了檢測的速率;在保證準確率的前提下改進單尺度HOG,利用多尺度降維HOG進一步提高行人的檢測速率。本文算法不僅大幅度提高了行人檢測的速率,而且保證了視頻行人檢測準確率在90%以上。
 本文針對傳統(tǒng)HOG特征在行人檢測中存在高維度計算的問題,提出一種利用視頻運動信息和強分辨力行人HOG特征相結(jié)合的視頻行人檢測算法。利用INRIA行人庫和PETS2006視頻庫驗證了算法的有效性。后續(xù)將針對夜間、雨天等復雜背景,進一步驗證和改進算法。
參考文獻
[1] 劉鑫,劉輝,強振平,等.混合高斯模型和幀間差分相融合的自適應(yīng)背景模型[J].中國圖象圖形學報,2008,4:729-734.
[2] 王成亮,周佳,黃晟.基于高斯混合模型與PCA_HOG的快速運動人體檢測[J].計算機應(yīng)用研究,2012,29(6):2156-2160.
[3] 周晨卉,王生進,丁曉青.基于局部特征級聯(lián)分類器和模板匹配的行人檢測[J].中國圖象圖形學報,2010,15(5):824-829.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR2005, 2005,1:886-893.
[5] 孫昀,劉富強,李志鵬.基于穩(wěn)定區(qū)域梯度直方圖的行人檢測方法[J].計算機輔助設(shè)計圖形學報,2012,24(3):372-377.
[6] 黃茜,顧杰鋒,楊文亮.基于梯度向量直方圖的行人檢測[J].科學技術(shù)與工程,2009(13):3646-3651.
[7] 姚雪琴,李曉華,周激流.基于邊緣對稱行和HOG的行人檢測方法[J].人工智能及識別技術(shù),2012,38(5):179-182.
[8] 種衍文,匡湖林,李清泉.一種基于多特征和機器學習的分級行人檢測方法[J].自動化學報.2012,38(3):375-381.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。