摘 要: 為解決HOG行人檢測過程緩慢的問題,在梯度向量直方圖HOG中引入block權重的概念,通過合理篩選block,組成行人的特征向量,然后使用線性SVM作為分類器,重新進行學習,達到減少信息冗余、提高檢測效率的目的。在INRIA庫上進行實驗,結果表明,通過合理選擇block,能夠在不影響檢測效果的情況下,顯著減少block的數(shù)目,達到提高檢測速度的目的。
關鍵詞: HOG;行人檢測;SVM分類器;block權重
計算機視覺處理是計算機人工智能的一個重要研究方向,它的最終目標是通過計算機模擬人類視覺,實現(xiàn)對現(xiàn)實場景的理解和推理。其中,對于輸入場景通過計算機實現(xiàn)目標的自動識別分類,即目標識別,是實現(xiàn)計算機視覺的一個基礎部分,也是目前的一個研究熱點。比較成功的商業(yè)化應用實例是人臉識別系統(tǒng),它是通過計算機對人臉的智能識別,實現(xiàn)對不同人身份的確認。在人體識別方面,由于人體自身姿態(tài)、衣著的多樣性以及人體外觀變化大,目前尚沒有較為成熟的算法。
目前,人體識別主要有基于多模板匹配[1]、基于邊緣輪廓特征[2]和基于運動特征[3]等各種方法。然而,從實際效果來看,目前最好的是DALAL N和TRIGGS B提出的基于HOG特征的人體檢測方法[4]。DALAL N等人通過使用16×16大小的塊在檢測窗口中滑動,然后按一定方式統(tǒng)計塊中的梯度向量直方圖,將各個塊的梯度向量直方圖串聯(lián),組成特征向量,最終利用SVM對獲取的特征向量進行訓練,獲取分類器。按照該方法,如果選擇檢測窗口大小是128×64,block大小為16×16,cell大小為4×4,bin分為9個方向,每次block移動8,那么獲得的向量大小為3 780維,檢測效果雖然理想,但是耗時,難以達到實時性的要求。
本文通過對基于HOG特征的人體檢測算法進行分析,提出了一種基于感興趣區(qū)域進行HOG提取的算法。該算法在適當影響檢測效果的條件下,能夠較好地減少計算量,達到提高計算速度的目的。
1 行人檢測算法
1.1 特征選取
HOG是DALAL N等人在2005年提出的一種基于梯度的特征提取過程,它的內容主要有4點:(1)使用梯度作為特征提取對象,將梯度向量劃分為統(tǒng)計bin;(2)將梯度向量圖劃分為網格狀的cell,以cell為單位統(tǒng)計梯度向量直方圖;(3)以block為單位,對cell進行統(tǒng)計,得到三維梯度向量直方圖,并進行歸一化,減少局部光照的影響;(4)收集所有的block,合并成最終圖像的HOG特征向量。
分別利用3種不同的方法通過改變決策函數(shù)中的閾值b對測試樣本進行檢測,得到漏警率和虛警率的關系如圖4所示。
由圖4可以看出,在3種檢測方式中,原始HOG檢測方式檢測效果最好;通過人工選擇感興趣區(qū)域,保留41個block后提取特征向量進行分類,檢測效果有一定的下降,這主要是由于人類主觀經驗的不足,不能完全合理確定起主要作用的特征,導致特征選擇不充分的原因。
二次block訓練的方法通過引入block權重的概念,利用原始訓練得到的決策函數(shù)中的信息來確定感興趣block,在選取的block數(shù)目減少到原始的1/5即20個時,在顯著提高計算速度的情況下仍然能夠得到較精確的分類器。
實驗結果證明,本文提出的兩種減少特征維數(shù)、提高分類效率的算法在實際的應用中較為有效。
HOG特征是目前在行人檢測過程中較為有效的一種方法,在人體檢測過程中有著很高的識別率,然而HOG由于計算量較大、檢測速度慢,因此限制了HOG的應用。本文通過對HOG的分析,發(fā)現(xiàn)可以通過減少HOG中冗余block,從而減少計算量,提高檢測速度。
參考文獻
[1] 呂治國,徐昕,賀漢根.基于可變模板和支持向量機的人體檢測[J].計算機應用,2007(9):2258-2261.
[2] 陳實,馬天駿,黃萬紅,等.基于形狀上下文描述子的步態(tài)識別[J].模式識別與人工智能,2007(6):794-799.
[3] 韓鴻哲,王志良,劉冀偉,等.基于線性判別分析和支持向量機的步態(tài)識別[J].模式識別與人工智能,2005(2):160-164.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. CVPR’05, 2005.
[5] 焦李成,周偉達,張莉,等. 智能目標識別與分類[M].北京:科學出版社,2010.