《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 結(jié)合結(jié)構(gòu)約束的人臉跟蹤算法研究
結(jié)合結(jié)構(gòu)約束的人臉跟蹤算法研究
2014年微型機與應(yīng)用第12期
李 鵬1, 王峰娟2
1. 中國電子科技集團公司 第三十八研究所,2. 安徽三聯(lián)學(xué)院安徽 合肥
摘要:  目標(biāo)跟蹤是人工智能領(lǐng)域中最重要的核心問題之一,在工農(nóng)業(yè)、娛樂及軍事領(lǐng)域都具有非常重要的應(yīng)用價值[1]。目前,在目標(biāo)跟蹤研究中,常用的方法主要分為基于模型的方法和模型無關(guān)的方法兩大類?;谀P偷姆椒ㄐ枰孪葘M跟蹤的目標(biāo)進行詳細(xì)的研究,手工標(biāo)注大量的樣本并建立目標(biāo)模型實現(xiàn)對目標(biāo)的跟蹤。這類方法前期工作量大,跟蹤過程的實時性差,而且難以適應(yīng)隨機變形的目標(biāo),特別是當(dāng)目標(biāo)較復(fù)雜,難以獲得精確的模型時,這類方法將完全失效。與模型無關(guān)的方法一般通過自動提取目標(biāo)特征和相似度比對實現(xiàn)目標(biāo)跟蹤過程。該類方法不需要事先知道目標(biāo)的先驗信息,可以在跟蹤過程中不斷對目標(biāo)特征進行學(xué)習(xí),來改善和豐富對目標(biāo)的理解。模型無關(guān)的方法能夠快速建立目標(biāo)跟蹤并在線學(xué)習(xí)以適應(yīng)目標(biāo)變化的特點,使其具有更好的應(yīng)用價值,是目前研究的熱點[2]。
Abstract:
Key words :

  摘要: 在分析人臉結(jié)構(gòu)特征的基礎(chǔ)上,通過引入人臉主要器官的結(jié)構(gòu)約束并結(jié)合改進的方向梯度直方圖特征和增量SVM, 提出了一種新的人臉跟蹤算法。實驗證明,該算法能夠顯著提高人臉跟蹤過程的穩(wěn)定性和準(zhǔn)確性,并具有良好的實時性能。

  關(guān)鍵詞: 人臉跟蹤;結(jié)構(gòu)信息;方向梯度直方圖;增量SVM

  目標(biāo)跟蹤是人工智能領(lǐng)域中最重要的核心問題之一,在工農(nóng)業(yè)、娛樂及軍事領(lǐng)域都具有非常重要的應(yīng)用價值[1]。目前,在目標(biāo)跟蹤研究中,常用的方法主要分為基于模型的方法和模型無關(guān)的方法兩大類?;谀P偷姆椒ㄐ枰孪葘M跟蹤的目標(biāo)進行詳細(xì)的研究,手工標(biāo)注大量的樣本并建立目標(biāo)模型實現(xiàn)對目標(biāo)的跟蹤。這類方法前期工作量大,跟蹤過程的實時性差,而且難以適應(yīng)隨機變形的目標(biāo),特別是當(dāng)目標(biāo)較復(fù)雜,難以獲得精確的模型時,這類方法將完全失效。與模型無關(guān)的方法一般通過自動提取目標(biāo)特征和相似度比對實現(xiàn)目標(biāo)跟蹤過程。該類方法不需要事先知道目標(biāo)的先驗信息,可以在跟蹤過程中不斷對目標(biāo)特征進行學(xué)習(xí),來改善和豐富對目標(biāo)的理解。模型無關(guān)的方法能夠快速建立目標(biāo)跟蹤并在線學(xué)習(xí)以適應(yīng)目標(biāo)變化的特點,使其具有更好的應(yīng)用價值,是目前研究的熱點[2]。

  人臉跟蹤是當(dāng)前目標(biāo)跟蹤領(lǐng)域研究的一個熱點,其在治安、娛樂、科研等領(lǐng)域具有很大的現(xiàn)實意義。人臉目標(biāo)介于剛體和柔性體之間,具有以下特點:人臉大致輪廓和內(nèi)部器官之間結(jié)構(gòu)關(guān)系相對穩(wěn)定;跟蹤過程中內(nèi)部結(jié)構(gòu)之間的空間位置存在變形,但滿足一定約束;內(nèi)部結(jié)構(gòu)本身的形狀和大小也可能存在變形。本文通過研究人臉目標(biāo)的結(jié)構(gòu)及外觀特點,提出了一種新的結(jié)合結(jié)構(gòu)約束的人臉跟蹤方法,其基本思想是,為人臉主要的器官(雙眼、嘴)建立獨立的描述和比較模塊,并對器官間的結(jié)構(gòu)約束進行建模,利用結(jié)構(gòu)信息輔助完成目標(biāo)搜索和評分,最終確定目標(biāo)位置。實驗證明,該方法進行人臉跟蹤的準(zhǔn)確度和穩(wěn)定性較傳統(tǒng)CamShift等算法有明顯提高,而且具有良好的實時性,具有較高的應(yīng)用價值。

  1 方法

  1.1人臉結(jié)構(gòu)約束

  人臉具有典型的結(jié)構(gòu)化特征,通常所謂的“五官”按照規(guī)則排列在人臉上,這些器官之間存在明顯的結(jié)構(gòu)約束,但又可以進行較大程度的變形[3-4]。在人臉跟蹤過程中,利用人臉各部分分別建模可以增加特征的穩(wěn)定性,提高跟蹤的精度[4];同時,引入各結(jié)構(gòu)之間的約束關(guān)系,能夠提高人臉跟蹤的適應(yīng)性,排除誤報。在人臉圖像中,五官中的雙眼、嘴往往具有較大的顯著性,而鼻子、耳朵特征一般較為模糊,特別是在光線、角度不理想的情況下,鼻子、耳朵常不能提供有效的特征。因此,本文以雙眼、嘴共3個面部主要器官為對象,對它們的空間結(jié)構(gòu)約束進行建模。定義評價函數(shù):

  111.jpg

  其中,Scorew為對于窗口圖像w的評分。等式右邊包括兩部分,第一部分為檢測圖像與目標(biāo)的特征相似度,本文通過方向梯度直方圖結(jié)合SVM獲得;第二部分為目標(biāo)各模塊之間的結(jié)構(gòu)化約束評分。為了兼顧跟蹤的準(zhǔn)確性和實時性要求,這里結(jié)構(gòu)信息采用了雙眼間向量(距離,角度)、嘴部與雙眼間向量(距離,角度)共6個約束形成的三角形作為結(jié)構(gòu)約束,如圖1所示。?姿1、?姿2分別是兩部分的權(quán)重因子。人臉跟蹤的過程就是尋找式(1)最小值的過程。

001.jpg

  1.2 改進的方向梯度直方圖

  方向梯度直方圖HOG(Histogram of Oriented Gradient)特征是一種常用的圖像特征描述子,如圖2所示,由法國國家計算機技術(shù)和控制研究所的DALAL N和TRIGGS B在2005年的CVPR上首次提出。由于其對幾何和光學(xué)變形具有良好的適應(yīng)性,HOG特征已經(jīng)被廣泛應(yīng)用于計算機視覺和圖像處理中[5]。通過計算和統(tǒng)計圖像局部區(qū)域的HOG來構(gòu)成特征。為了對各模塊進行特征提取并保證系統(tǒng)的實時性,本文根據(jù)人臉跟蹤的具體情況對經(jīng)典HOG算法進行了針對性的優(yōu)化,方法如下。

002.jpg

  (1)對輸入圖像進行顏色空間的標(biāo)準(zhǔn)化(Gamma校正法),以降低圖像局部的陰影和光照變化所造成的影響。

  (2)獲取滑動窗圖像并灰度化,將圖像統(tǒng)一為48×64大小的標(biāo)準(zhǔn)圖像。

  (3)計算圖像每個像素的方向梯度。

  (4)根據(jù)跟蹤的目標(biāo)大小,將圖像劃分成4像素×4像素的方格。

  (5)將360°按每個方向45°劃分為8個方向。與經(jīng)典HOG算法不同,本文根據(jù)每個像素的梯度方向,將其幅值線性差值計入與其方向相鄰的兩個方向通道內(nèi),統(tǒng)計每個方格的HOG。

  (6)將所有方格得到的HOG串聯(lián)起來便得到改進的HOG特征。

  與經(jīng)典算法相比,優(yōu)化的HOG特征簡化了圖像分塊策略,提高了特征計算的速度。同時,由于增加了方向差值過程,使方向梯度的穩(wěn)定性得到了較大提高,具有更好的抗噪聲性能。實驗證明,在本應(yīng)用中該特征在提高計算速度的前提下對圖像具有不低于經(jīng)典HOG算法的表征能力。

  1.3 增量SVM

  支持向量機(SVM) 是VAPNIK等人提出的一種經(jīng)典的機器學(xué)習(xí)方法,由于其優(yōu)越的學(xué)習(xí)能力,一經(jīng)提出就在國內(nèi)外學(xué)術(shù)界受到廣泛重視。SVM算法通過使用非線性映射將低維樣本映射到高維空間,并在高維空間使用結(jié)構(gòu)風(fēng)險最小化理論構(gòu)建全局最優(yōu)分割超平面,能夠使整個樣本空間的期望風(fēng)險以某個概率滿足一定上界[6]。

  雖然SVM具有很多優(yōu)勢,但其經(jīng)典理論并不具有增量學(xué)習(xí)的能力,即要求使用者在訓(xùn)練初期能夠收集一個相對完整的訓(xùn)練集[7]。對于非模型目標(biāo)跟蹤來說,在跟蹤初期,對目標(biāo)的描述和理解往往是片面的,很難獲得完善的訓(xùn)練集,因此需要在跟蹤過程中對學(xué)習(xí)機進行不斷的修正。如果使用經(jīng)典SVM訓(xùn)練方法,每次增加樣本時,需要對所有原始樣本重新訓(xùn)練,訓(xùn)練時間將隨著跟蹤的持續(xù)而不斷提升,最終導(dǎo)致不能實時跟蹤。為了解決這一問題,本文將核函數(shù)局部化算法引入SVM理論,實現(xiàn)在不顯著增加訓(xùn)練時間的前提下不斷更新樣本,使SVM分類精度可以隨著跟蹤的進行和樣本集的積累而逐步提高。需要特別指出的是,本文在式(1)中使用的是SVM的特征距離,而非SVM預(yù)測標(biāo)簽。

  首先按照經(jīng)典SVM訓(xùn)練方法得到初始分類器,經(jīng)典SVM的判別函數(shù)一般表示為:

  

222.png

  其中,K(·)為核函數(shù),獲得最優(yōu)超平面f和支持向量集SV。利用核函數(shù)的局部特征,當(dāng)跟蹤到目標(biāo)得到新的樣本后,驗證KKT條件:

  

333.png

  其中,非零?琢i為支持向量。判斷新樣本是否能被超平面f正確分類,如果新樣本能夠被正確分類,則說明該新樣本在分類內(nèi)部,此時不需要對分類器進行修正,即可進行下一輪跟蹤;如果不能被正確分類,則需要調(diào)整分類器。需要指出的是,當(dāng)新增樣本違背KKT條件時,原樣本集中非支持向量也可能轉(zhuǎn)化為支持向量,因此需要由新增樣本得到一個新的SVM來檢驗原始樣本是否違背KKT 條件。最終由所有支持向量與所有違背KKT條件的樣本組合構(gòu)成新的訓(xùn)練集,并得到最終的新的SVM。該增量學(xué)習(xí)方法不僅具有良好的數(shù)學(xué)基礎(chǔ),而且僅使用現(xiàn)有樣本中少量的樣本進行重新訓(xùn)練,大大降低了SVM的訓(xùn)練時間,提高了系統(tǒng)實時性[6]。

  2 結(jié)合結(jié)構(gòu)信息的人臉跟蹤算法

  綜合以上各部分,本文提出的算法具體流程如下:

  (1)獲取第一幀圖像并手動框定人臉及雙眼、嘴部區(qū)域,生成初始化樣本集。

  (2)提取雙眼、嘴部改進的方向梯度直方圖特征,訓(xùn)練初始SVM;計算結(jié)構(gòu)約束,初始化結(jié)構(gòu)參數(shù)。

  (3)取下一幀,搜索雙眼及嘴部候選區(qū)域,記錄SVM距離。

  (4)在候選區(qū)域中尋找最小化式(1)的區(qū)域,作為跟蹤結(jié)果。

  (5)根據(jù)跟蹤結(jié)果修正結(jié)構(gòu)參數(shù)。

  (6)每累計跟蹤10幀,利用新的正負(fù)樣本(正樣本為跟蹤到的目標(biāo),負(fù)樣本為搜索過程中獲得的目標(biāo)周圍的圖像區(qū)域)增量更新SVM。

  (7)返回到步驟(3),進行下一輪跟蹤。

  3 實驗

  實驗所用的計算機平臺為I3-2120 @3.30 GHz CPU,4 GB內(nèi)存,操作系統(tǒng)為Windows XP SP3。測試程序在MATLAB 2011b平臺下實現(xiàn)。本文選取了近年來比較著名的電影和電視劇中的片段作為測試對象。在這些片段第1幀用鼠標(biāo)框取了待跟蹤人臉及其雙眼和嘴部,從第2幀開始進行跟蹤,部分結(jié)果如圖3所示。將本文提出的算法與經(jīng)典CamShift算法相比較,結(jié)果如表1所示,可以看出本文算法在跟蹤精度上具有明顯優(yōu)勢。

003.jpg

004.jpg

  本文通過研究人臉的結(jié)構(gòu)特征,對人臉主要器官的結(jié)構(gòu)約束進行建模,并結(jié)合改進的HOG與增量SVM,開發(fā)出一種新的人臉跟蹤算法。實驗結(jié)果表明,本文提出的算法能夠在人臉跟蹤過程中更好地適應(yīng)目標(biāo)的角度變化和部分遮擋,跟蹤精度和穩(wěn)定性優(yōu)于傳統(tǒng)的CamShift算法,并能夠達到實時性要求。

  參考文獻

  [1] 馬曉路,劉倩,牟海軍.基于Mean Shift 和粒子濾波的運動目標(biāo)跟蹤[J].微型機與應(yīng)用,2012,31(23):42-44.

  [2] 張寶峰,趙建平,朱均超. 基于OpenCV的室內(nèi)環(huán)境下多目標(biāo)跟蹤[J].微型機與應(yīng)用, 2013,32(9):24-26.

  [3] Zhang Lu, Laurens van der Maaten. Structure PreservingObject Tracking[C]. 2013 IEEE Conference on Computer Vision and Pattern Recognition,2013:1838-1845.

  [4] BRANSON S, PERONA P, BELONGIE S. Strong superv-ision from weak annotation: interactive training of defor-mable part models[C]. 2011 IEEE International Conference on Computer Vision, 2011:1832-1839.

  [5] 王文武, 王華昌. 嵌入式客流量統(tǒng)計模塊的設(shè)計和實現(xiàn)[J].電子技術(shù)應(yīng)用,2011,37(8):33-35.

  [6] 牛勝石,毛曉暉,侯建華,等.基于Adaboost和SVM的人頭實時檢測[J].微型機與應(yīng)用,2010,13(1):33-36.

  [7] 潘以楨, 胡越明. 改進的在線支持向量機訓(xùn)練算法[J].計算機工程,2009,35(22):212-215.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。