摘 要: 針對MB_LBP算法對人臉特征提取維數較高,使用PCA方法會造成圖像原始空間結構破壞和維數變得過大等問題,提出一種基于多塊LBP(Multi-scale Block Local Binary Patterns, MB_LBP),結合改進的Fast PCA算法進行人臉特征提取的方案。首先用MB_LBP算法提取人臉圖像的特征,接著用本文所改進Fast PCA方法加速計算矩陣S非零本征值所對應的本征向量,對人臉特征進行降維,最后在ORL人臉庫進行驗證。實驗表明,該方法對后期人臉特征提取效果優(yōu)于改進前的效果,很大程度上降低了提取時間,效果明顯。
關鍵詞: MB_LBP算法;改進Fast PCA;人臉特征;維災
0 引言
特征提取在人臉識別中應用十分廣泛,如何更好地將圖像的特征提取應用于人臉識別是當前模式識別和人工智能領域的一個研究熱點,它涉及到計算機視覺、圖像處理、生理學等多個學科的知識背景。這種技術具有廣泛的應用前景,如身份識別、視頻監(jiān)控、國家安全、信息安全等領域。
人臉特征提取和分析是人臉識別中的重要過程。局部二進制模式(Local Binary Patterns,LBP)[1-2]的方法自從被Ahonen等人引入人臉識別后一直受到廣泛關注,它是最早作為一種有效紋理描述算子提出的,尤其對圖像局部紋理特征的卓越描述能力而獲得廣泛的應用。前述的LBP可以很精細地描述圖像的局部紋理信息,然而,也正是由于這種特征的局部化特點,使其易受噪聲的影響而不夠健壯,缺乏對圖像整體信息的粗粒度把握,因此MB_LBP代替LBP來提取圖像的特征。盡管MB_LBP算法可以很好地對圖像特征進行提取,但是此算法在提取圖像紋理特征時維數過高,對后期人臉識別計算量有所影響,會造成計算過程的復雜化。因此,在圖像特征提取時需要對其降維。PCA在特征降維中是一個經典的重要方法。在參考文獻[3]中所涉及的LBP和PCA結合的特征提取算法,從一定程度上提高了識別率,但是PCA原理是將圖像展開成高維的行向量和列向量,然后通過訓練樣本來計算樣本協方差矩陣,并由協方差矩陣組成的投影矩陣把原始訓練樣本中的高維向量投影成低維矩陣。但是這樣會造成圖像原始空間結構破壞和維數變得過大。因此,本文提出改進Fast PCA可加速計算矩陣S非零本征值所對應的本征向量,降低提取時間。將其與MB_LBP算法結合,在ORL人臉庫上進行實驗,效果有一定的優(yōu)越性。
1 MB_LBP算法
局部二進制模式(LBP)[4]是最早作為有效的紋理描述算子提出的,由于最初的LBP算法的映射過程相對簡單,僅僅提取到所給范圍內特征信息,對于類內的圖像識別具有一定的效果,但對于類間圖像的識別效果很難令人滿意。LBP算法只提取圖像特征,并沒有實現先驗信息的運用。LBP算法是直接在灰度圖像上實現特征提取,通過比較中心像素和鄰域像素之間的灰度值來實現二值化。一般采用固定大小(如3×3)的矩形方塊,對應窗口的局部紋理的分布則可以假設是局部區(qū)域內像素的聯合分布密度,以圖像的某個像素為中心點gc,對周圍的8個像素點g0,g1,…,g7的紋理T的分布定義如下:
T~(g0-gc,…,g7-gc)(1)
然后令中心點gc的灰度值作為參考,對鄰域8個像素點進行二值化處理,方法為:
T≈t(s(g0-gc),…,s(g7-gc))(2)
圖1給出一個基本LBP算子,圖中的3×3區(qū)域中心點以其灰度值88作為閾值對其8鄰域進行二值化,并且從左上點開始按照順時針方向將二值化結果組成一個二進制數10001011,即十進制139,作為中心的響應。在整個逐行掃描過程結束后,會得到一個LBP響應圖像,稱為LBP統(tǒng)計直方圖,也稱為LBP特征。
由于LBP的映射過程太簡單,并且易受噪聲干擾,穩(wěn)定性不強,所以利用MB_LBP[5-6]算法。該算法是在LBP算法的基礎上提出來的,把LBP算法中一個中心像素的應用開展到含有眾多像素的矩形區(qū)域,把該矩形區(qū)域的灰度平均值作為其閾值。用MBs_LBP表示像素塊大小為S×S的LBP算法。圖2為MB_LBP算法特征的圖像表示。
MB_LBP算法公式:
式中,gc表示圖像某個像素的中心點,gi表示周圍8個像素點。
由圖3可以看出,隨著像素塊大小S的增加,響應圖像中紋理增粗,并趨于穩(wěn)定,說明較大的像素塊有利于圖像中的粗粒度信息的把握。
2 Fast PCA算法
前面已講過單方面用MB_LBP算法提取的人臉特征維數較高,如果直接計算,計算量會很大,復雜度也很大。為了提高這一特性,本文將改進后的Fast PCA運用到特征提取過程中,提高識別效果。
特征提取過程包括了兩個方面[7]:訓練和識別。在訓練過程中,系統(tǒng)需要識別到樣品數據,并將這些樣品創(chuàng)建成一個特征矩陣,把圖像空間里的樣本轉換成特征空間里的點。把這些圖像樣本作為灰度圖像,并通過保持列向量的連續(xù)性,將樣本圖像從二維矩陣轉變成N2×1列向量一維矩陣。最后把這n幅圖像的列向量排列成維數為N2×n的圖像組X。
令m為矩陣X中數據向量的均值向量,定義如下:
通過X矩陣的所有列向量減去均值向量m,將數據矩陣的列向量視為中心,經過以上操作,從而得到協方差矩陣ST。定義為:
對其進行特征值分解,如下:
公式中V是與特征值?撰相關的特征向量組,根據從高到低對應的特征值設定特征矩陣的順序。其中特征向量的矩陣就是特征空間V,數據矩陣X被投影到特征空間,從而獲取由n列組成的P:
P=VTX(7)
在識別階段,正如上面說的,圖像S將被轉換成一維向量并形成J,然后都在映射到特征空間獲得Z。
Z=XTJ(8)
其中有個歐式距離d,它是Z和P中所有的投射樣品的距離。d用L2來計算,L2是圖像A和B的規(guī)范的歐氏距離:
最后把投射測試圖像與每個投影訓練圖像作比較,發(fā)現訓練圖像更加接近被用來識別的訓練圖像的測試圖像。
3 一種Fast PCA改進方法
3.1 預處理
本文針對Fast PCA[8-9]提出的改進方法是在訓練和識別階段中同時加進預處理這一過程。對于此方法,通過直方圖均值化過程進行結果比較,從而通過增加局部比較來調整圖像。這一過程對輸入圖像的灰度值進行了再分配,從而輸出圖像擁有了統(tǒng)一的灰度值分布。并且通過式(10),降低圖像灰度值變化和光不對稱效果的影響,將圖像進行歸一化:
式中:std和m分別表示標準差和輸入圖像灰度值的均值,ustd和um分別表示所期望的標準差和均值。
3.2 改進后算法流程
這一改進算法包括下面幾個步驟:
第一步:運用直方圖均值化和歸一化過程,對數據組訓練圖像進行預處理。
第二步:運用第2節(jié)中所提的MB_LBP進行特征提取,并在特征矩陣中存儲期望的值。
第三步:在特征矩陣中,根據不同特征的分類將其訓練圖像放到不同子集中,然后把這些值存儲到特征向量的一個列向量中。
第四步:輸入測試圖像。
第五步:像上面第二步和第三步一樣,將測試圖像進行特征提取和分類。
第六步:在同一組的訓練圖像作為測試圖像裝載到圖像組中。
第七步:在已有的圖像組中,運用Fast PCA去識別這些測試圖。
4 實驗及結果分析
本次實驗是在ORL人臉庫中進行的,旨在將MB_LBP與改進后的Fast PCA結合的方式在人臉特征提取方面的性能與其他傳統(tǒng)方式進行比較。該試驗方法是在MATLAB上選取30個不同人的灰度圖像完成的。原始圖像如圖4,30個訓練樣本圖像如圖5。
使用MB_LBP對如圖5的灰度圖像進行處理,用于對其提取特征,MB_LBP對于特征提取比以往的方法更加健壯,且對整體把握度更好,并且它的計算量不是很大。本文提出的針對于人臉識別的算法,在時間和維數上都有很好的效果。一張人臉包含了很多特征信息,例如眼睛、鼻子和嘴等,而且每個特征都有相應的一些值和權重。本次實驗中選用鼻子和嘴處紋理信息,在本次改進算法中,在訓練樣本數據中,根據這些特征的權重對人臉進行預分類,每個人臉將與一個特征子集相匹配[10]。
最后的比較結果如圖6和圖7所示。計算量在實際人臉識別應用中是相當重要的因素。從圖6可以看出,原來的Fast PCA的計算量比改進后的要大得多,時間隨著訓練集中的圖像數的增加比改進后的快得多,這里的時間是指消耗在訓練數據和識別上的總時間。在圖7中也可以看出,改進后算法的特征空間的維數很低,變化趨于穩(wěn)定,而改進前的維數隨著訓練圖像數的增加越來越大。
為了說明Proposed Fast PCA的優(yōu)越型,本文做了Fast PCA特征的人臉識別與Proposed Fast PCA特征的人臉識別比較試驗。結果如表1所示。
由表1可以看出,在ORL人臉庫上進行實驗,本文所提改進算法識別率最高,但由于實驗方法是MB_LBP算法與Proposed Fast PCA算法的結合,識別時間有些變長,但是可以發(fā)現,運用本文算法可以避免維數災難性增長的發(fā)生,人臉識別率明顯提高。后期隨著實驗平臺的提升,所提算法的人臉識別時間會有所減少,可見,本文算法具有一定的實用價值。
5 總結
通過實驗結果可以看出本文算法在計算量和特征空間維數方面有很好的效果。所改進的方法比較簡單,更重要的是對于特征提取進行了降維,識別率提升效果明顯。此方法更好地避免了維數災難,更有利于后面的人臉識別的進行。在以后的工作中將對算法進行進一步改進,以達到更好效果。
參考文獻
[1] 李良,高娜.基于LBP層次特征的表情識別算法[J].河南理工學報,2013,32(6):732-735.
[2] 歐陽琰,桑農.基于面部動作組合特征的表情識別[J].中國體視學與圖像分析,2011,16(1):38-43.
[3] LI W M, LI Y F, WU Y. A mode based method for overall well focused catadioptric image acquisition with multi-focal images[C]. proc of ICCAIP, 2009:648-653.
[4] 郭艷榮,蔣建國,郭世杰,等.基于LBP文理特征的隨機游走圖像分割[J].電路與系統(tǒng)學報,2013,18(1):357-364.
[5] 盧桂馥,林忠,金忠,等.基于最大差值的二維邊界Fisher的人臉識別[J].計算機科學,2010,37(5):251-253.
[6] FANG Y C, LUO J, LOU C S. Fusion of multi-driectional rotation invariant unform LBP features for face recognition[C]. Proceedings of the 3rd International Conference on Intelligent Information Technology Application, NJ, USA, 2009:332-335.
[7] SAJID I, AHMED M M, TAJ I. Design and implementation of a face recognition system using Fast PCA[J]. IEEE Translation on Computer Society, 2008,16(8):126-130.
[8] TUCK M, PENTLAND A. Eigenfaces for Recognition[J].Cognitive Neuroscience, 1999,3(1):71-86.
[9] 褚玉,李妮妮,劉軍清,等.基于均值濾波分頻的直方圖均衡方法[J].中山大學學報:自然科學版,2013,52(4):71-75,85.
[10] 張錚,王艷平,薛桂香.數字圖像處理與機器視覺[M].北京:人民郵電出版社,2010.