摘 要: 針對(duì)傳統(tǒng)BP算法收斂緩慢、訓(xùn)練過程振蕩等缺點(diǎn),提出了一種基于改進(jìn)Gamma和改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別算法。采用改進(jìn)Gamma矯正方法改善原始圖像的光照不均勻,并采用小波變換和NMF算法提取圖像主要特征,最后結(jié)合一種新的權(quán)值調(diào)整方法改進(jìn)BP算法進(jìn)行圖像分類識(shí)別。仿真實(shí)驗(yàn)表明,與傳統(tǒng)算法相比,使用該算法對(duì)Yale人臉庫、CMU PIE人臉庫和自建人臉庫的圖像進(jìn)行識(shí)別具有更快的收斂速度和更高的識(shí)別率。
關(guān)鍵詞: 人臉識(shí)別;小波變換;Gamma;非負(fù)矩陣分解;BP神經(jīng)網(wǎng)絡(luò)
0 引言
人臉識(shí)別技術(shù)具有易實(shí)現(xiàn)、非侵犯性好、事后追蹤能力強(qiáng)、安全性高和魯棒性強(qiáng)等特點(diǎn),因而在識(shí)別手段等方面已成為近年來的研究熱點(diǎn)[1]。但光照不均勻的人臉圖像會(huì)導(dǎo)致提取人臉特征不準(zhǔn)確和識(shí)別率低,并且傳統(tǒng)的BP算法收斂速度緩慢、訓(xùn)練過程易發(fā)生震蕩等[2]。針對(duì)上述問題,本文提出的改進(jìn)Gamma校正法能提高其自適應(yīng)性和減輕圖像失真,再采用小波變換與NMF算法提取、選擇標(biāo)準(zhǔn)化圖像的低頻部分特征,將得到的特征向量載入改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練或匹配。
1 基于NMF算法的特征提取
NMF算法是一種新的子空間分析方法,其基本思想是找到一個(gè)線性子空間W,非負(fù)性約束基圖像的像素點(diǎn)和重建系數(shù),使重建圖像由基圖像非減的疊加組合而成[3-4]。設(shè)V是n幅人臉圖像構(gòu)成的訓(xùn)練集,xi是一幅圖像的非負(fù)灰度值構(gòu)成的m維列向量,分別設(shè)線性逼近V的一組非負(fù)的基圖像矩陣W和V在W上的非負(fù)投影系數(shù)矩陣H,W∈Rm×r且H∈Rr×n,可分解為W與H的乘積:
2 改進(jìn)Gamma和改進(jìn)BP算法的人臉識(shí)別
2.1 改進(jìn)Gamma算法
傳統(tǒng)Gamma矯正根據(jù)憑借個(gè)人主觀判斷選取的一個(gè)固定的gamma值?酌進(jìn)行灰度映射,使各像素點(diǎn)均以該值進(jìn)行校正[5],矯正公式如(4)所示。
本文改進(jìn)的Gamma矯正法僅對(duì)原圖像高光和陰影部分進(jìn)行Gamma矯正,避免了傳統(tǒng)的Gamma矯正使圖像整體偏暗或偏亮。設(shè)圖像灰度值區(qū)間、角度值區(qū)間、Gamma值區(qū)間分別為P、Q、,P∈[0,255],其中點(diǎn)為tm,圖中某點(diǎn)的灰度值為t,取兩點(diǎn)f0和f1劃分P為3段:P0=[0,t0],P1=[t0,t1],P2=[t1,255],且t、t0、t1∈P,t0=tm-e,t1=tm+e。Gamma矯正實(shí)現(xiàn)了P到的間接一一對(duì)應(yīng)映射,使每個(gè)圖像像素均有一個(gè)Gamma值與之對(duì)應(yīng)。原始圖像I從P線性映射到對(duì)應(yīng)的的關(guān)系式為:
受加權(quán)系數(shù)a的影響,a越大,對(duì)光照補(bǔ)償?shù)倪m應(yīng)能力越強(qiáng),但由?酌變化起伏大引起的圖像失真的可能性也越大。鑒于此,本文在不同的P區(qū)間取不同的a值和修正函數(shù)f(t),具體如下:
其中,a、b均為加權(quán)系數(shù),鑒于修正前后的Gamma值均為一個(gè)非負(fù)實(shí)數(shù),所以a∈[0,0.5],b=0.5。則修正后的Gamma值(t)和圖像灰度值g(t)分別為:
2.2 改進(jìn)BP算法
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別(如圖1所示)采用的梯度下降算法收斂緩慢、訓(xùn)練過程震蕩、易陷入局部極小點(diǎn)[6],因此,本文提出了新的梯度下降法的權(quán)值調(diào)整方法以加快收斂速度。
設(shè)D(k)、D(k-1)分別表示k時(shí)刻和(k-1)時(shí)刻的負(fù)梯度,動(dòng)量因子[0,1],分別表示權(quán)值修正取決于當(dāng)前循環(huán)的負(fù)梯度和上一次循環(huán)的負(fù)梯度。權(quán)值調(diào)整公式如下:
設(shè)載入BP網(wǎng)絡(luò)中的樣本的理想輸出和實(shí)際輸出分別為Y和T,則樣本集的誤差測(cè)度E等于每個(gè)樣本誤差測(cè)度之和:
由式(13)可將權(quán)值調(diào)整公式轉(zhuǎn)換為式(15):
3 實(shí)驗(yàn)結(jié)果對(duì)比與分析
3.1 實(shí)驗(yàn)條件設(shè)置
為了驗(yàn)證本文改進(jìn)Gamma矯正法的優(yōu)越性,選取CMU PIE人臉庫、Yale人臉庫和自建人臉庫中不同光照、姿勢(shì)情況下的人臉圖像進(jìn)行試驗(yàn),如圖2所示。其中,Yale人臉庫包含15個(gè)人的165張圖像,選取CMU PIE人臉庫中15個(gè)人的200張圖像,自建人臉庫包含15個(gè)人的90幅圖像。
3.2 仿真過程
下面以Yale人臉庫為例采用本文方法的人臉識(shí)別系統(tǒng)(如圖3所示)進(jìn)行具體敘述。
?。?)訓(xùn)練階段:完成人臉圖像Gamma矯正等預(yù)處理和幾何歸一化。將整個(gè)Yale人臉圖像的低頻子帶部分按行排列成400維的向量,采用NMF算法分解所生成的矩陣V并提取特征,由式(1)知?酌=73。將訓(xùn)練樣本ti投影到W(400×73)得到對(duì)應(yīng)的73個(gè)NMF特征向量,并載入改進(jìn)BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)訓(xùn)練,在此輸入層節(jié)點(diǎn)數(shù)和隱含層節(jié)點(diǎn)數(shù)分別取73、127。
(2)測(cè)試階段:將75幅測(cè)試圖像作上述相同處理得到對(duì)應(yīng)的73個(gè)特征向量,并載入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)與之前保存的訓(xùn)練圖像對(duì)應(yīng)特征向量進(jìn)行判斷分類識(shí)別。
3.3 實(shí)驗(yàn)結(jié)果及分析
圖4給出了兩種不同的光照改善方法的效果,可以看出,本文提出的改進(jìn)Gamma矯正法較對(duì)比度拉伸法能提供更準(zhǔn)確的有用信息,提高了識(shí)別率。
經(jīng)過預(yù)處理和歸一化后的實(shí)驗(yàn)數(shù)據(jù)如表1所示。參考文獻(xiàn)[7]和[8]表明小波變換能得到特別適合人臉識(shí)別的特征向量。實(shí)驗(yàn)表明,本文采用的小波變換和NMF算法對(duì)不同的樣本之間存在明顯的差異,更適于提取人臉特征。
表2為三種圖像分類算法的仿真實(shí)驗(yàn)結(jié)果。從表2可以看出,本文的方法應(yīng)用在Yale人臉庫、CMU PIE人臉庫和自建人臉庫中的識(shí)別率較其他兩種方法的識(shí)別率有所提高。
該方法用在Yale人臉庫中的識(shí)別率較參考文獻(xiàn)[9]中的改進(jìn)BP算法與PCA結(jié)合的方法的識(shí)別率(如表3所示)有所提高。
所以本文提出的改進(jìn)BP算法對(duì)Yale人臉庫、CMU PIE人臉庫和自建人臉庫具有更快的收斂速度和更高的識(shí)別率。
4 結(jié)論
本文挖掘的算法在大型人臉庫中識(shí)別效果會(huì)更理想,且識(shí)別率隨著訓(xùn)練樣本數(shù)的增加而增大。主要體現(xiàn)在三點(diǎn):(1)改進(jìn)Gamma矯正方法能消除圖像光照不均勻;(2)采用小波變換與NMF算法結(jié)合能更好地呈現(xiàn)人臉局部特征;(3)改進(jìn)的BP算法能提高識(shí)別速度和識(shí)別率。但本文方法僅針對(duì)靜態(tài)圖像識(shí)別,對(duì)于動(dòng)態(tài)圖像則需引入如Mean Shift之類的目標(biāo)跟蹤法,獲取動(dòng)態(tài)目標(biāo)的圖像并幾何歸一化,再用本文方法增強(qiáng)圖像對(duì)比度和識(shí)別分類。
參考文獻(xiàn)
[1] 岳博.自適應(yīng)模式人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].長(zhǎng)春:吉林大學(xué),2013.
[2] 王愛平,萬國(guó)偉,程志全,等.支持在線學(xué)習(xí)的增量式極端隨機(jī)森林分類器[J].軟件學(xué)報(bào),2011,22(9):2059-2074.
[3] 趙書蘭.MATLAB R2008 數(shù)字圖像處理與分析實(shí)例教程[M].北京:化學(xué)工業(yè)出版社,2009.
[4] 邊肇祺,張學(xué)工.模式識(shí)別(第二版)[M].北京:清華大學(xué)出版社,2000.
[5] 呂卓紋.基于改進(jìn)Gamma校正的人臉光照補(bǔ)償方法[R].西安:Proceedings of the 32nd Chinese Control Conference, 2013:3733-3737.
[6] 許宜申,顧濟(jì)華,陶智,等.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的手寫字符識(shí)別[J].通信技術(shù),2011,5(44):106-109.
[7] Lai Jianhuang, YUEN P C, Feng Guocan. Face recognition using holistic fourier invariant features[J]. Pattern Recognition, 2001, 34(1): 95-109.
[8] Li Bai, Liu Yihui. When eigenfaces are combined with wavelets[J]. International Journal of Knowledge-Based Systems, 2002, 15(5):343-347.
[9] 李康順,李凱,張文生.一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識(shí)別算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,1(31):158-161.