《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于改進(jìn)Gamma和改進(jìn)BP算法的人臉識別研究
基于改進(jìn)Gamma和改進(jìn)BP算法的人臉識別研究
2015年微型機(jī)與應(yīng)用第4期
李國芳,王 力
(貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽 550025)
摘要: 針對傳統(tǒng)BP算法收斂緩慢、訓(xùn)練過程振蕩等缺點,提出了一種基于改進(jìn)Gamma和改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的人臉識別算法。采用改進(jìn)Gamma矯正方法改善原始圖像的光照不均勻,并采用小波變換和NMF算法提取圖像主要特征,最后結(jié)合一種新的權(quán)值調(diào)整方法改進(jìn)BP算法進(jìn)行圖像分類識別。仿真實驗表明,與傳統(tǒng)算法相比,使用該算法對Yale人臉庫、CMU PIE人臉庫和自建人臉庫的圖像進(jìn)行識別具有更快的收斂速度和更高的識別率。
Abstract:
Key words :

  摘  要: 針對傳統(tǒng)BP算法收斂緩慢、訓(xùn)練過程振蕩等缺點,提出了一種基于改進(jìn)Gamma和改進(jìn)BP神經(jīng)網(wǎng)絡(luò)人臉識別算法。采用改進(jìn)Gamma矯正方法改善原始圖像的光照不均勻,并采用小波變換和NMF算法提取圖像主要特征,最后結(jié)合一種新的權(quán)值調(diào)整方法改進(jìn)BP算法進(jìn)行圖像分類識別。仿真實驗表明,與傳統(tǒng)算法相比,使用該算法對Yale人臉庫、CMU PIE人臉庫和自建人臉庫的圖像進(jìn)行識別具有更快的收斂速度和更高的識別率。

  關(guān)鍵詞: 人臉識別;小波變換;Gamma;非負(fù)矩陣分解;BP神經(jīng)網(wǎng)絡(luò)

0 引言

  人臉識別技術(shù)具有易實現(xiàn)、非侵犯性好、事后追蹤能力強(qiáng)、安全性高和魯棒性強(qiáng)等特點,因而在識別手段等方面已成為近年來的研究熱點[1]。但光照不均勻的人臉圖像會導(dǎo)致提取人臉特征不準(zhǔn)確和識別率低,并且傳統(tǒng)的BP算法收斂速度緩慢、訓(xùn)練過程易發(fā)生震蕩等[2]。針對上述問題,本文提出的改進(jìn)Gamma校正法能提高其自適應(yīng)性和減輕圖像失真,再采用小波變換與NMF算法提取、選擇標(biāo)準(zhǔn)化圖像的低頻部分特征,將得到的特征向量載入改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練或匹配。

1 基于NMF算法的特征提取

  NMF算法是一種新的子空間分析方法,其基本思想是找到一個線性子空間W,非負(fù)性約束基圖像的像素點和重建系數(shù),使重建圖像由基圖像非減的疊加組合而成[3-4]。設(shè)V是n幅人臉圖像構(gòu)成的訓(xùn)練集,xi是一幅圖像的非負(fù)灰度值構(gòu)成的m維列向量,分別設(shè)線性逼近V的一組非負(fù)的基圖像矩陣W和V在W上的非負(fù)投影系數(shù)矩陣H,W∈Rm×r且H∈Rr×n,可分解為W與H的乘積:

  123.png

2 改進(jìn)Gamma和改進(jìn)BP算法的人臉識別

  2.1 改進(jìn)Gamma算法

  傳統(tǒng)Gamma矯正根據(jù)憑借個人主觀判斷選取的一個固定的gamma值?酌進(jìn)行灰度映射,使各像素點均以該值進(jìn)行校正[5],矯正公式如(4)所示。

  4+.png

  m4.png

  本文改進(jìn)的Gamma矯正法僅對原圖像高光和陰影部分進(jìn)行Gamma矯正,避免了傳統(tǒng)的Gamma矯正使圖像整體偏暗或偏亮。設(shè)圖像灰度值區(qū)間、角度值區(qū)間、Gamma值區(qū)間分別為P、Q、,P∈[0,255],其中點為tm,圖中某點的灰度值為t,取兩點f0和f1劃分P為3段:P0=[0,t0],P1=[t0,t1],P2=[t1,255],且t、t0、t1∈P,t0=tm-e,t1=tm+e。Gamma矯正實現(xiàn)了P到的間接一一對應(yīng)映射,使每個圖像像素均有一個Gamma值與之對應(yīng)。原始圖像I從P線性映射到對應(yīng)的的關(guān)系式為:

  58.jpg

  受加權(quán)系數(shù)a的影響,a越大,對光照補(bǔ)償?shù)倪m應(yīng)能力越強(qiáng),但由?酌變化起伏大引起的圖像失真的可能性也越大。鑒于此,本文在不同的P區(qū)間取不同的a值和修正函數(shù)f(t),具體如下:

  10.png

  其中,a、b均為加權(quán)系數(shù),鑒于修正前后的Gamma值均為一個非負(fù)實數(shù),所以a∈[0,0.5],b=0.5。則修正后的Gamma值(t)和圖像灰度值g(t)分別為:

  11.png

    12.png

  2.2 改進(jìn)BP算法

001.jpg

  傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的人臉識別(如圖1所示)采用的梯度下降算法收斂緩慢、訓(xùn)練過程震蕩、易陷入局部極小點[6],因此,本文提出了新的梯度下降法的權(quán)值調(diào)整方法以加快收斂速度。

  設(shè)D(k)、D(k-1)分別表示k時刻和(k-1)時刻的負(fù)梯度,動量因子[0,1],分別表示權(quán)值修正取決于當(dāng)前循環(huán)的負(fù)梯度和上一次循環(huán)的負(fù)梯度。權(quán)值調(diào)整公式如下:

  13.png

  設(shè)載入BP網(wǎng)絡(luò)中的樣本的理想輸出和實際輸出分別為Y和T,則樣本集的誤差測度E等于每個樣本誤差測度之和:

  14.png

  由式(13)可將權(quán)值調(diào)整公式轉(zhuǎn)換為式(15):

  1517.png

3 實驗結(jié)果對比與分析

  3.1 實驗條件設(shè)置

002.jpg

  為了驗證本文改進(jìn)Gamma矯正法的優(yōu)越性,選取CMU PIE人臉庫、Yale人臉庫和自建人臉庫中不同光照、姿勢情況下的人臉圖像進(jìn)行試驗,如圖2所示。其中,Yale人臉庫包含15個人的165張圖像,選取CMU PIE人臉庫中15個人的200張圖像,自建人臉庫包含15個人的90幅圖像。

  3.2 仿真過程

003.jpg

  下面以Yale人臉庫為例采用本文方法的人臉識別系統(tǒng)(如圖3所示)進(jìn)行具體敘述。

  (1)訓(xùn)練階段:完成人臉圖像Gamma矯正等預(yù)處理和幾何歸一化。將整個Yale人臉圖像的低頻子帶部分按行排列成400維的向量,采用NMF算法分解所生成的矩陣V并提取特征,由式(1)知?酌=73。將訓(xùn)練樣本ti投影到W(400×73)得到對應(yīng)的73個NMF特征向量,并載入改進(jìn)BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)訓(xùn)練,在此輸入層節(jié)點數(shù)和隱含層節(jié)點數(shù)分別取73、127。

 ?。?)測試階段:將75幅測試圖像作上述相同處理得到對應(yīng)的73個特征向量,并載入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)與之前保存的訓(xùn)練圖像對應(yīng)特征向量進(jìn)行判斷分類識別。

  3.3 實驗結(jié)果及分析

004.jpg

  圖4給出了兩種不同的光照改善方法的效果,可以看出,本文提出的改進(jìn)Gamma矯正法較對比度拉伸法能提供更準(zhǔn)確的有用信息,提高了識別率。

005.jpg

  經(jīng)過預(yù)處理和歸一化后的實驗數(shù)據(jù)如表1所示。參考文獻(xiàn)[7]和[8]表明小波變換能得到特別適合人臉識別的特征向量。實驗表明,本文采用的小波變換和NMF算法對不同的樣本之間存在明顯的差異,更適于提取人臉特征。

006.jpg

  表2為三種圖像分類算法的仿真實驗結(jié)果。從表2可以看出,本文的方法應(yīng)用在Yale人臉庫、CMU PIE人臉庫和自建人臉庫中的識別率較其他兩種方法的識別率有所提高。

  該方法用在Yale人臉庫中的識別率較參考文獻(xiàn)[9]中的改進(jìn)BP算法與PCA結(jié)合的方法的識別率(如表3所示)有所提高。

007.jpg

  所以本文提出的改進(jìn)BP算法對Yale人臉庫、CMU PIE人臉庫和自建人臉庫具有更快的收斂速度和更高的識別率。

4 結(jié)論

  本文挖掘的算法在大型人臉庫中識別效果會更理想,且識別率隨著訓(xùn)練樣本數(shù)的增加而增大。主要體現(xiàn)在三點:(1)改進(jìn)Gamma矯正方法能消除圖像光照不均勻;(2)采用小波變換與NMF算法結(jié)合能更好地呈現(xiàn)人臉局部特征;(3)改進(jìn)的BP算法能提高識別速度和識別率。但本文方法僅針對靜態(tài)圖像識別,對于動態(tài)圖像則需引入如Mean Shift之類的目標(biāo)跟蹤法,獲取動態(tài)目標(biāo)的圖像并幾何歸一化,再用本文方法增強(qiáng)圖像對比度和識別分類。

  參考文獻(xiàn)

  [1] 岳博.自適應(yīng)模式人臉識別系統(tǒng)的設(shè)計與實現(xiàn)[D].長春:吉林大學(xué),2013.

  [2] 王愛平,萬國偉,程志全,等.支持在線學(xué)習(xí)的增量式極端隨機(jī)森林分類器[J].軟件學(xué)報,2011,22(9):2059-2074.

  [3] 趙書蘭.MATLAB R2008 數(shù)字圖像處理與分析實例教程[M].北京:化學(xué)工業(yè)出版社,2009.

  [4] 邊肇祺,張學(xué)工.模式識別(第二版)[M].北京:清華大學(xué)出版社,2000.

  [5] 呂卓紋.基于改進(jìn)Gamma校正的人臉光照補(bǔ)償方法[R].西安:Proceedings of the 32nd Chinese Control Conference, 2013:3733-3737.

  [6] 許宜申,顧濟(jì)華,陶智,等.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的手寫字符識別[J].通信技術(shù),2011,5(44):106-109.

  [7] Lai Jianhuang, YUEN P C, Feng Guocan. Face recognition using holistic fourier invariant features[J]. Pattern Recognition, 2001, 34(1): 95-109.

  [8] Li Bai, Liu Yihui. When eigenfaces are combined with wavelets[J]. International Journal of Knowledge-Based Systems, 2002, 15(5):343-347.

  [9] 李康順,李凱,張文生.一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識別算法[J].計算機(jī)應(yīng)用與軟件,2014,1(31):158-161.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。