摘 要: 采用基于非線性核空間的主分量分析法(KPCA)和線性主元空間鑒別分析法(LDA)相結(jié)合的算法,首先將人臉圖像在非線性高維空間中進(jìn)行主成分分量降維,然后采用基于主元空間的LDA方法對(duì)子空間再度降維,同時(shí)利用歐式距離分類器(KNN)對(duì)樣本進(jìn)行有效的分類識(shí)別。采用Matlab和ORL人臉庫對(duì)該算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)證明,該算法識(shí)別性能顯著提高,明顯優(yōu)于其他算法。
關(guān)鍵詞: PCA; LDA; KPCA; 核函數(shù); 歐氏距離分類; ORL人臉庫
近些年,人臉識(shí)別已成為計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域中的熱門課題,有著廣闊的應(yīng)用前景。眾所周知,人臉識(shí)別是典型的高維數(shù)據(jù)分類問題,即人臉的原始特征對(duì)應(yīng)高維空間中矩陣數(shù)據(jù)的圖像,然而在人臉識(shí)別中直接應(yīng)用這些數(shù)據(jù)會(huì)使計(jì)算速度明顯降低,不利于現(xiàn)代科學(xué)領(lǐng)域?qū)θ四樧R(shí)別速度和精度的要求。現(xiàn)今人臉識(shí)別領(lǐng)域中面臨的問題是提取什么樣的特征利于分類器的分類以及如何減少高維數(shù)據(jù)的運(yùn)算等。迄今為止,線性子空間方法在特征提取中得到了廣泛的發(fā)展,其中主成分分析(PCA)[1]和線性鑒別分析(LDA)[2]方法是人臉識(shí)別中廣為采用的基本方法。盡管這些子空間方法在人臉識(shí)別中得到了比較成功的應(yīng)用,但人臉表觀由于受外在和內(nèi)在因素的影響,如臉部表情、臉部姿態(tài)(或照相機(jī)視角)、光照以及人臉形狀和皮膚的反射特性等,人臉空間更可能存在于非線性子空間上。
近十年來,核函數(shù)技術(shù)在模式識(shí)別領(lǐng)域中得到了迅猛的發(fā)展。SCHFILKOPF 等利用核技術(shù)將經(jīng)典的主分量分析(PCA)推廣到核主分量分析(KPCA) [3],實(shí)驗(yàn)結(jié)果表明,KPCA不僅能夠抽取非線性特征,而且具有更優(yōu)的識(shí)別結(jié)果。
受KPCA的啟發(fā),本文首先采用KPCA方法,將高維圖像投影到低維的子空間中,然后在子空間中進(jìn)一步采用基于主元空間的線性鑒別分析(LDA)和歐氏距離最近鄰分類(KNN)相結(jié)合的方法,有效地利用了人臉的非線性信息,同時(shí)兩次投影之后,提高了計(jì)算機(jī)的識(shí)別速率和準(zhǔn)確率。
1主成分分析方法的實(shí)現(xiàn)
1.1基本PCA方法
PCA的主要思想是尋找一組單位正交向量基,用其線性組合重構(gòu)原樣本,使得重構(gòu)后的樣本和原樣本的均方誤差最小[4]。在實(shí)際計(jì)算中,通過求取樣本投影之后的協(xié)方差矩陣的特征值和特征向量對(duì)樣本進(jìn)行描述,以達(dá)到降低特征空間維數(shù)的目的,具體如下:
這樣Y就是X經(jīng)PCA變換后得到的特征子空間,達(dá)到將訓(xùn)練樣本從高維空間降到低維子空間的目的。
1.2 KPCA方法的實(shí)現(xiàn)
PCA是最基本的無監(jiān)督線性子空間降維方法,且由上述可知,PCA通過選取最優(yōu)特征向量基Wr獲得最佳投影子空間。但PCA是線性方法,只能揭示人臉圖像中的線性信息,忽略了數(shù)據(jù)中的非線性信息。20世紀(jì)90年代以來,基于核的非線性特征提取法得到了發(fā)展,該方法有效地利用了人臉圖像的非線性信息[5]。本文通過核映射將樣本數(shù)據(jù)映射到核空間中,然后在核空間中運(yùn)用PCA法對(duì)高維空間中的人臉信息進(jìn)行非線性操作,進(jìn)而投影到線性低維子空間中。該方法稱為核主成分分析法,即KPCA。具體方法如下:
3 算法描述
本文采用Matlab仿真工具對(duì)算法進(jìn)行仿真,驗(yàn)證各算法的實(shí)現(xiàn)效果。訓(xùn)練樣本和測(cè)試樣本均采用ORL人臉庫,該庫由40人組成,每人由10幅112×92的圖像組成 。具體算法實(shí)現(xiàn)過程如圖1所示。
(1) 讀入ORL人臉庫圖像,為了提高運(yùn)算速度,降低圖像維數(shù),適當(dāng)調(diào)節(jié)圖片大小。隨機(jī)選取每人的5幅圖像作為訓(xùn)練樣本,其余的5幅圖像作為測(cè)試樣本。即200幅訓(xùn)練樣本圖像,200幅測(cè)試樣本圖像。
4 實(shí)驗(yàn)結(jié)果分析
4.1核空間參數(shù)的選取
核參數(shù)α的選取及實(shí)現(xiàn)結(jié)果如表1所示。
4.2 Matlab仿真效果圖
(1)利用KPCA對(duì)訓(xùn)練樣本圖像首次投影后得到的特征臉如圖2所示。
(2) 采用LDA再次降維并用KNN分類,最終得到的識(shí)別對(duì)比效果圖如3所示。
4.3 各種算法的對(duì)比
本文在ORL人臉庫下,應(yīng)用Matlab分別驗(yàn)證了基本PCA、主元空間LDA、PCA+LDA、KPCA、KPCA+LDA以及KPCA+LDA+KNN等算法的識(shí)別率、投影向量個(gè)數(shù)、訓(xùn)練時(shí)間、測(cè)試時(shí)間等各項(xiàng)指標(biāo),具體結(jié)果如表2所示。
由表2可以看出,采用基于KPCA+LDA+KNN算法的人臉識(shí)別率和其他各項(xiàng)指標(biāo)皆明顯高于其余五種方法,這主要是因?yàn)椴捎肒PCA可以更好地分析圖像空間中的非線性關(guān)系,比起只采用線性PCA和線性LDA方法明顯減少了人臉高維空間中信息的丟失。同時(shí)利用基于主元空間LDA的方法,加之KNN最近鄰分類器的使用,有效地降低了投影向量個(gè)數(shù),加快了計(jì)算速度。
本文提出的KPCA+LDA+KNN算法中,不但采用了非線性子空間降維方法,同時(shí)采用了基于主元空間LDA的方法,加之融入歐氏距離最近鄰分類器的方法,從而改善了人臉識(shí)別的效果。本文提出的算法不僅能夠使高度復(fù)雜和非線性的原始樣本線性化、簡單化, 而且能夠使樣本特征之間的冗余信息明顯降低,防止有用信息的丟失[9]。最后本文在ORL人臉庫下,應(yīng)用Matlab驗(yàn)證了該算法的有效性,但是不同核函數(shù)的選取以及不同分類器的使用對(duì)提高該算法的識(shí)別性是否有效,有待于進(jìn)一步的研究[10]。
參考文獻(xiàn)
[1] BATUR A U, HAYES M H I. Linear subspaces for illumi2 nation robust face recognition[A]. Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition[C].2001,02:296-301.
[2] SHAKUNAGA T,SHIGENARI K.Decomposed eigenface for face recognition under various lighting conditions[A]. Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition [C].2001,01(1):864-871.
[3] LIU C J, HARRY W. Enhanced fisher linear discriminant models for face recognition.140Inter.ConL on Pattern Reco gnition.ICPR’98,Queensland,ustralia'V01.II,PP[M].1998: 1368-1372.
[4] 鐘向陽,胡仕明.基于主分量線性判別方法人臉識(shí)別系統(tǒng)的實(shí)現(xiàn)[J].嘉應(yīng)學(xué)院學(xué)報(bào)(自然科學(xué)),2006,24(3):832-887.
[5] SEHOLKOPF B, SMOLA A, MULLER K R.Kernel principal component analysis[A].In:W.Gerstner,edi:Proceedings of International Conference on Artificial Neural Networks Lecture Notes in Computer Science[C]. Berlin:Springer,1997, 1327:583-588.
[6] ROTH V,STEINHAGE V. Nonlinear diseriminant analysis using kernel functions[A]. In:Solla S A,Leen T K,Muller K.R, editors.Advance in Neural information Processing Systems 12[C]. Cambridge,MA,USA: MIT Press,2000:568-574.
[7] CHEN L, IIAO H, KOM,et a1. Anew LDA based face recognition system which can solve the small sample size problem[J]. Pattern Recognition,2000,(33):1713-1726.
[8] YANG Jian, FRANGI A F, YANG Jing Yu, et a1. KPCA Plus LDA: acomplete kernel fisher discriminant framework for feature extraction and recognition[J].IEEE Transactions on Pattern Analysis Machine Intelligence, 2005,27 (2):230-244.
[9] 王婷,楊國勝,薛長松.若干人臉識(shí)別算法的比較研究[J].河南大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,37(2):192-194.
[10] GUNTURK B K, BATUR A U, ALTUNBASAK Y, et al. Eigenface-based super-resolution for face recognition [A]. Proceedings.International Conference on Image Processing[C].2002,(2):845-848.