摘 要: 提出了一種優(yōu)化的LMNLDA的人臉識(shí)別方法。為了減弱邊緣類對(duì)投影方向的主導(dǎo)作用,重新定義類間散度矩陣,克服了邊緣類對(duì)選擇最佳投影方向的影響,從而達(dá)到最優(yōu)化。同時(shí),在計(jì)算特征值時(shí)通過因數(shù)分解的方法避免了對(duì)矩陣求逆,解決了小樣本問題。在人臉數(shù)據(jù)庫(kù)YALE、ORL和PIE上進(jìn)行試驗(yàn),證明實(shí)驗(yàn)結(jié)果的有效性。
關(guān)鍵詞: 線性判別分析;散度矩陣;最大邊際近鄰元分析 ;邊緣類;人臉識(shí)別
人臉識(shí)別特指利用分析比較人臉視覺特征星系進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù),是一項(xiàng)熱門的計(jì)算機(jī)技術(shù)研究,它屬于生物特征識(shí)別技術(shù),是人工智能與模式識(shí)別領(lǐng)域以及計(jì)算機(jī)視覺領(lǐng)域最富挑戰(zhàn)性的研究課題之一。特征提取是人臉識(shí)別中極其關(guān)鍵的一步。線性判別分析(LDA)也叫做Fisher線性判別(FLD),是模式識(shí)別的經(jīng)典算法,其基本思想是將高維的樣本投影到低維最佳鑒別矢量空間,投影后保證樣本在該空間中有最佳的可分離性。但LDA算法過度強(qiáng)調(diào)了邊緣類與其他類的類間距離大小,導(dǎo)致在投影空間中近鄰類樣本的重疊。LDA算法在人臉識(shí)別應(yīng)用中常遇到兩個(gè)問題:(1)SSS小樣本問題(Small Sample Size)[1];(2)邊緣類的存在造成投影空間中近鄰樣本重疊的問題。而一種改進(jìn)的LDA算法——最大邊際近鄰元判別分析方法(LMNLDA)可以有效地克服樣本類間數(shù)據(jù)重疊,增加了樣本間的相似度來描述數(shù)據(jù)之間關(guān)系,于是重新定義散度矩陣,從而得到該判別準(zhǔn)則。
如圖1所示,考慮一個(gè)M維的樣本模型投影到一維空間,假定有一個(gè)邊緣類4與類1、類2、類3相隔較遠(yuǎn),則根據(jù)傳統(tǒng)LDA算法得到的最佳投影方向A夸大了與其他3個(gè)類的類間距離較大的、可分性很好的類4,但卻造成了類間距離本來就小的類1、類2、類3的彼此重疊。因此,就分類性而言,基于Fisher準(zhǔn)則得到的鑒別方向并不是最優(yōu)的,最大邊際近鄰元判別分析方法同樣沒有對(duì)這類問題進(jìn)行解決。
3 實(shí)驗(yàn)結(jié)果
為了測(cè)試優(yōu)化的LMNLDA算法的識(shí)別性能,本文采用Yale人臉數(shù)據(jù)庫(kù)、ORL人臉數(shù)據(jù)庫(kù)和PIE人臉數(shù)據(jù)庫(kù)進(jìn)行了識(shí)別對(duì)比實(shí)驗(yàn)。
3.1 采用Yale人臉數(shù)據(jù)庫(kù)的實(shí)驗(yàn)
采用國(guó)際通用的Yale人臉數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由15人,每人11幅,共165幅人臉正面256級(jí)灰度圖像組成,每幅圖像大小為243 mm×320 mm。其中有些圖像是拍攝于不同時(shí)期的,人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,人臉姿態(tài)也有相當(dāng)程度的變化。圖2所示為預(yù)處理后的同一個(gè)人的人臉圖像,共選擇105個(gè)圖像為訓(xùn)練集,其余的60個(gè)圖像為測(cè)試集。
3.2 采用ORL人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)
ORL人臉數(shù)據(jù)庫(kù)由劍橋大學(xué)實(shí)驗(yàn)室1992年4月到1994年4月拍攝的一系列人臉圖像組成,具體為40個(gè)人,每個(gè)人由不同表情或不同視點(diǎn)的10幅圖像構(gòu)成,傾斜角度不超過20°。人臉庫(kù)中某一人的10幅圖像如圖3所示,一共選擇了280個(gè)圖像為訓(xùn)練集,其余的120個(gè)圖像為測(cè)試集。
3.3 采用PIE人臉數(shù)據(jù)庫(kù)的實(shí)驗(yàn)
PIE人臉數(shù)據(jù)庫(kù)擁有68人,有不同的姿勢(shì),不同的燈光條件,以及不同的明暗表情等差別,其中包括了每個(gè)人的 13 種姿態(tài)條件,43種光照條件和4種表情下的照片。如圖4所示的一部分圖像,一共選擇340個(gè)圖像為訓(xùn)練集,其余的11 214個(gè)圖像為測(cè)試集。
3.4 實(shí)驗(yàn)結(jié)果分析
如表1、表2、表3表示5種方法在取相同特征維數(shù)的情況下的識(shí)別率比較,通過對(duì)3種人臉數(shù)據(jù)庫(kù)的實(shí)驗(yàn)結(jié)果對(duì)比可以看出,本文所提出的優(yōu)化的LMNLDA算法的識(shí)別率比其余4種方法的識(shí)別率都要高,5種算法呈現(xiàn)一個(gè)大體的趨勢(shì),就是在一個(gè)確定的維數(shù)即本征維數(shù)上識(shí)別率最高,維數(shù)越大,識(shí)別率越趨于平衡。從以上的實(shí)驗(yàn)結(jié)果可以看出,在相同特征維數(shù)的情況下OLMNLDA優(yōu)于其余4種算法,克服了邊緣類對(duì)選擇最佳投影
方向的影響,進(jìn)而能得到較為滿意的效果。實(shí)驗(yàn)結(jié)果充分證明了本文算法的有效性。
參考文獻(xiàn)
[1] BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J,et al.Fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[2] 張賢達(dá).矩陣分析與應(yīng)用[M].北京:清華大學(xué)出版社,2004.
[3] KILIAN Q,WEINBERGER L K,SAUL.Distance metric distance metric learning for large margin nearest neighbor classifiers[J].Journal of Machine Learning Research,2009(10):207-244.
[4] CHEN L,LIAO H,KO M,et al.A new lda-basedface recognition system which can solve the small sample size problem[J].Pattern Recognition, 2000,33(10):1713-1726.
[5] MARTINEZ A M,ZHU M.Where are linear featureextraction methods applicable[J].IEEE Trans. On Pattern Analysis and Machine Intelligence, 2005, 27(1):1934-1944.
[6] LIU K,CHENG Y Q,YANG J Y,et al.An efficient algo rithm for Foley-Sammon optimal set of discriminant vectors by algebraic method[J].Int.J.Pattern Recog.Artif.Intell, 1992,6(5):817-829.