《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于壓縮感知的單樣本人臉識別
基于壓縮感知的單樣本人臉識別
2015年微型機(jī)與應(yīng)用第12期
徐志京,葉 麗
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
摘要: 提出一種基于壓縮感知的單樣本人臉識別方法,通過局部鄰域嵌入非線性降維和稀疏系數(shù)的方法產(chǎn)生冗余樣本,則新樣本包含了多種姿態(tài)和多種表情。將所有的新樣本作為訓(xùn)練樣本,運用改進(jìn)后的稀疏表征分類算法進(jìn)行人臉圖像的識別。在單樣本情況下,基于ORL人臉庫和FERET人臉庫的實驗證明,該方法比原稀疏表征方法在識別率上分別提高了15.53%和7.67%。與RSRC、SSRC、DMMA、I-DMMA等方法相比,該方法同樣具有良好的識別性能。
Abstract:
Key words :

  摘  要: 提出一種基于壓縮感知的單樣本人臉識別方法,通過局部鄰域嵌入非線性降維和稀疏系數(shù)的方法產(chǎn)生冗余樣本,則新樣本包含了多種姿態(tài)和多種表情。將所有的新樣本作為訓(xùn)練樣本,運用改進(jìn)后的稀疏表征分類算法進(jìn)行人臉圖像的識別。在單樣本情況下,基于ORL人臉庫和FERET人臉庫的實驗證明,該方法比原稀疏表征方法在識別率上分別提高了15.53%和7.67%。與RSRC、SSRC、DMMA、I-DMMA等方法相比,該方法同樣具有良好的識別性能。

  關(guān)鍵詞: 人臉識別;單樣本;稀疏表征分類;局部鄰域嵌入非線性降維

0 引言

  人臉識別技術(shù)是一種通過分析比較人臉視覺特征信息進(jìn)行身份鑒別的計算機(jī)技術(shù)[1]。人臉識別受表情、姿態(tài)等多因素影響,其仍是生物特征識別領(lǐng)域最困難的研究課題之一。同時,因樣本采集成本大、存儲空間受限等造成了單訓(xùn)練樣本問題,這使得人臉內(nèi)在特征的提取變得更加困難[2]。在人臉訓(xùn)練數(shù)據(jù)庫中每人僅有一幅圖像的情況下,多數(shù)傳統(tǒng)方法的識別性能將嚴(yán)重下降。壓縮感知[3](Compressed Sensing,CS)是近年來新興的信號處理方法。利用壓縮感知理論,WRIGHT J等人[3]提出了一種稀疏表示人臉識別算法(Sparse Representation-based Classification,SRC)。SRC方法在局部遮擋、噪聲等問題上具有相當(dāng)?shù)聂敯粜浴a槍螛颖締栴},本文提出了一種基于壓縮感知的單樣本人臉識別方法。該方法首先利用局部鄰域嵌入非線性降維和稀疏系數(shù)將一幅人臉圖像擴(kuò)展為姿態(tài)表情各不同的圖像,將所有新的樣本作為訓(xùn)練樣本,最后采用改進(jìn)的稀疏表征方法進(jìn)行識別分類。

1 壓縮感知理論與SRC算法改進(jìn)

  1.1 壓縮感知(CS)

  CS作為一個新的理論框架,它能以遠(yuǎn)低于奈奎斯特頻率對信號進(jìn)行采樣。

  壓縮感知理論主要包括三個方面的內(nèi)容:

 ?。?)信號x∈Rn的稀疏表示問題:x=Ψα。

 ?。?)信號低速采樣問題:y=Φx。Φ是M×N維的觀測矩陣,與稀疏基Ψ的乘積要滿足有限等距性質(zhì)。確保在降低維數(shù)的同時原始信號的信息損失也最小。

 ?。?)信號重構(gòu)問題。從線性觀測y=Aα中無失真地恢復(fù)信號(其中A稱為CS信息算子,A=ΦΨ),它基于如下嚴(yán)格的數(shù)學(xué)最優(yōu)化(Optimization)問題:

  1.png

  在信號足夠稀疏下,基于L0和L1最小化等價的理論,可將L0范數(shù)轉(zhuǎn)換成L1范數(shù):

  2.png

  1.2 SRC算法

  SRC的基本思想是:將不同類別的樣本組合成一個超完備字典,測試樣本可由同一類的訓(xùn)練樣本的線性組合來表示。算法可通過測試樣本相對于超完備字典的稀疏表示系數(shù)區(qū)分出測試樣本中所屬類別。

  在人臉識別問題上,若第i類中有足夠的訓(xùn)練樣本Ai=[vi,1,vi,2,…,v],就可使用該類訓(xùn)練樣本線性組合一幅新的同類人臉圖像x∈Rn:x=Aiαi,2UR)3Z0{RETVL{]L8AI_YYV.png。若不知測試樣本所屬類別,可將所有C個類別的6Q5O9EVET09F~UB)S%US3~S.png個訓(xùn)練樣本組合起來,形成一個新的矩陣Ψ:

  Ψ=[A1,A2,…,Ac]

  則x可線性表示為:

  x=Ψα∈Rn(3)

  理想條件下α=[0,0,…,0,αiT,0,0,…,0]T,該系數(shù)向量中除了與第i類有關(guān)的系數(shù)之外,其他元素都為0。

  再利用L1范數(shù)最小化求解α,最后計算殘差ri=  ‖x-Aiαi‖來決定測試樣本屬于哪一類。

  1.3 基于SRC的改進(jìn)算法

  本文提出的算法采用了非常稀疏投影矩陣作為觀測矩陣Φ,降低圖像維度。參考文獻(xiàn)[4]已證明非常稀疏投影矩陣不僅滿足CS測量矩陣的必要條件,而且比高斯矩陣有更好的測量效果。在L1最小化問題上,利用對偶增廣拉格朗日乘子算法尋求最優(yōu)稀疏解。其原理是先將L1范數(shù)最小化問題式(2)轉(zhuǎn)化為對偶問題:

  4.jpg

  其中α是拉格朗日乘子,通過交替迭代α、t、z,求(4)式的極值,即保證了重構(gòu)的精確度又降低了算法的運算度。最后為了更加精確地分類,利用加權(quán)殘余確定類別。

  算法步驟如下:

 ?。?)輸入C類N個訓(xùn)練樣本,構(gòu)成字典矩陣Ψ∈Rn×N。

  (2)產(chǎn)生每列都?xì)w一化的非常稀疏投影矩陣A)]8YVKJHTB0`W@2AB$E64W.jpg∈Rn×N,其中122DAW7G(8[5[_IF}$9_{`E.jpg,而hij服從非常稀疏投影分布,即:

  @3AUGNWCKI4EC(OXA21RM$I.jpg

2 冗余樣本的生成

  單樣本問題的難點是每個對象只有一個樣本,這使得考慮類內(nèi)差異的一些成熟算法識別率低。解決單樣本問題的一個有效途徑是增加與現(xiàn)實相符合的冗余樣本。這種擴(kuò)充訓(xùn)練樣本個數(shù)的方法充分利用了一幅訓(xùn)練樣本中的有用信息,便于進(jìn)一步的識別分類。

  2.1 多姿態(tài)樣本的生成

  生成多姿態(tài)樣本的方法是基于局部鄰域嵌入非線性降維理論[5]的。具體方案步驟是:

 ?。?)將所有人臉圖像先進(jìn)行小波變換,再表示為列向量形式。

  (2)設(shè)輸入的某姿態(tài)人臉圖像為Ii,將其視為高維空間中的一點,而相同姿態(tài)訓(xùn)練集人臉圖像Tin(包括N個圖像)作為Io點的鄰近點,再根據(jù)局部鄰域嵌入非線性降維理論求解近鄰點的權(quán)值。

 ?。?)設(shè)目標(biāo)姿態(tài)的訓(xùn)練集人臉圖像Ton(包括N個圖像),而待合成的目標(biāo)姿態(tài)人臉圖像為Io,然后利用步驟(2)中解出的權(quán)值反算出一個高維空間的點,即為目標(biāo)角度人臉圖像向量。

 ?。?)將目標(biāo)姿態(tài)人臉圖像向量表示為矩陣形式,再進(jìn)行小波逆變換。

001.jpg

  這種方法能快速地生成多姿態(tài)樣本,且克服現(xiàn)有的同類方法復(fù)雜、效果不佳的問題。圖1是原人臉圖像及其生成的多姿態(tài)樣本,其中(a)為輸入圖像,(b)分別為生成的不同姿態(tài)圖像,而(c)為真實圖像。

  2.2 多表情樣本的生成

  生成多表情樣本的方法是基于稀疏表征的。保證所有圖像大小統(tǒng)一,圖像中眼睛、鼻子、嘴巴在各自圖像中的同一個固定位置。在訓(xùn)練集中選取與訓(xùn)練樣本具有相同表情的人臉圖像作為變換基,使該變換基能近似地線性表示測試圖像,求解出稀疏表示系數(shù)。同時選取包含目標(biāo)表情的人臉圖像組成數(shù)組。最后利用該數(shù)組和稀疏表示系數(shù)重構(gòu)出目標(biāo)表情人臉。

002.jpg

  該方法因為沒有復(fù)雜的提取人臉特征的步驟,從而算法的復(fù)雜度也相對降低了。圖2是同一張人臉生成的多表情的人臉圖像,其中(a)為輸入的高興的人臉測試圖像,(b)~(f)分別為生成的生氣、厭惡、害怕、傷心、驚訝的人臉圖像,而(g)為真實圖像。

3 實驗設(shè)計及仿真結(jié)果

  本文實驗是基于ORL、FERET人臉數(shù)據(jù)庫的。選取每個人的一幅圖像作為訓(xùn)練樣本,剩余的人臉圖像作為測試樣本。實驗前統(tǒng)一將圖像數(shù)據(jù)的大小修改為48×48。在單樣本情況下,本文首先分別基于姿態(tài)庫和表情庫對單幅訓(xùn)練樣本采取上文的方法擴(kuò)充樣本個數(shù),以生成多姿態(tài)多表情的新圖像,然后將原訓(xùn)練樣本和新樣本作為訓(xùn)練集,最后采用改進(jìn)的稀疏表征算法進(jìn)行識別分類。

  3.1 ORL人臉庫

  ORL人臉庫是由40個人的灰度圖像構(gòu)成的,共有400張圖片。圖3描繪了使用不同個數(shù)冗余樣本下的識別率。

003.jpg

  從圖3中可以看出,冗余樣本的個數(shù)不夠多時,識別率也偏低。隨著冗余樣本個數(shù)的增加,識別率大幅度增高,但當(dāng)冗余樣本達(dá)到8個時,識別率增長緩慢,幾乎平緩。原因是訓(xùn)練樣本太少時,樣本的內(nèi)蘊特征太少,此時冗余樣本個數(shù)是影響識別效果的主要原因。但隨著冗余樣本個數(shù)的不斷增加,造成大量的冗余信息,而冗余樣本集與原始數(shù)據(jù)集的數(shù)據(jù)分布有不一致的地方,此時增加冗樣本的個數(shù)對識別率作用不大。

005.jpg

  將本文的算法與SRC算法、參考文獻(xiàn)[6]、[7]中的方法進(jìn)行比較,表1為比較結(jié)果。從表1可以看出,本文所提出的方法識別率高于原SRC方法15.53%,也比參考文獻(xiàn)[6]、[7]中的算法具有更好的識別性能。

  3.2 FERET人臉庫

004.jpg

  FERET人臉庫的1 400幅圖像共有200個人,每人7幅人臉圖像。圖4描繪了基于FERET人臉庫使用不同個數(shù)冗余樣本下的識別率。

006.jpg

  參考文獻(xiàn)[7-9]就單樣本人臉識別問題也做了大量的研究。通過表2可以看出,本文方法應(yīng)用在FERET人臉庫上的單樣本人臉識別率比原SRC方法提高7.63%,也比DMMA等算法具有更好的識別性能。表2為本文方法應(yīng)用在FERET人臉庫上的單樣本人臉識別率。

4 結(jié)論

  針對人臉識別研究的單樣本問題,本文提出了一種基于CS的單樣本人臉識別算法。經(jīng)對比實驗表明,該方法不僅充分利用單個樣本的特征信息,生成新的圖像,而且很大程度上提高了單樣本情況下的識別率,為單樣本人臉識別技術(shù)提供了新的方法。

  參考文獻(xiàn)

  [1] 王明軍.基于壓縮感知的人臉識別算法研究[D].西安:西安電子科技大學(xué),2012.

  [2] Wang Jie, PLATANIOTIS K N, Lu Juwei, et al. On solving the face recognition problem with one training sample per subject[J].Pattern Recognition, 2006,39(9):1746-1762.

  [3] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009,31(2):210-227.

  [4] 方紅,章權(quán)兵,韋穗.基于非常稀疏隨機(jī)投影的圖像重建方法[J].計算機(jī)工程與應(yīng)用,2007,43(22):25-27.

  [5] 馬瑞,宋亦旭.基于局部線性嵌入非線性降維的多流行學(xué)習(xí)[J].清華大學(xué)學(xué)報(自然科學(xué)版),2008,48(4):583-586.

  [6] Chang Xueping, Zheng Zhonglong, Duan Xiaohui, et al. Sparse representation-based face recognition for one training image per person[A]. Advanced Intelligent Computing Theories and Applications[C]. Berlin Heidelberg: Springer, 2010:407-414.

  [7] 單桂軍.基于虛擬樣本擴(kuò)張法的單樣本人臉識別算法研究[J].科學(xué)技術(shù)與工程,2013,13(14):3908-3911.

  [8] Lu Jiwen, Tan Yap-peng, Wang Gang. Discriminative multimanifold analysis for face recognition from a single training sample per person[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(1):39-51.

  [9] NABIPOUR M, AGHAGOLZADEH A, MOTAMENI H. Multimanifold analysis with adaptive neighborhood in DCT domain for face recognition using single sample per person[C]. 2014 22nd Iranian Conference on Electrical Engineering(ICEE), IEEE, 2014:925-930.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。