《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于改進(jìn)的RPCA人臉識(shí)別算法
基于改進(jìn)的RPCA人臉識(shí)別算法
首照宇,楊曉帆,莫建文
摘要: 針對(duì)人臉識(shí)別中存在遮擋、光照、表情變化等問(wèn)題,提出了一種基于改進(jìn)的魯棒主成分分析的人臉識(shí)別算法,它利用人臉的稀疏誤差成分準(zhǔn)確判斷出人臉圖像之間的差異。該算法首先對(duì)人臉進(jìn)行低秩恢復(fù),得到表示人臉普通特征的低秩分量和描述人臉差分信息的稀疏誤差分量,然后定義稀疏度和平滑度兩種描述符來(lái)表示稀疏誤差分量的特征,最后聯(lián)合上述兩種描述符對(duì)人臉圖像進(jìn)行分類判別。實(shí)驗(yàn)結(jié)果表明,在光照條件和遮擋區(qū)域隨機(jī)的情況下,提出的采用誤差圖像進(jìn)行分類判別的算法在處理遮擋、光照、表情變化等人臉識(shí)別問(wèn)題上均具有優(yōu)越的識(shí)別性能。
中圖分類號(hào): TP391.41
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2015.09.043

中文引用格式: 首照宇,楊曉帆,莫建文. 基于改進(jìn)的RPCA人臉識(shí)別算法[J].電子技術(shù)應(yīng)用,2015,41(9):157-160.
英文引用格式: Shou Zhaoyu,Yang Xiaofan,Mo Jianwen. A face recognition algorithm based on improved RPCA[J].Application of Electronic Technique,2015,41(9):157-160.
A face recognition algorithm based on improved RPCA
Shou Zhaoyu,Yang Xiaofan,Mo Jianwen
School of Electronic and Technology,Guilin University of Electronic Technology,Guilin 541004,China
Abstract: Aiming at the problems of occlusion, illumination and expression variations exist in the face recognition, a face recognition algorithm based on improved RPCA is proposed in this paper. It is based on the face of sparse error component to accurately determine the differences between face images. Firstly, the low-rank and sparse error component are obtained by low-rank recovery. Then the sparse peace sliding between two descriptors are defined to represent the characteristics of sparse error component. At last, the descriptions of the character of face images are combined to classify. The experimental results show that in illumination conditions and occluded areas random case, the proposed error image classify algorithm has superior recognition performance in dealing with face recognition problem such as occlusion, illumination, facial expression changes and so on.
Key words : face recognition;low-rank recovery;error image;sparsity;smoothness

  

0 引言

  目前,人臉識(shí)別成為了計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域中的熱門研究問(wèn)題。人臉采集時(shí)的環(huán)境影響會(huì)給人產(chǎn)生一系列復(fù)雜的問(wèn)題,如遮擋和光照都會(huì)導(dǎo)致面部信息丟失。在過(guò)去的幾十年中,研究人員提出了大量的人臉識(shí)別方法來(lái)解決這些問(wèn)題[1]。如線性判別分析(Linear Discriminant Analysis,LDA)[2]和非負(fù)矩陣分解(Non-negative Matrix Factorization,NMF)[3]等,這些方法可以處理某一限度內(nèi)的像素遮擋問(wèn)題。然而,由于在人臉部分遮擋的情況下會(huì)損壞提取的特征,這些方法的性能將會(huì)嚴(yán)重下降。為了解決這些問(wèn)題,研究人員提出了一些局部特征處理的方法,如局部非負(fù)矩陣分解(Local Non-negative Matrix Factorization,LNMF)[4]。但這些局部方法會(huì)丟棄測(cè)試圖像中對(duì)后續(xù)的檢測(cè)和識(shí)別中重要的冗余信息,影響最終的識(shí)別效果。近年來(lái),研究人員提出了基于線性表示的人臉識(shí)別方法,其中最具代表性的方法就是基于稀疏表示的分類方法(Sparse Representation based Classification,SRC)[5]和基于線性回歸的方法(Linear Regression based Classification,LRC)[6]。然而SRC在連續(xù)遮擋中并不魯棒,此外,SRC和LRC的性能都取決于訓(xùn)練集的大小,如果訓(xùn)練樣本不足會(huì)給分類帶來(lái)干擾。

  近年來(lái),CANDES E等人提出了一種新的魯棒主成分分析法(Robust Principal Component Analysis,RPCA)[7]。RPCA在圖片損壞的情況下也能準(zhǔn)確地恢復(fù)出圖像。例如圖像聚類[8]等領(lǐng)域采用RPCA都取得了很好的效果,但很少有研究者將RPCA用于人臉識(shí)別中。本文研究發(fā)現(xiàn),RPCA得到的稀疏誤差部分可以很好地描述人臉圖片的誤差和噪聲?;诖?,本文提出了一種基于RPCA稀疏誤差的人臉識(shí)別算法(E-RPCA)。首先討論了稀疏誤差成分包含的更多利于人臉識(shí)別分類的判別信息,然后提出兩個(gè)描述誤差特征的描述符,最后聯(lián)合兩個(gè)描述符進(jìn)行分類識(shí)別。

1 基于RPCA稀疏誤差人臉識(shí)別算法

  1.1 魯棒主成分分析

  假設(shè)一個(gè)矩陣D∈Rm×n有低秩成分A和稀疏誤差成分E,D=A+E。其目標(biāo)是從矩陣D中恢復(fù)出低秩部分A,E為稀疏誤差部分。原始的RPCA模型如下:

  1.png

  其中,||E||0表示矩陣的l0范數(shù),用于計(jì)算矩陣E中的非零元素個(gè)數(shù)。由于式(1)是一個(gè)NP難問(wèn)題,所以上述問(wèn)題松弛為:

  2.png

  其中式(1)中秩的運(yùn)算用矩陣的核范數(shù)來(lái)代替,矩陣的l0范數(shù)用l1范數(shù)來(lái)近似求解,是正則化參數(shù)并且設(shè)為1。本文采用非精確的拉格朗日乘子法[9]求解式(2)。

  1.2 誤差成分分析

  在人臉識(shí)別中,光照、遮擋或偽裝是影響識(shí)別性能的一個(gè)難題,這些可以認(rèn)為是空間的稀疏誤差。因此可以提出一個(gè)假設(shè),如果一個(gè)人有多個(gè)訓(xùn)練樣本,RPCA便可以去除這些誤差。

001.jpg

  圖1是從Extended Yale B庫(kù)中進(jìn)行測(cè)試的一個(gè)例子。隨機(jī)選取每個(gè)人的32幅不同光照的圖片,大小調(diào)整為96×84,將每幅人臉圖片拉成一列組成一個(gè)矩陣D∈R8 064×32。其中(a)是原始的人臉圖片,(b)是去除光照影響后的干凈人臉圖片,(c)是獲得的稀疏誤差成分。

002.jpg

  圖2是AR庫(kù)中中進(jìn)行測(cè)試的一個(gè)例子。每個(gè)人選取8幅有表情,光照變化及遮擋的圖片,大小調(diào)整為83×60。圖中可以看出,盡管有表情、光照以及遮擋的影響,低秩部分的人臉圖像仍然很相似,而稀疏誤差部分描述了原始圖片與低秩人臉圖片之間的主要差異。

  由于低秩成分表示每個(gè)人的人臉圖像的共同特征,這對(duì)人臉識(shí)別的訓(xùn)練數(shù)據(jù)很有幫助。然而,通過(guò)RPCA處理后,干凈的訓(xùn)練樣本由于丟失差分信息并不適合后續(xù)的識(shí)別任務(wù)。通過(guò)前面的例子可以發(fā)現(xiàn),如果一個(gè)測(cè)試樣本y屬于第k個(gè)個(gè)體,那么稀疏誤差成分明顯反映出了如陰影和遮擋的類內(nèi)差異。由此可以提出一個(gè)問(wèn)題,是否在不同個(gè)體之間進(jìn)行RPCA會(huì)表現(xiàn)出更多的差異?如果有,那么便可以用稀疏誤差成分來(lái)代替低秩成分進(jìn)行分類識(shí)別。

003.jpg

  圖3是同一個(gè)測(cè)試樣本聯(lián)合不同類進(jìn)行RPCA處理。(a)是用于測(cè)試的各類圖片,(b)表示測(cè)試樣本聯(lián)合不同類進(jìn)行RPCA后的低秩圖片,(c)是每類對(duì)應(yīng)的稀疏誤差圖片,測(cè)試樣本屬于(a)中最右側(cè)那類。由于RPCA的低秩約束,測(cè)試圖片和非同類的人臉圖片進(jìn)行分解后,低秩成分會(huì)改變成另外一個(gè)人的臉(圖3(b))。從圖3(c)中可以看出,誤差圖像表現(xiàn)出可以用于分類識(shí)別的差分信息。相比于同類進(jìn)行分解得到的誤差圖像,與非同類進(jìn)行分解得到的誤差圖像不僅包括類內(nèi)差異(如眼鏡),還包括大量的類間差異(如面部輪廓、下巴、嘴唇等)。

004.jpg

  為了更直觀地觀測(cè),圖4展示了圖3中各誤差圖像的分布直方圖,其中(a)~(f)分別對(duì)應(yīng)與錯(cuò)誤類進(jìn)行分解得到的誤差圖像的分布直方圖,(g)表示與正確類分解得到的誤差圖的分布直方圖,可以看出圖(f)的分布明顯與圖(a)~(e)不同,該圖的灰度級(jí)主要集中在較低的區(qū)域,這便可以作為這些誤差圖像之間的判別信息。引起這種現(xiàn)象的原因主要是RPCA的低秩和稀疏約束,如果測(cè)試樣本屬于同一類,那么低秩部分可以描述該類的共同特征,同時(shí),稀疏誤差部分僅僅反映稀疏的類內(nèi)差異。與此相反,如果測(cè)試圖片和訓(xùn)練樣本不屬于同一類,低秩部分無(wú)法提取測(cè)試圖片的本質(zhì)特征,因此誤差部分不會(huì)像同一類的情況下那樣稀疏。由于噪聲的影響,誤差圖片不可能完全稀疏,所以不能用嚴(yán)格地使用l0范數(shù)來(lái)定義誤差圖像的稀疏度,將稀疏度松弛為統(tǒng)計(jì)低灰度級(jí)的像素個(gè)數(shù),并以此作為識(shí)別的一個(gè)指標(biāo)。

  1.3 E-RPCA算法

  1.3.1 兩個(gè)判別指標(biāo)

  通過(guò)以上分析,本文提出兩個(gè)描述誤差圖像稀疏度的判別指標(biāo):

  (1)稀疏度:給定一個(gè)誤差圖像E,E的稀疏度由||E||0決定。然而,由于真實(shí)的人臉圖像是非凸的,并且噪聲和建模誤差也會(huì)導(dǎo)致小的非零元素,所以將稀疏度松弛為統(tǒng)計(jì)低灰度級(jí)的像素個(gè)數(shù),定義為:

  Sn(E)=Num(E≤t)(3)

  Sn表示低灰度級(jí)的像素個(gè)數(shù),Sn越大就表示產(chǎn)生的誤差圖像越稀疏。其中t的值選在[10,20]之間較好。

  (2)平滑度:只用稀疏度來(lái)描述誤差圖像的差分信息是不夠的,通過(guò)對(duì)圖3(c)中的誤差圖像的觀察可以看出,相同類的誤差圖像相比不同類的誤差圖像在非遮擋區(qū)域里更加平滑,其定義如下:

  4.png

  其中xi為像素值,圖像塊所有像素值的平均值,M為像素點(diǎn)數(shù)。Sp值越大,代表圖像的邊緣和紋理信息越豐富,反之則圖像越平滑。

  圖5繪制了通過(guò)式(4)計(jì)算圖3(c)的各個(gè)誤差圖像的平滑度Sp,從中可以看出屬于同類的第6幅誤差圖像的平滑度Sp明顯低于其他不同類的誤差圖像。因此,平滑度可以作為分類的另一指標(biāo)。

  1.3.2 分類準(zhǔn)則

  假設(shè)有i個(gè)樣本有ni幅訓(xùn)練圖片,將第i類訓(xùn)練圖片拉成列向量,組成一個(gè)訓(xùn)練矩陣Di∈R。D=[D1,D2,…,Dk]∈Rm×n表示所有k類訓(xùn)練樣本。給出一個(gè)測(cè)試樣本y∈Rm,首先對(duì)每類訓(xùn)練樣本進(jìn)行RPCA來(lái)獲得誤差圖像E,i=1,2,…,k。然后通過(guò)計(jì)算式(3)、式(4)獲得兩個(gè)分類指標(biāo)Sn(E)和Sp(E),i=1,2,…,k。最后,需要通過(guò)搜索大的Sn(E)和小的Sp(E)來(lái)進(jìn)行分類,通過(guò)如下判別準(zhǔn)則來(lái)進(jìn)行最終判別:

  56.png

  1.3.3 E-RPCA算法流程

  (1)輸入k類訓(xùn)練樣本矩陣D=[D1,D2,…,Dk]∈Rm×n,測(cè)試樣本y∈Rm;

  (2)對(duì)每一類i構(gòu)造D=[Di,y]后根據(jù)式(2)分解;

  (3)根據(jù)式(3)和式(4)計(jì)算每個(gè)誤差圖像E的稀疏度和平滑度后根據(jù)式(5)計(jì)算相應(yīng)的S(E);

  (4)輸出identity(y)=argS(E),i=1,2,…,n。

2 實(shí)驗(yàn)結(jié)果分析

  本文實(shí)驗(yàn)分別對(duì)光照、遮擋以及表情變化進(jìn)行了實(shí)驗(yàn),通過(guò)與LRC、SRC、CRC等算法對(duì)比來(lái)驗(yàn)證本文算法的性能。實(shí)驗(yàn)中,灰度級(jí)閾值t取15。

  2.1 光照和表情變化實(shí)驗(yàn)

  (1)AR數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)

  在AR人臉數(shù)據(jù)庫(kù)中,選擇50名男性和50名女性的人臉組成數(shù)據(jù)集,抽取每人的14幅光照、表情變化的人臉圖像,其中7幅用來(lái)訓(xùn)練,另外7幅作為測(cè)試集。圖像尺寸統(tǒng)一調(diào)整為83×60。表1為多種算法在該人臉庫(kù)上的識(shí)別率比較。由表可看出,本文E-RPCA算法相比其他算法識(shí)別率明顯提高。

 ?。?)Extended Yale B數(shù)據(jù)庫(kù)的實(shí)驗(yàn)

  Extended Yale B人臉庫(kù)由38類人的2 414幅正面人臉組成,其中每人大約有來(lái)自64種實(shí)驗(yàn)光照條件的64幅圖片。將所有圖片按照光照影響的程度依次分為5個(gè)子集,子集1包括266幅光照影響最柔和的圖像,每人7幅;子集2和子集3每個(gè)人12幅圖像;子集4每人14幅圖像,子集5光照影響最嚴(yán)重,每人19幅圖像。實(shí)驗(yàn)采用子集1作為訓(xùn)練樣本,其他的子集作為測(cè)試樣本,實(shí)驗(yàn)中圖像均調(diào)整為96×84。表2為不同方法在不同光照子集下的識(shí)別率,從中可以看出當(dāng)子集2和子集3作為測(cè)試集時(shí),每種方法的都有百分之百的高識(shí)別率;但在子集4和子集5作為測(cè)試集時(shí),即光照對(duì)人臉影響較大時(shí),E-RPCA算法相比其他算法有更好的識(shí)別性能。

  2.2 遮擋和偽裝實(shí)驗(yàn)

  (1)隨機(jī)塊遮擋

  本節(jié)將對(duì)E-RPCA對(duì)遮擋的魯棒性進(jìn)行實(shí)驗(yàn)。分別采用上節(jié)中的子集1和子集2、3作為訓(xùn)練和測(cè)試樣本。將測(cè)試樣本分別進(jìn)行隨機(jī)塊遮擋和偽裝實(shí)驗(yàn),除了與LRC和SRC對(duì)比,本節(jié)還增加了與局部非負(fù)矩陣分解(LNMF)方法的對(duì)比。如圖6(a)表示一個(gè)遮擋了40%的測(cè)試樣本和進(jìn)行測(cè)試的6類測(cè)試樣本,(b)是分解所得到的誤差圖像。

008.jpg

  表3是所有算法在不同遮擋程度下的識(shí)別率對(duì)比,從表中可以看出,即使在60%的遮擋情況下,E-RPCA也有著85%的識(shí)別率。

007.jpg

  (2)偽裝實(shí)驗(yàn)

  本部分采用了AR人臉庫(kù)進(jìn)行實(shí)驗(yàn),用每個(gè)人的7幅圖片作為訓(xùn)練樣本,3幅偽裝的人臉圖片作為測(cè)試樣本,同樣將每幅圖片的大小調(diào)整為83×60。表4是各個(gè)方法對(duì)于偽裝的人臉識(shí)別率比較,可以看出本文算法對(duì)偽裝的人臉圖像的識(shí)別性能更優(yōu)。

3 總結(jié)

  受近幾年RPCA算法發(fā)展的啟發(fā),本文提出了一個(gè)克服光照、表情變化以及遮擋偽裝問(wèn)題的新的人臉識(shí)別算法。由稀疏度和平滑度兩個(gè)描述符來(lái)表示測(cè)試圖像分解所得的誤差部分的特征從而進(jìn)行分類判別。實(shí)驗(yàn)結(jié)果表明,本文提出的方法對(duì)光照及遮擋有著很強(qiáng)的魯棒性,并且與當(dāng)前的一些人臉識(shí)別算法比較,識(shí)別性能有著明顯的提高。本文提出的算法不僅僅局限于人臉識(shí)別應(yīng)用,同時(shí)也可以應(yīng)用于其他的圖像分類應(yīng)用中。

  參考文獻(xiàn)

  [1] MARTINEZ A.Recognizing imprecisely localized,partiallyoccluded,and expression variant faces from a single sampleper class[J].IEEE Transactions on Pattern Analysis andMachine Intelligence,2002,24(6):748-763.

  [2] BELHUMEUR P,HESPANHA J,KRIEGMAN D.Eigenfacesvs.Fisherfaces:recognition using class specific linear projec-tion[J].IEEE Transactions on Pattern Analysis and MachineIntelligence,1997,19(7):711-720.

  [3] LEE D,SEUNG H.Learning the parts of objects by non-negative matrix factorization[J].Nature,1999,401(6755):

  788-791.

  [4] LI S,HOU X,ZHANG H,et al.Learning spatially localized,parts-based representation[C].IEEE Conference on ComputerVision and Pattern Recognition,2001,1:207-212.

  [5] WRIGHT?。?,YANG?。粒珿ANESH?。粒澹簟。幔?Robust facerecognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.

  [6] NASEEM I,TOGNERI R,BENNAMOUN M.Linear regressionfor face recognition[J].IEEE Transactions on Pattern Analysisand Machine Intelligence,2010,32(11):2106-2112.

  [7] CANDES E,LI X,MA Y,et al.Robust principal componentanalysis[J].Journal of the ACM,2011,58(3):11:1-11:37.

  [8] LIU G,LIN Z,YAN S,et al.Robust recovery of subspacestructures by low-rank representation[J].Pattern Analysisand Machine Intelligence,2013,35(1):171-184.

  [9] WRIGHT J,GANESH A,RAO S,et al.Robust principal  component analysis: Exact recovery of corrupted low-rank matrices via convex optimization[C].Neural Information Processing Systems,2009.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。