《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技术 > 设计应用 > 人脸识别中发型遮挡检测方法研究
人脸识别中发型遮挡检测方法研究
2016年微型机与应用第2期
王志一1,2, 杨大利1,2
1.网络文化与数字传播北京市重点实验室,北京 100101; 2.北京信息科技大学 计算机学院,北京 100101
摘要: 人脸识别中,发型遮挡是一种十分常见的遮挡类型,并且对人脸的正确识别具有极大的干扰。提出一种将头发的颜色模型和发型特征相结合的遮挡检测方法。首先,采用机器学习的方法,对头发的颜色进行学习建模。然后,利用发际线的特征,将人脸划分为若干扇形并分块,采用逐步精细的方法对人脸的发型遮挡区域进行检测。实验结果表明,该方法对人脸区域发型遮挡检测的准确率和召回率都达到88%以上,相比PCA检测方法提高了约20%,验证了该方法的有效性。
關(guān)鍵詞: 人脸识别 发型遮挡 遮挡检测
Abstract:
Key words :

  摘要人臉識別中,發(fā)型遮擋是一種十分常見的遮擋類型,并且對人臉的正確識別具有極大的干擾。提出一種將頭發(fā)的顏色模型和發(fā)型特征相結(jié)合的遮擋檢測方法。首先,采用機器學(xué)習(xí)的方法,對頭發(fā)的顏色進行學(xué)習(xí)建模。然后,利用發(fā)際線的特征,將人臉劃分為若干扇形并分塊,采用逐步精細的方法對人臉的發(fā)型遮擋區(qū)域進行檢測。實驗結(jié)果表明,該方法對人臉區(qū)域發(fā)型遮擋檢測的準確率和召回率都達到88%以上,相比PCA檢測方法提高了約20%,驗證了該方法的有效性。

  關(guān)鍵詞:人臉識別;發(fā)型遮擋;遮擋檢測

0引言

  人臉識別作為模式識別領(lǐng)域的熱點研究問題受到了廣泛的關(guān)注,人臉識別技術(shù)在眾多領(lǐng)域的身份驗證中有著廣闊的應(yīng)用前景[1]。在實際人臉圖像處理過程中,人臉圖像的遮擋會經(jīng)常出現(xiàn),如頭發(fā)、口罩、圍巾等,而遮擋對人臉識別有很大的影響。因此,如何準確、自動地檢測人臉遮擋區(qū)域成為遮擋人臉識別處理的關(guān)鍵問題之一。

  主流的人臉遮擋區(qū)域檢測方法是基于PCA分析檢測方法[23]。該方法包括兩個關(guān)鍵步驟:在分析階段,將遮擋人臉圖像投影到人臉特征空間,并利用投影系數(shù)重建人臉;在檢測階段,將遮擋人臉圖像與重建人臉圖像進行比較,差異越大,判定為遮擋的可能性越大。遮擋區(qū)域根據(jù)重建人臉與原始遮擋人臉的差異來估計。基于平均人臉的人臉遮擋區(qū)域檢測方法[4]與基于PCA分析檢測方法類似,只是參考圖片選取的是平均臉圖像。

  在遮擋人臉識別中,頭發(fā)是極為常見的遮擋物體,給識別帶來較大的不利影響。目前,基于PCA或平均臉的分析檢測方法在很大程度上依賴于參考樣本,對于人臉的位置、姿勢等十分敏感,而發(fā)型遮擋往往伴隨著不同的人臉姿勢。本文在分析了各類遮擋檢測算法后,通過建立發(fā)色模型并結(jié)合發(fā)型特征,提出了一種針對發(fā)型遮擋的人臉遮擋區(qū)域檢測方法。

1方法概述

  本文方法主要分為兩個部分:發(fā)色模型的線下學(xué)習(xí)和發(fā)型遮擋區(qū)域的在線檢測。線下學(xué)習(xí)是利用人工神經(jīng)網(wǎng)絡(luò)進行發(fā)色和膚色的學(xué)習(xí),建立頭發(fā)的顏色模型,以便于在線檢測使用;在線檢測是實時檢測遮擋圖片的發(fā)型遮擋區(qū)域,給出檢測結(jié)果。

  (1)圖1給出了發(fā)色模型學(xué)習(xí)的詳細步驟:對發(fā)色和膚色RGB樣本數(shù)據(jù),利用人工神經(jīng)網(wǎng)絡(luò)進行發(fā)色和膚色訓(xùn)練學(xué)習(xí),得到一個發(fā)色模型。給定一個像素點的RGB值,可以通過該模型粗略評估其是頭發(fā)的概率。

  

001.jpg

  (2)圖2給出了發(fā)型遮擋區(qū)域的檢測步驟:給定一幅圖像,首先根據(jù)人臉進行歸一化;之后,以嘴部中心為圓心,將給定的人臉區(qū)域按照角度劃分為若干扇形;對于每個扇形,按照半徑長度平均劃分為相等數(shù)量的區(qū)塊;然后,對于每個扇形區(qū)塊,按照距離圓心的距離,由遠及近進行粗略檢測。對于一個扇區(qū),取發(fā)色區(qū)塊的下一個(離圓心更近的)區(qū)塊進行精細分割。

2結(jié)合發(fā)色模型和發(fā)型特征的遮擋檢測

  發(fā)型特征包括:長度、體積、發(fā)色等。 對于解決發(fā)型遮擋的檢測問題,可以利用發(fā)色、發(fā)際線等特征。本文將發(fā)色模型和發(fā)型特征進行有機結(jié)合,對人臉的面部發(fā)型遮擋區(qū)域進行檢測。

  2.1基于人工神經(jīng)網(wǎng)絡(luò)的發(fā)色模型

  2.1.1BP人工神經(jīng)網(wǎng)絡(luò)簡介

  BP神經(jīng)網(wǎng)絡(luò)[5]是人工神經(jīng)網(wǎng)絡(luò)的一種,它是采用誤差反向傳播的多層前饋神經(jīng)網(wǎng)絡(luò)。其中,3層的BP 網(wǎng)絡(luò)包括一個輸入層、一個隱含層、一個輸出層,如圖3所示。

002.jpg

  圖3三層BP神經(jīng)網(wǎng)路BP神經(jīng)網(wǎng)絡(luò)的基本思想是采用信號的正向傳播和誤差的反向傳播。在正向傳播中,從輸入層傳入的數(shù)據(jù),依次在各隱含層進行處理,最終到達輸出層。如果輸出值與期望輸出不同,則將輸出層的誤差作為調(diào)整信號進行反向傳播,根據(jù)誤差不斷調(diào)整權(quán)值和閾值,最終得到網(wǎng)絡(luò)可以接受的精度并輸出。

  2.1.2發(fā)色模型

  頭發(fā)的顏色與皮膚的顏色往往有比較明顯的區(qū)別,利用發(fā)色能夠有效提高面部發(fā)型遮擋區(qū)域檢測的正確率。

  2.2基于發(fā)型特征的扇形分割

  給定輸入圖像和發(fā)型區(qū)域,以嘴部位置的中心區(qū)域為圓心,將嘴部以上的區(qū)域以每10°劃分為一個扇形,共18個徑長不等的扇形(以下簡稱為扇區(qū)),按照逆時針方向記為S1~S18。對任意的扇形區(qū)域Si,按照徑長平均分為10個區(qū)塊(以下簡稱為區(qū)塊),按照離圓心的距離由遠及近依次標記為Si,1~Si,10。

  2.2.1粗略檢測

  形式地,將X={xij:xij∈S}定義為區(qū)塊S的像素點,用Ix表示一個像素點的顏色向量,Ix=(Rx,Gx,Bx)T;LX=(l1,l2,…,lm)T表示標號向量,其中m表示區(qū)塊S中的像素點數(shù),并且lx=1表示x屬于頭發(fā),lx=0表示x屬于皮膚。將一個像素是頭發(fā)的概率表示為P(lx=1),簡單地,P(lx=1)=ax,其中,ax是ANN發(fā)色模型的輸出值。

  對于人臉區(qū)域的每個扇形,首先對最外層區(qū)塊(S1,1,S2,1,…,S18,1)進行檢測。區(qū)塊Si,1中的像素點x,將其RGB值作為ANN發(fā)色模型的輸入,得到輸出值ax。當(dāng)該點的預(yù)測為頭發(fā)概率大于給定閾值時,則認為該像素點屬于頭發(fā)區(qū)域。如果區(qū)塊Si,1中的像素大部分都判定為頭發(fā)區(qū)域時,則認為該區(qū)塊Si,1屬于頭發(fā)區(qū)域,記為預(yù)測遮擋塊。對所有的扇區(qū),由遠及近地進行區(qū)塊的檢測,直到區(qū)塊不再是預(yù)測遮擋塊為止。每個扇區(qū)中第一個不是預(yù)測遮擋塊的區(qū)塊稱為精細分割塊(以下簡稱精割塊),放到下一步進行圖割[6]處理。

  2.2.2精細分割

  經(jīng)過2.2.1節(jié)中粗略檢測得到了若干個精割塊,下一步是在此范圍內(nèi)進行精細的分割。采用221中相同的定義,將X={xij:xij∈S}定義為精割塊S的像素點,用Ix表示像素點的顏色向量,Ix=(Rx,Gx,Bx)T;LX=(l1,l2,…,lm)T表示標號向量,其中m表示精割塊S中的像素點數(shù),并且lx=1表示x屬于頭發(fā),lx=0表示x屬于皮膚。將一個像素是頭發(fā)的概率表示為P(lx=1)。定義如下能量函數(shù):

  E(L)=C(L)+αB(L)(1)

  其中,α用以權(quán)衡兩項的重要性;C(L)表示像素點的預(yù)測概率;B(L)是平滑項,用以描述相鄰像素標號互異時的懲罰代價。任意精割塊S中像素的最終的標號向量L*X,通過使式(1)達到最小值來獲得。式(1)中的第一項C(L)定義為:

  C(L)=1nx∑x∈Xc(lx)(2)

  其中,nx表示精割塊S中像素點的數(shù)量, c(lx)表示發(fā)色模型對像素點x的預(yù)測概率。

  式(1)中第二項中的B(L)定義為:

  I89O1[}KZJ066(1I%[QYL1Y.jpg

  其中,np表示像素點p的相鄰點的個數(shù),σ表示圖像的平均平滑度。式(4)采用8鄰域系統(tǒng),選擇像素點的相鄰點。由于精割塊的形狀大小不同,進行了均值化處理。

  2.2.3優(yōu)化

  直接對式(1)進行最小化計算,復(fù)雜度較高,計算量非常大。本文提出了一種求近似解的計算方法。首先,將精割塊S中的像素按照ANN預(yù)測的發(fā)色程度按照從小到大排列;然后,將區(qū)塊內(nèi)所有像素的區(qū)塊起始標號都置為1,按照發(fā)色的概率從小到大排序依次將像素標號置為0;最后,分別計算能量函數(shù)的值。選取使能量函數(shù)達到最小值時的標號向量作為最優(yōu)解。

3實驗和結(jié)果分析

  實驗數(shù)據(jù)采集28個人的人臉圖像,分為正面、左側(cè)面和右側(cè)面三個姿勢,偏轉(zhuǎn)角度在10°~30°之間,發(fā)型遮擋包括正面單側(cè)遮擋、正面兩側(cè)遮擋、左側(cè)面遮擋、右側(cè)面遮擋、發(fā)簾遮擋等類型。人臉圖像庫包括28人269張發(fā)型遮擋圖像,每張圖像歸一化為50×75像素。

  將樣本數(shù)據(jù)劃分為遮擋與未遮擋兩類,并且人工標注所有遮擋樣本的發(fā)型遮擋區(qū)域。測試PCA遮擋檢測及本文所提出遮擋檢測方法的準確率P、召回率R及Fvalue。Fvalue的定義為2PRP+R。其中,P表示面部遮擋檢測的頭發(fā)區(qū)域和人工標注的頭發(fā)區(qū)域一致的像素所占的比例,R表示面部人工標注的頭發(fā)區(qū)域和遮擋檢測的頭發(fā)區(qū)域一致的像素所占的比例。對所有實驗分別調(diào)整參數(shù)以達到最優(yōu)的Fvalue值。下面通過兩個試驗對比本文方法與PCA檢測方法的優(yōu)劣。

  實驗1該實驗采用數(shù)據(jù)集中的正面人臉,數(shù)據(jù)包含109張遮擋人臉圖像,實驗結(jié)果如表1所示。

003.jpg

   由表1可以看出,在正面人臉的條件下,PCA檢測方法的Fvalue為69%,相應(yīng)的準確率和召回率分別為63%和76%。本文方法比PCA檢測方法的Fvalue提高了20%,準確率和召回率分別提高了27%和12%。實驗2該實驗采用全部的數(shù)據(jù),包含269張不同姿勢的遮擋人臉圖像,實驗結(jié)果如表2所示。

  由表2可以看出,在不同姿勢的人臉條件下,PCA檢測方法的Fvalue為57%,相比正面人臉條件下降低了12%,相應(yīng)的準確率和召回率降低10%左右。而本文方法與正面人臉條件下的Fvalue相比變化不大,說明比PCA檢測方法具有更強的魯棒性。

4結(jié)論

  發(fā)型遮擋對人臉識別具有極大的干擾,如何準確獲取遮擋區(qū)域是處理遮擋中需要解決的問題。由于各種形狀和不同紋理,使得發(fā)型遮擋區(qū)域檢測非常困難 。實驗表明,本文提出的方法比PCA遮擋檢測方法具有更高的準確率和召回率,驗證了該方法的有效性。

  參考文獻

 ?。?] CHELLAPPA R, WILSON C L, SIROHEY S. Human and machine recognition of faces: a survey[J]. Proceedings of the IEEE, 1995, 83(5): 705741.

 ?。?] 杜成, 蘇光大. 用于人臉識別的正面人臉圖像眼鏡摘除[J]. 清華大學(xué)學(xué)報(自然科學(xué)版), 2005, 45(7): 928930.

 ?。?] 王志明, 陶建華. 人臉遮擋區(qū)域檢測與重建[J]. 計算機研究與發(fā)展, 2015, 47(1): 1622.

 ?。?] 李冬梅, 熊承義, 高志榮,等. 基于異值區(qū)域消除的遮擋人臉識別[J]. 計算機科學(xué), 2015, 42(3):289295.

 ?。?] MCCLELLAND J L, KAWAMOTO A H. Parallel distributed processing[C]. Rumelhart and McClelland (eds.), 1986(I):4576.

 ?。?] BOYKOV Y, VEKSLER O, ZABIH R. Fast approximate energy minimization via graph cuts[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(11): 12221239.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容