摘 要: 綜述了人臉識別的現(xiàn)狀。基于幾何特征的識別方法,根據(jù)人臉圖象的灰度特性用投影圖和特征描述相匹配的算法初步確定了人臉各部分的位置。然后利用投影法和模板匹配法準(zhǔn)確地確定了瞳孔的位置及其它面部特征。實驗表明該方法準(zhǔn)確率高,運(yùn)行速度快。
關(guān)鍵詞: 特征定位 特征提取 類間方差判斷分析法 模板匹配
人臉識別的研究近幾年受到普遍重視,它與指紋識別、視網(wǎng)膜識別等同屬于生物特征識別技術(shù)范疇。在公安(犯罪識別等)、安全驗證系統(tǒng)、醫(yī)學(xué)、視頻會議、交通量控制等方面有著巨大的應(yīng)用前景,因而成為當(dāng)前模式識別和人工智能領(lǐng)域的一個研究熱點(diǎn)。雖然人類能毫不費(fèi)力地識別出人臉及表情,但人臉的自動機(jī)器識別卻是一個難度極大的課題。人臉識別的研究已有20多年的歷史,最早它和指紋識別一道作為識別罪犯身份的手段。但人臉的結(jié)構(gòu)比指紋要復(fù)雜得多,并且受很多因素的干擾:人臉表情的多樣性、成象過程的光照、圖像的尺寸、旋轉(zhuǎn)及姿勢的變化等。即使同一個人,在不同的環(huán)境下拍攝得到的人臉圖像也可能不同。所以至今人臉識別尚未能取得象指紋識別那樣令人滿意的結(jié)果。還沒有通用成熟的人臉自動識別系統(tǒng)出現(xiàn)。
1 人臉識別的理論研究及發(fā)展現(xiàn)狀
人臉識別的輸入圖象通常有正面、傾斜和側(cè)面 三種,由于實際情況的要求,對人臉正面模式的研究最多,它的發(fā)展可分為三個階段。第一階段以Bertillon、Allen 和 Parke 為代表,主要研究人臉識別所需的面部特征。這一階段工作的特點(diǎn)是識別過程全部依賴于操作人員。第二階段是人機(jī)交互識別階段。代表有Goldstion、Harmon 和Lesk。他們用幾何特征參數(shù)來表示人臉正面圖象。采用21維特征矢量表示人臉特征,并設(shè)計了基于特征表示法的識別系統(tǒng)。第三個階段是向?qū)嵱没l(fā)展的自動識別階段。隨著高速度高性能計算機(jī)的發(fā)展,人臉模式的識別方法有了較大改進(jìn)。
目前國內(nèi)外研究用于人臉識別的方法層出不窮。但根據(jù)人臉表征方式的不同,總體上可分為以下三種:基于幾何特征的識別方法、基于代數(shù)特征的識別方法和基于連接機(jī)制的識別方法。(1)基于幾何特征的人臉正面圖象識別方法,將人臉用一組幾何特征矢量表示,用模式識別中層次聚類的思想設(shè)計分類器達(dá)到識別的目的。這要求選取的幾何特征矢量有一定的獨(dú)特性,能夠消除時間跨度和光照的影響。幾何特征矢量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,Govindaraju等首先利用模板技術(shù)成功地檢測出報刊圖片的人臉輪廓,Huang 和Chen 利用動態(tài)模板技術(shù)檢測出人臉的各種面部特征。(2)基于代數(shù)特征的人臉正面自動識別方法,將人臉用代數(shù)特征矢量來表示。代數(shù)特征是由Hong等 首先提出的,由圖象本身的灰度分布確定的,它描述了圖象的內(nèi)在信息,它是通過對圖象灰度進(jìn)行各種代數(shù)變換和矩陣分解提取出的。楊靜宇等對代數(shù)特征的提取進(jìn)行了較深入地研究。這種方法將人臉看作一個二維的灰度變化的模板,從整體上捕捉和描述人臉的特征,所運(yùn)用的主要是一些標(biāo)準(zhǔn)的數(shù)理統(tǒng)計的技巧,運(yùn)算比較復(fù)雜。(3)基于連接機(jī)制的人臉正面自動識別方法,將人臉直接用灰度圖(二維矩陣)表征,利用了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力及分類能力。這種方法的優(yōu)勢在于保存了人臉圖象的材質(zhì)信息和形狀信息,同時避免了較為復(fù)雜的特征提取工作。但是普遍存在的問題是識別準(zhǔn)確率低,過程復(fù)雜。
本文從構(gòu)造實際應(yīng)用系統(tǒng)的角度,采用基于幾何特征的識別方法。具體過程是先根據(jù)人臉圖象的灰度特性用投影圖和特征描述相匹配的方法確定人臉各部分的位置。然后利用投影法和模板匹配方法定位了瞳孔的位置,較準(zhǔn)確的提取出眼睛的特征。
2 算法描述
特征選取應(yīng)保證最有代表性、信息量大、冗余量小,而且要求在一定的干擾下,也能保持一定的不變性和適應(yīng)性?;谶@種要求,借鑒前人研究成果,融合本文的實驗,將眉眼距、眼鼻距、眼嘴巴距、嘴巴下巴距、兩內(nèi)眥距、鼻孔距、嘴巴長度、眼睛處的臉頰寬度、鼻子處的臉頰寬度及嘴巴處的臉頰寬度作為人臉識別的主要特征,并且將這10個特征分別與瞳孔距之比形成的特征矢量存入數(shù)據(jù)庫中。對這些特征矢量作矢量歸一化處理后,可以有效的避免頭部偏轉(zhuǎn)引起的偏差。
2.1 預(yù)處理與特征定位
實驗采用400×600×8bit的灰度圖象。首先對圖象進(jìn)行平滑濾波處理,消除噪聲。然后利用類間方差判斷分析法確定二值化閾值。類間方差判斷分析法是指從圖象的灰度直方圖中把灰度值的幾何分布用閾值K分為兩類。然后根據(jù)這兩類的平均方差(類間方差)和各類的方差(類內(nèi)方差)之比取最大值時所對應(yīng)的K值即為二值化閾值。實驗結(jié)果表明二值化后的圖像更有利于特征定位。
由于人眼的灰度特征與人臉其他部位有明顯不同,我們采用投影圖的方法很容易得到眼睛、鼻子和嘴巴的大致位置。具體的過程如下, 作出人臉圖象沿X坐標(biāo)方向包含主要特征信息的區(qū)域的Y方向投影圖,如圖1所示。其中自頂向下的直線為二值化閾值線。由該線與投影區(qū)域的第一個交點(diǎn)作為始點(diǎn),由此向下經(jīng)過具有較大灰度變化的曲線后,尋找二值化閾值線與投影區(qū)域的交點(diǎn)即為額頭點(diǎn)的位置H,額頭的位置不要求很精確,但應(yīng)保證H點(diǎn)在眉毛實際位置的上方。然后由投影圖確定眉毛、眼睛、鼻子和嘴巴、下巴的大致位置。但考慮到有的人臉照片,前額的頭發(fā)遮住了眉毛的位置,或者是由于攝影光照的影響致使有些特征的投影圖的凸凹性不明顯,會給準(zhǔn)確識別帶來一定困難。因此本文還采用投影圖和特征描述相匹配的特征識別樹識別方法。
特征識別樹識別方法的具體過程是:首先給每個特征一組初始匹配標(biāo)號,然后在識別樹上核實各特征。即由投影圖中初定位的6個特征,其標(biāo)號函數(shù)可定義為original={C0,C1....Cn},人臉待識別的標(biāo)號集記為Li={L1,L2....L6},它們依次為眉毛、眼睛、鼻子、上嘴唇和嘴巴、下巴,并對每個特征有一定的描述集Lci={Lc1,Lc2,...Lc6}。如果Ci通過了Lc中一項Lci的一致性檢測,則Ci∈{Li}。識別樹示意如圖2所示。這種一致性檢測利用了人臉各器官的相對位置及相對距離的變化范圍,各特征區(qū)域的灰度分布特點(diǎn)等。
經(jīng)對200張不同的人臉圖象進(jìn)行實驗驗證,特征定位的準(zhǔn)確率達(dá)到96%。為進(jìn)一步識別提供了必要的條件。
2.2 瞳孔的定位及圖像標(biāo)準(zhǔn)化
在特征矢量歸一化處理中以瞳距作為基準(zhǔn)。這是考慮到瞳距作為人臉識別中最穩(wěn)定的特征,也是最重要的特征。因此瞳距定位的準(zhǔn)確性是決定系統(tǒng)識別效率高低的關(guān)鍵。
一般提取眼睛特征都使用如圖3所示的簡化模板,即用兩條端點(diǎn)重合的拋物線分別近似上下眼皮,在上下眼皮之間加上眼球的模板,用動態(tài)模板匹配的方法進(jìn)行特征提取。但是人眼眼皮的特征曲線并不象拋物線那么規(guī)則,且受表情的影響有較多的變化。這樣就使得誤差較大以致于無法正確描述眼睛的特征。本文考慮到可提取特征的穩(wěn)定性及其在人臉識別中的作用。確定了瞳距和兩眼內(nèi)眥距作為眼部區(qū)域的主要特征。采用了投影法和模板匹配兩種方法并行準(zhǔn)確定位了瞳孔的位置。同時對上眼皮曲線進(jìn)行了輪廓跟蹤。最后對圖像數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使系統(tǒng)的通用性和實用性更強(qiáng)。
2.2.1 用投影法確定瞳孔的位置
在眼睛位置處以眉眼距為參數(shù)開設(shè)局部小窗口。首先對此窗口內(nèi)的數(shù)據(jù) {f(x,y)} 進(jìn)行自動閾值二值化,平滑消噪處理,然后對這些二值化數(shù)據(jù)均值作X 方向投影圖。設(shè)小窗口內(nèi)的二值化圖像數(shù)據(jù)為f(x, y),其中x,y∈S,S為m×n的窗口。則沿X方向的平均象素數(shù)為:
經(jīng)計算后的典型數(shù)據(jù)結(jié)果如圖4所示。從圖像X方向的中點(diǎn)分別向左右搜索P(x)最小值點(diǎn),它所對應(yīng)的X 坐標(biāo)即為左右瞳孔在水平方向的位置。
2.2.2 用模板匹配法確定瞳孔的位置圖
在眼部區(qū)域的小窗口內(nèi),利用9×9的模板搜索瞳孔的位置,以左眼為例,模板的表達(dá)式如下:
求出最小值的模板數(shù)值所對應(yīng)的X,Y坐標(biāo),即為左眼瞳孔的位置。
LeftPupil(x,y)=min(D(i.j))
其中(i.j)∈S,S為左眼搜索區(qū)域。Left-Pupil(x,y)所對應(yīng)的(x,y)即為左眼瞳孔的位置。同樣可以求出右眼瞳孔的位置。經(jīng)過對300張人臉圖像的實驗驗證,這種方法定位瞳孔的準(zhǔn)確率為95%,比投影法準(zhǔn)確率高。但是投影法定位的運(yùn)算量小,運(yùn)行速度快。
對于內(nèi)眥點(diǎn)的確定,同樣在眼部區(qū)域的小窗口內(nèi)對二值化數(shù)據(jù)進(jìn)行處理。以左眼為例,搜索左眼區(qū)域的最左邊的黑點(diǎn)。同時保證這點(diǎn)必須是邊界點(diǎn),且以
此為起始點(diǎn)搜索出的邊界,其像素的個數(shù)不可能太少。依次搜索下去直至被搜索的范圍內(nèi)外邊界點(diǎn)。最后將邊界線進(jìn)行優(yōu)化。檢測結(jié)果如圖5所示??梢钥闯鲞@樣提取出的曲線與眼睛的特征吻合得比較好,有利于眼睛分類識別。
考慮到待識別的圖像中,人臉部分占整個圖像的比例不同,即有大頭照、標(biāo)準(zhǔn)照之分,以及人臉在圖像中位置的差異,使得識別過程數(shù)據(jù)處理復(fù)雜。因此我們在完成上述的定位過程后,對圖像數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理。以瞳距為水平方向的基準(zhǔn),眼睛的位置為垂直方向的基準(zhǔn)進(jìn)行坐標(biāo)平移。實驗驗證定位準(zhǔn)確率提高了5~10%。
本論文從應(yīng)用的角度,大量分析了人臉圖像數(shù)據(jù)的灰度分布特性,采用投影圖和特征描述相匹配的算法準(zhǔn)確地定位了人臉各特征的位置,具有快速、可靠的特點(diǎn)。利用投影法和模板匹配兩種方法定位了瞳孔的位置,較準(zhǔn)確的提取出眼睛的特征。圖像數(shù)據(jù)標(biāo)準(zhǔn)化處理為特征識別提供了可靠的數(shù)據(jù)。
參考文獻(xiàn)
1 周激流,何其超.人臉正面模式自動識別方法研究. 四川大學(xué)學(xué)報(自然科學(xué)版),1993;30(1):70~75
2 嚴(yán)超,蘇光大.人臉特征的定位與提取.中國圖形圖象學(xué)報,1998;3(5):375~380
3 Xiaobo Li,Nichols Roeder.Face Contour Extraction From Front View Images.Pattern Recognition,1995;28(8):1167~1179
4 Kin-Man Lam,Hong Yan.Locating and extraction the eye in human face images.Pattern Recognition,1996;29(5):771~779
5 Xie X,Sudhakar R and Zhang H.On improving eye feature extraction using deformable templates. Pattern Recognition,1994;27(6):791~799