《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 解決方案 > 人臉識(shí)別技術(shù)概述(二)

人臉識(shí)別技術(shù)概述(二)

2015-10-07
關(guān)鍵詞: 人臉識(shí)別

2 常用的人臉識(shí)別方法

    Brunelli和 P oggiol6 認(rèn) 為,人臉識(shí)別技 術(shù)和方法可以分為兩大類 :基于幾何特征(G eom etric F ea-ture— based ) 的方 法 和 基 于 模 板 匹 配 (T em plateM atching— based)的方法. 基于幾何特征方法 的思想是首先檢測(cè)出嘴 巴、 鼻子 、 眉毛 、 眼睛等臉部主要部件的位置和大小 ,然后利用這些部件 的總體幾何 分布關(guān)系以及相互之間的參數(shù) 比例來(lái)識(shí)別人臉. 基于模板的方法利用模板和整個(gè)人臉圖像 的像素值之間的自相關(guān)性 進(jìn)行識(shí) 別  這類 方法也叫做基 于表 象(A ppearance— based )的方法. 雖然后來(lái)出現(xiàn)了很多新的人臉識(shí)別技術(shù)和方法 , 然 而這些技術(shù)和方法仍然可以按照 Brunell i和 P oggio 的方法分類。

    本文系統(tǒng)分析了現(xiàn)今常用的人臉識(shí)別方法,將人臉識(shí)別方法分為基于幾何特征的方法、 基于模 型的方法、 基于統(tǒng)計(jì)的方法、基于神經(jīng)網(wǎng)絡(luò)的方法和多分類器集成方法。

2.1  基 于幾 何特 征 的方法

    文獻(xiàn)中記載最早 的人臉識(shí)別方法就是 Bledsoe提出的基于幾何特征的方法_7], 該方法 以面部特征點(diǎn)之間的距離和比率作為特征 ,通過(guò)最近鄰方法來(lái)識(shí)別人臉. 以該方法 建立 的人臉識(shí)別系統(tǒng)是一個(gè)半自動(dòng)系統(tǒng),面部特征點(diǎn)必須由人手工定位。也正是由于人工的參與,該系統(tǒng)對(duì)光照變化和姿態(tài)變化不敏感。

    K anade[8]首先計(jì)算眼角、鼻孔、 嘴巴、 下巴等面部特征之間的距離和它們之間的角度 以及其它幾何關(guān)系, 然后通過(guò)這些幾何關(guān)系進(jìn)行人臉的識(shí)別工作.在一個(gè) 2o 人的數(shù)據(jù)庫(kù)上識(shí)別率為 45% 一75%。

    Brunelli和 Poggio_6 通過(guò)計(jì)算鼻子的寬度和長(zhǎng)度 、 嘴巴位置和下 巴形狀 等進(jìn)行識(shí)別 , 在一個(gè) 47 人的人臉庫(kù)上的識(shí)別 率為 90% 。然 而, 簡(jiǎn)單模板 匹配方法在同一人臉庫(kù)上的識(shí)別率為 100% 。

    側(cè)影 (P rofile)識(shí)別 也是早期基于幾何特征人臉識(shí)別的一個(gè)重要方法 , 其基本原理是從人臉 的側(cè)影輪廓線上提取特征點(diǎn) , 將側(cè)影轉(zhuǎn)化為輪廓曲線, 從中提取基準(zhǔn)點(diǎn) 。 根據(jù) 這些點(diǎn)之 間的幾何特征來(lái)進(jìn)行識(shí)別. 由于側(cè)影識(shí)別相對(duì)較簡(jiǎn)單且應(yīng)用面小, 對(duì)側(cè)影識(shí)別 的研究較少。

    基于幾何特征 的方法非常直觀 。 識(shí)別速度快 , 內(nèi)存要求較少 , 提取 的特征在一定程度上對(duì)光照變化不太敏感. 但是 , 當(dāng)人臉具有一定 的表情或者姿態(tài)變化時(shí) , 特征提取不精確 ,而且由于忽略了整個(gè)圖像 的很多細(xì)節(jié)信息 , 識(shí)別率較低 , 所以近年來(lái) 已經(jīng)很少有

新的發(fā)展。

2.2 基于模型的方法

    隱馬 爾 可 夫 模 型 (H idden M arkov M odel。H M M )是一種常用的模型, 基于 H M M 的方法首先被用于聲音識(shí) 別等 身份識(shí)別 上 , 之后 被 N efian 和H ayes 引入到人臉識(shí)別領(lǐng)域  .它是用于描述信號(hào)統(tǒng)計(jì)特性的一組統(tǒng)計(jì)模型. H M M 用 馬爾可 夫鏈來(lái)模擬信號(hào)統(tǒng)計(jì)特性 的變化, 而這種變化又是 問(wèn)接通過(guò)觀察序列來(lái)描述 的, 因此馬爾可夫過(guò)程是 一個(gè) 雙重的隨機(jī)過(guò)程. 在 H M M 中結(jié)點(diǎn)表示狀態(tài), 有 向邊表示狀態(tài)之間的轉(zhuǎn)移 , 一個(gè)狀態(tài)可 以具有特征空間

中的任意特征, 對(duì)同一特征 , 不同形態(tài)表現(xiàn)出這一特征的概率不 同. 在人臉識(shí) 別過(guò)程 中, N efian 首 先采用兩維離散余 弦變換 (D iscrete Cosine T ransform ,D C T ) 抽取人臉特征 , 得到觀察 向量, 構(gòu)建 H M M 人臉模型 , 然后用 E M (E xpectati on M axi m i zati on )算法[n]i jl I練. 利用該模型就可以算 出每個(gè)待識(shí)別 人臉觀察向量的概率 , 從而完成識(shí)別. H M M 方法 的魯棒性較好 , 對(duì)表情、 姿態(tài)變化不太敏感 , 識(shí)別率高。

    主動(dòng)形狀模型 (A ctive Shape M odel,A SM )方法 由 Cootes 等人 提 出It2], Cootes 對(duì) 形狀和局 部灰度表象建模 , 用建立 的 A SM 在新 的圖像 中定 位易變的物體. 后來(lái), L anitis 等將 其應(yīng)用于解釋人臉 圖像 , 在使用 A SM 找出人臉 的形狀后 , 將人臉切割并

歸一到統(tǒng)一的框架 , 對(duì)這個(gè) 與形 狀無(wú)關(guān) 的人臉采用亮度模型來(lái)進(jìn)行解釋和識(shí)別。

    主動(dòng) 表 象 模 型 (A ctive A ppearance M odel,A A M )可以看成是對(duì) A SM 的進(jìn) 一步擴(kuò)展l _1 lf 1], 是一種通用的非線性 圖像 編碼模式 , 通過(guò)變形處理將通用人臉模型與輸 入圖像進(jìn)行 匹配 , 并將控制參數(shù)作為分類的特征向量.

2.3 基于統(tǒng)計(jì)的方法

    基于統(tǒng)計(jì) 的方法將人臉圖像 視為隨機(jī) 向量 , 從而用一些統(tǒng)計(jì)方法 來(lái)分析人臉模式 , 這類方法有著完備的統(tǒng)計(jì)學(xué)理論支持; 得到了較好地發(fā)展 , 出現(xiàn)了一些較成功的算法.

    特征臉 (E igenface)方法由 T urk 和 Pentland_1 5_提 出. 對(duì)于每一幅人臉圖像 , 按 照從上到下 、 從左到右 的順序?qū)⑺邢袼?的灰度值 串成一個(gè)高維 向量,然 后 通過(guò) 主成分 分 析 (P rincipal C om ponent A naly—sis。 P C A )[ 將高維 向量降低維 數(shù). 用 PC A 降維主要基于以下三點(diǎn) : (1)壓縮功能 。 在低維空間內(nèi) 比較圖像將提高計(jì)算效率 ; (2)人臉樣本的分布近似正態(tài)分布。 方差大的維可能與有用信號(hào)相關(guān), 而方差小的維可能對(duì)應(yīng)噪聲 , 因此去掉小方差對(duì)應(yīng) 的維將有利于提高識(shí) 別精確率 ; (3)因?yàn)槊?幅圖像都被 減去均值 , 且被放縮成單位向量 , 兩幅圖像之間的相關(guān)性與特征空間中投影之間的距離成反 比, 因此特征空間

中的最近鄰匹配是圖像相關(guān)性 的有效近似. PC A 技術(shù)首先 由 K irby 和 Sirovi ch 引 入 到 人 臉 識(shí) 別 領(lǐng)域  , 并且證明 了 PC A 是使 原始圖像 與重構(gòu) 圖像之間的均方誤差極小化的最佳壓縮方式. 一 幅圖像在各個(gè)特征臉上 的投影組成 了該 圖像 的權(quán)值向量,將待識(shí)別圖像的權(quán)值 向量與人臉數(shù)據(jù)庫(kù) 中各圖像的權(quán)值向量相 比較 , 確定哪一幅 圖像與待識(shí)別 圖像的

權(quán)值向量最接近.后來(lái) Pentland 等人L1 ]進(jìn)一步擴(kuò)展了特征臉?lè)椒? 將類似的思想運(yùn)用到面部特征上 ,分別得到了本征眼、 本征鼻、 本征嘴, 并且將 它們結(jié)合起來(lái)進(jìn)行人臉識(shí)別.實(shí)驗(yàn)結(jié)果表明,這樣比單獨(dú)使用特征臉效果更好. 特征臉?lè)椒ㄓ?jì)算量低 ,使用方便,并且效果 良好 ,目前已經(jīng)成為人臉識(shí)別的基準(zhǔn)程序(Benchm ark)和事實(shí)上的工業(yè)標(biāo) 準(zhǔn).但是它對(duì)于外界因素所帶來(lái)的圖像差異和人臉 自身所造成的差異是不加區(qū)分的, 因此外界因素(例如光照、 姿態(tài))變化會(huì) 引起識(shí)別率的降低.

    特征臉?lè)椒ㄊ褂糜筛鱾€(gè)特征臉擴(kuò)展的空間來(lái)表示人臉, 雖然可以有效地表示人臉信息, 但是并不能有效鑒別和區(qū)分人臉. 很多研究 者提 出了使用其他線性空間來(lái)代替 特征臉空間 以取得 更好 的識(shí)別 效果. 此中線性判別分析 (L inear D iscrim inate A naly—sis,L D A )方法(也叫 F isher臉?lè)椒? 9]利用了類別歸屬信息 ,它選擇類內(nèi)散 布正交 的矢量作為特征臉空間, 從而壓制 了圖像之間與識(shí)別信息無(wú)關(guān)的差異,強(qiáng)調(diào) 了不同人臉之間的差別 , 同時(shí)弱化 了同一人臉由于光照 、視角和表情而引起 的變化, 獲得了比特征臉更好的識(shí)別效 果. L D A 是一種 監(jiān)督學(xué) 習(xí)方法 ,而PC A 是非 監(jiān)督學(xué) 習(xí)方法.Belhum eur_ _J 9J對(duì) 16 個(gè)人的各 10 幅圖像進(jìn)行識(shí)別實(shí)驗(yàn) ,PC A 方法 的識(shí)別率為 81%,而 F isher臉?lè)椒ǖ淖R(shí)別率為 99.4 %.

    M oghaddam 等人提出貝葉斯人臉識(shí)別方法 .他們提出了一種基于概率的圖像相似度度量方法 , 將人臉圖像之間的差異分 為類問(wèn)差異和類 內(nèi)差異 ,其中類間差異表示不同對(duì)象之問(wèn)的本質(zhì)差異,類內(nèi)差異為同- - x~象 的不 同圖像之 間的差異 ,而實(shí)際人臉圖像之 間的差異為兩者之和. 如果類 內(nèi)差異大于類問(wèn)差異 , 則認(rèn) 為兩人臉 圖像屬于同一對(duì)象的可能性大.他們提出了類 闖差異和類內(nèi)差異度量的概率模型和計(jì)算方法 由于貝葉斯相似度 的計(jì)算涉及復(fù)雜的非線性計(jì)算 , M oghaddam 等人提出了一種線性 的快速計(jì)算方法. 這種人臉識(shí)別方法在 1996 年美國(guó) D A PA R 組織的 F ER ET 人臉測(cè)試Ⅲ中是效果最好的方法之一, 特別是在克服光照 和表情變化對(duì)識(shí)別的影響方面性能較好.

    奇異值 分 解 (Singul ar V alue D ecom positi on ,SV D ) 1 ]是一種有效 的代數(shù)特征提取方法. 奇異值特征具有 良好的穩(wěn)定性 、 轉(zhuǎn)置不變性 、 旋轉(zhuǎn)不變性 、位移不變性 以及鏡像變換 不變性等重要性質(zhì) , 因此奇異值分解技術(shù)也被應(yīng)用到人臉識(shí)別領(lǐng)域.

    獨(dú)立成分分析(Independent C om ponent A nal—ysi s, IC A )_ _2。 可 以看成是 對(duì) PC A 的推廣. P C A 利用二階矩去掉輸入數(shù)據(jù) 的相關(guān)性 , 使得數(shù)據(jù)的協(xié)方差為零, 而 IC A 使得輸入數(shù)據(jù)的二階和高階矩依賴性最 ?。?IC A 首先被 用 于盲源 分 離 (B lind SourceSeparation , B SS )問(wèn)題 , 用來(lái)將 觀察信號(hào)分解 成一系列獨(dú)立信號(hào)的線性組合. IC A 用于人臉識(shí)別有兩種結(jié)構(gòu)(I(2A A rchitecture I 和 IC A A rchitecture II)和多種算法 (例如 F astIC A 和 InfoM ax )口 ,PC A和 IC A A rchitecture II 利用 的是全局特征 , 而 IC AA rchitecture I 利用的是空間局部特征. B D raper 等人_2 詳細(xì)比較了 PC A 和 IC A 在人臉驗(yàn)證和面部表情識(shí)別 中的性能. 人臉驗(yàn)證實(shí)驗(yàn) 中, IC A A rchitec—ture II 的性能最好 , PC A 的性能與距離度量標(biāo)準(zhǔn)有關(guān) , IC A A rchitecture I 的性能較差 , IC A 用 F astI—C A 算法較好 ; 表情識(shí)別實(shí)驗(yàn)中, 用 InfoM ax 算法實(shí)現(xiàn)的 IC A A rchi tecture I性能最好.

2.4 基于神經(jīng)網(wǎng)絡(luò)的方法

    神經(jīng) 網(wǎng)絡(luò)在人臉識(shí)別領(lǐng)域有很長(zhǎng)的應(yīng)用歷史 ,1994 年就出現(xiàn)了神經(jīng)網(wǎng)絡(luò)用于人臉處理的綜述性文章.

    Kohonenc 最早將自組織映射(Self O rgani—zing Map,SOM )神經(jīng) 網(wǎng)絡(luò)用于人臉識(shí)別.他利用

SOM 的聯(lián)想能力“ 回憶” 人臉. 即使當(dāng)輸入人臉圖像具有較大噪音干擾或者有部分 圖像丟失時(shí),也能恢復(fù)出完整的人臉.

    動(dòng)態(tài)鏈接結(jié)構(gòu)(D ynam ic L ink A rehitecture,DLA )是用于人臉識(shí) 別 的最有影 響的神經(jīng) 網(wǎng)絡(luò)方法.DIA 試圖解決傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中一些概念性問(wèn)題,其中最突出的是網(wǎng)絡(luò)中語(yǔ)法關(guān)系的表達(dá).DIA 利用突觸的可塑性將神經(jīng)元集合劃分成若干圖結(jié)構(gòu),同時(shí)保留了神 經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn).DLA 使 用G abor 小波來(lái)表示 圖像的特征.

    Law rence和Giles 等人采用將 自組織映射神經(jīng)網(wǎng)絡(luò)(S()M )與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合 的混合 神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識(shí)別.SO M 實(shí)現(xiàn)對(duì) 圖像的采樣向量降維 ,且對(duì)圖像樣本的小幅度變形不敏感 ; 卷積網(wǎng)絡(luò)用來(lái)實(shí)現(xiàn)相鄰像素間的相關(guān)性知識(shí) , 在一定程度對(duì)圖象的平移 、 旋轉(zhuǎn) 、 尺度和局部 變形不敏感. 在O R I 人臉 庫(kù) 8]上進(jìn) 行仿 真實(shí)驗(yàn) ,與用 K arhunen —I. o6ve 變換代 替 S()M 或 者用 多層 感知 器 (M ulti—L ayer P erceptron ,M I P )代替 卷積 神經(jīng) 網(wǎng)絡(luò)相 比,該方法取得 了較低的錯(cuò)誤率; 與特征臉?lè)椒ㄏ?比,當(dāng)待識(shí)別對(duì)象的訓(xùn)練樣本數(shù)從 1 到 5 變化時(shí),該方法都取得了較好的識(shí)別性能。

    I in 和 K ung_2 9l提出了一種基于概率決策的神經(jīng) 網(wǎng) 絡(luò) (P robabilistic D eci si on— Based N eural N et—w ork,PD B N N )人臉識(shí)別方法. 主要原理是采用虛擬樣本進(jìn)行強(qiáng)化和反 強(qiáng)化學(xué) 習(xí), 從 而得到較理想的概率估計(jì)結(jié)果, 并且采用模塊 化的網(wǎng)絡(luò)結(jié)構(gòu)加快網(wǎng)絡(luò) 的學(xué) 習(xí).

    用于人臉識(shí)別 的神經(jīng)網(wǎng)絡(luò)還有 : M L P 的一種變形——時(shí)滯 神 經(jīng) 網(wǎng) 絡(luò) (T im e D elay N eural N et—w orks, T D N N )Eao】 、 徑 向 基 函數(shù) 網(wǎng)絡(luò) (R adial B asisF unction N etw ork , R B F N )[ ]. R icanek 等 人[駝 ]采用 的 H opfield 網(wǎng)絡(luò) , 能有效地實(shí)現(xiàn)低    分辨率人臉 的聯(lián)想和識(shí)別.神經(jīng)網(wǎng)絡(luò)方法較其他人臉識(shí)別方法有著特有的優(yōu)勢(shì), 通過(guò)對(duì)神經(jīng) 網(wǎng)絡(luò) 的訓(xùn)練可 以獲得其他方法難以實(shí)現(xiàn)的關(guān)于人臉圖像的規(guī) 則和特征 的隱性表示,避免了復(fù)雜的特征抽取工作 , 并有利于硬件的實(shí)現(xiàn).缺點(diǎn)主要在于其方法的可解 釋性較弱 ,且要求多張人臉圖像作為訓(xùn)練集 , 只適合于小型人臉庫(kù).

2. 5 多分類器集成方法

    將多個(gè)學(xué)習(xí)系統(tǒng)(例如分類器)組合是 目前機(jī)器學(xué)習(xí)的熱門(mén)課題之一,這種技術(shù) 已經(jīng)被廣泛運(yùn)用到模式識(shí)別之 中. 當(dāng)前人臉識(shí)別方法都只能在特定約束條件下取得較好的性能 ,然而在現(xiàn)實(shí)應(yīng)用 中,人臉的表象會(huì)因?yàn)楣庹辗?向、 姿態(tài) 、 表情變化而產(chǎn)生較大的變化, 每種特定 的識(shí)別器只對(duì)其中一部分變化 比較敏感 ,因此,將可以整合互補(bǔ)信息的多個(gè)分類器集成能夠提高整個(gè)系統(tǒng) 的分類準(zhǔn)確率.

    Gutta 等人口3]提出將集成的RBF與決策樹(shù)(D ecision T ree)結(jié)合起來(lái)進(jìn)行人臉識(shí)別. 結(jié)合 了全局的模板匹配和離散特 征的優(yōu)點(diǎn) ,在一個(gè) 350 人 的人臉庫(kù)上測(cè)試,取得了較好的實(shí)驗(yàn)結(jié)果.

    H uang 等人 在多特征臉空間的基礎(chǔ)上 , 采用神經(jīng)網(wǎng)絡(luò)集成(N eural N etw ork Ensem ble)的方法,實(shí)現(xiàn) 了對(duì)多視角人臉 的識(shí)別. 首先將人臉深度方 向的偏轉(zhuǎn)角度人為的分為幾組 (多個(gè)視 角),然后為每個(gè)視角訓(xùn)練一個(gè)神經(jīng) 網(wǎng)絡(luò) ,最后對(duì)所 有視角對(duì)應(yīng)的多個(gè)神經(jīng)網(wǎng)絡(luò)的輸出進(jìn)行集成. 實(shí)驗(yàn)表明, 該方法不必預(yù)先估計(jì)偏轉(zhuǎn)角度就可 以取得較好 的識(shí)別性能 ,而且能實(shí)現(xiàn)人臉偏轉(zhuǎn)角度的自動(dòng)判斷.

    Lu等人I3朝通 過(guò)將 PC A 、IC A 、L D A 進(jìn)行集成進(jìn)行人臉識(shí)別.首先分別用這三種方法對(duì)同一張人臉進(jìn)行識(shí)別 ,每種方法的識(shí)別分為測(cè)試人臉 與數(shù)據(jù)庫(kù)中人臉的投影向量之間夾角的余 弦值 ; 然后用簡(jiǎn)單求和方式或 R BF 網(wǎng)絡(luò)對(duì)三個(gè)得分進(jìn)行集成. 在一個(gè)包含有 206 個(gè)人 , 每人 1O 張照片的人臉庫(kù)上進(jìn)行實(shí)驗(yàn) , 集成方法的識(shí)別性能最 好,簡(jiǎn)單求和方式 比R BF 網(wǎng)絡(luò)集成方式性能略好.




本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。