《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 基于聚類算法人臉識別方法的研究
基于聚類算法人臉識別方法的研究
摘要: 本文研究了基于聚類算法的人臉識別方法。根據(jù)人臉圖像劃分子圖像的數(shù)目和所選定的訓練或測試人臉圖像的類別數(shù)的情況,確定RBF神經(jīng)網(wǎng)絡的輸入層、輸出層的節(jié)點數(shù);根據(jù)RBF神經(jīng)網(wǎng)絡的訓練識別效果,通過調整中間隱含層節(jié)點數(shù)、核函數(shù)及其中心點和寬度,通過基于聚類算法的人臉識別仿真實驗,具體量化了中間隱含層節(jié)點數(shù)與子圖像的對應關系、每幅子圖像中奇異值向量的保留個數(shù)、聚類因數(shù)的選取等各項參數(shù),為進一步根據(jù)各個子圖像權值的合理分配,提高人臉識別的識別精度和良好的識別速度提供了有效的參數(shù)支持。
Abstract:
Key words :

  0.引言

  在智能小區(qū)的安防系統(tǒng)中,人臉識別技術的應用,提高了安防報警系統(tǒng)的安全可靠性。人臉識別技術因其具有非接觸性、特征提取方便、防偽性能高等優(yōu)勢得到廣泛的應用。人臉識別技術綜合了計算機、通信、光學、電子、機械等多學科技術,在控制領域和智能建筑領域有著廣闊的應用前景 。本文研究了基于聚類算法判別人臉圖像的方法,達到應用于智能小區(qū)門禁系統(tǒng)和樓宇門禁系統(tǒng)的實際應用要求,如圖1所示。

智能門禁報警系統(tǒng)的結構圖
 


圖1 智能門禁報警系統(tǒng)的結構圖

  基于圖像分塊進行人臉識別時,隨著分塊數(shù)目的增多,子圖像保留的奇異值個數(shù)、維數(shù)的控制,以及子圖像權重的賦值等問題,若只依靠主觀經(jīng)驗來決定,則缺乏客觀依據(jù)。徑向基函數(shù)(RBF-Radial Basis FunctiON)網(wǎng)絡是一種性能良好的前饋型三層神經(jīng)網(wǎng)絡,具有全局逼近性質和最佳逼近性能,訓練方法快速易行,RBF 函數(shù)還具有局部響應的生物合理性。在隱含層中心確定的情況下,RBF網(wǎng)絡只需對隱含層至輸出層的單層權值學習修正,比多層感知器具有更快的收斂速度。利用 YALE人臉數(shù)據(jù)庫,通過RBF網(wǎng)絡對奇異值個數(shù)、子圖像數(shù)目、特征值數(shù)量、聚類因數(shù) 、聚類個數(shù)、 因數(shù)的測試結果,為人臉圖像的識別提供客觀地指導。

  利用相關參數(shù)的仿真實驗結果,為進一步研究子圖像賦值情況,提高人臉識別的速度和精確度提供了有效的幫助和參數(shù)支持。

  1.聚類算法的初始化

  RBF神經(jīng)網(wǎng)絡可描述為:



  式中,w(k,i)為隱含層第i個節(jié)點與輸出層第k個輸出節(jié)點的連接權值。

  隱含層聚類的初始化過程如下。

  (1)在每個類別收斂于一個聚類中心的假設前提下,將隱含層的節(jié)點數(shù)初始設定為輸出層的節(jié)點數(shù),即u=s,再根據(jù)RBF神經(jīng)網(wǎng)絡的訓練情況具體調整。

  (2)隱含層第k個神經(jīng)元的中心Ck為 k 類特征矢量的均值。

  (3)計算從均值Ck到屬于類別k的最遠點kfarP的歐氏距離。

  (4)計算各個j聚類中心到k聚類中心的距離。再根據(jù)dmin(k,l)和dk,dl的關系,對以下幾種情況進行判斷。

  情況(a):若滿足的條件,則表明類別k與其他類別l無重疊。

  情況(b):若滿足的條件,則表明類別k與其他類別l有重疊,需要進一步考慮以下情況 。

  (i)當滿足的條件時,則表明兩個類別雖有重疊,但是互相不包含。

  (ii)當滿足的條件時,則表明類別k包含于其他類別之中,可能導致RBF神經(jīng)網(wǎng)絡分類錯誤。

  (5)按照以下分離原則對每類樣本進行判別并細分。

  (i)包含規(guī)則:若滿足,則表明類別k包含于類別l之中,類別l應被進一步細分為兩個聚類。

  (ii)正確歸類規(guī)則:若類別k包含許多其他類別l的數(shù)據(jù),則需要將類別k進一步細分為兩個聚類。

  重復上述步驟,直至選定的全部人臉圖像的訓練樣本都被處理為止,整個RBF神經(jīng)網(wǎng)絡的結構隨之確定。

 

  2.RBF神經(jīng)網(wǎng)絡的參數(shù)調整

  定義誤差函數(shù)為:



  其中,lky和lkt表示在輸出層ky節(jié)點上對應第l個訓練樣本的實際輸出值和理想輸出值。通過線性最小二乘法求解最佳連接權值*W。

  RBF神經(jīng)網(wǎng)絡的訓練收斂性能,如圖2的實例所示。圖2為RBF神經(jīng)網(wǎng)絡誤差輸出曲線圖,圖中的橫軸表示RBF神經(jīng)網(wǎng)絡訓練的迭代次數(shù),縱軸表示RBF神經(jīng)網(wǎng)絡實際誤差的輸出值,即訓練迭代一次新網(wǎng)絡的輸出值與原先網(wǎng)絡按誤差函數(shù)公式(2)計算得到的結果。實驗條件為在Yale數(shù)據(jù)庫中,選取15個類別的人臉圖像,每個類別選取11張人臉圖像作為訓練樣本,提取每個人臉圖像的特征值數(shù)量為90,對應于網(wǎng)絡的訓練集為一個165×90的矩陣時,得到RBF神經(jīng)網(wǎng)絡訓練的誤差函數(shù)輸出情況。在具體實驗中,設定RBF神經(jīng)網(wǎng)絡停止參數(shù)訓練調整的條件為:當前一次系統(tǒng)輸出誤差值與當前系統(tǒng)輸出誤差值的變化量相差小于0.01時,RBF神經(jīng)網(wǎng)絡停止參數(shù)訓練調整。圖2表明,RBF 神經(jīng)網(wǎng)絡的誤差輸出值下降得很快,在迭代過程不到15次的情況下,誤差曲線就進入系統(tǒng)誤差值輸出相差較小的范圍內,收斂速度較快。

RBF網(wǎng)絡誤差輸出曲線圖

圖2 RBF網(wǎng)絡誤差輸出曲線圖

  3.聚類算法的仿真實驗

  參數(shù)設定值的不同,將對基于聚類算法的人臉圖像識別的結果產生影響,例如對子圖像劃分的個數(shù)、子圖像奇異值向量保留的個數(shù)、聚類因數(shù)α、γ因數(shù)的選取等。對不同參數(shù)初始化時設定不同的數(shù)值,將得到的實驗結果進行對比和綜合分析,進而確定包括輸入層、輸出層、隱含層節(jié)點數(shù)目及其核函數(shù)的選取等在內的合理的RBF神經(jīng)網(wǎng)絡結構,確定包括貝葉斯分類器的權值分配、閾值選取等在內的合適融合策略,以便進行深入的研究。

  實驗中,訓練樣本為Yale人臉庫中的每人前6張照片,共90張,測試樣本為每人的后5張照片,共75張。樣本完整訓練誤差容限為1,訓練最大次數(shù)為120。

  (1)在γ因數(shù)取為0.8、子圖像的數(shù)目為32塊、保留子圖像的奇異值個數(shù)為10的條件下,測試不同聚類因數(shù)α取值、不同聚類個數(shù)(即RBF神經(jīng)網(wǎng)絡隱含節(jié)點個數(shù))情況下的識別率。如圖3中data1所示。

不同參數(shù)下的識別結果

圖3 不同參數(shù)下的識別結果

  實驗結果表明,隨著聚類因數(shù)α的增大,聚類個數(shù)也在增多,當α>3.0以后,識別率趨于穩(wěn)定。而且,在RBF神經(jīng)網(wǎng)絡中隱含層節(jié)點數(shù)增多的情況下,會加大RBF神經(jīng)網(wǎng)絡的計算負擔。因此,最終選擇聚類因數(shù)α=3.5,來進一步研究子圖像權重的賦值。

  (2)在聚類因數(shù)α取為3.5、子圖像的數(shù)目為32塊、保留子圖像的奇異值個數(shù)為10的條件下,測試不同γ因數(shù)情況下的識別率,如圖3中data2所示(data2與data3重合)。實驗結果表明,在γ因數(shù)逐漸增大的情況下,識別率隨之逐漸提高并趨于穩(wěn)定。因此,最終選擇γ=0.8,來進一步研究子圖像權重的賦值。

  (3)在聚類因數(shù)α取為3.5、γ因數(shù)取為0.8、子圖像的數(shù)目為32塊的條件下,測試每個子圖像保留不同奇異值個數(shù)時識別率的情況,如圖3中data3所示。實驗結果表明,在子圖像的奇異值個數(shù)增加的情況下,識別率的有所增加并趨于穩(wěn)定。最終選擇保留子圖像的奇異值個數(shù)為10,來進一步研究子圖像權重的賦值。

  (4)在聚類因數(shù)α取為3.5、γ因數(shù)取為0.8的條件下,測試保留不同奇異值特征個數(shù)時識別率的情況。如圖3中data4所示,其中,每個子圖像保留奇異值的個數(shù)×子圖像數(shù)目=每幅圖像的奇異值特征個數(shù)。

  實驗結果表明,人臉圖像劃分的子圖像數(shù)目較多的情況下,識別率較高,而且當子圖像的數(shù)目達到32塊時,識別率已經(jīng)趨于穩(wěn)定狀態(tài)。人臉圖像劃分的子圖像數(shù)目不宜過多,這樣會使每幅人臉圖像的奇異值特征個數(shù)過大,進而增加RBF神經(jīng)網(wǎng)絡的計算負擔。最終選擇子圖像的數(shù)目為32塊的情況,來進一步研究子圖像權重的賦值。

  4.仿真實驗結果分析

  基于上述仿真實驗數(shù)據(jù)進行參數(shù)設定,在人臉識別仿真系統(tǒng)中測試情況如圖4所示。

人臉識別仿真系統(tǒng)
 

圖4 人臉識別仿真系統(tǒng)

  根據(jù)實驗結果確定聚類因數(shù) α=3.5、γ=0.8、保留子圖像的奇異值個數(shù)為10。人臉圖像的子圖像數(shù)目對應于RBF神經(jīng)網(wǎng)絡輸入空間的維數(shù)r,樣本庫中的人臉圖像類別數(shù)對應于輸出空間的維數(shù)s,每類人臉圖像樣本的子圖像的特征空間數(shù)目對應隱含層節(jié)點數(shù)u,根據(jù)上述實驗結果調整u不超過120。對人臉圖像進行分塊,在樣本數(shù)量很大、維數(shù)很高的情況下,有效地減少了計算量。但是,子圖像數(shù)目不宜過多,否則增加神經(jīng)網(wǎng)絡計算負擔,識別率也會有所下降。

  5.結語

  本文研究了基于聚類算法的人臉識別方法。根據(jù)人臉圖像劃分子圖像的數(shù)目和所選定的訓練或測試人臉圖像的類別數(shù)的情況,確定RBF神經(jīng)網(wǎng)絡的輸入層、輸出層的節(jié)點數(shù);根據(jù)RBF神經(jīng)網(wǎng)絡的訓練識別效果,通過調整中間隱含層節(jié)點數(shù)、核函數(shù)及其中心點和寬度,通過基于聚類算法的人臉識別仿真實驗,具體量化了中間隱含層節(jié)點數(shù)與子圖像的對應關系、每幅子圖像中奇異值向量的保留個數(shù)、聚類因數(shù)的選取等各項參數(shù),為進一步根據(jù)各個子圖像權值的合理分配,提高人臉識別的識別精度和良好的識別速度提供了有效的參數(shù)支持。

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。