《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于非參數(shù)化特征提取的神經(jīng)網(wǎng)絡(luò)識別
基于非參數(shù)化特征提取的神經(jīng)網(wǎng)絡(luò)識別
曾 坤 桑 農(nóng)
摘要: 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征,再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識別,取得了較好的實(shí)驗(yàn)效果。
Abstract:
Key words :

  摘  要: 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征,再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識別,取得了較好的實(shí)驗(yàn)效果。
  關(guān)鍵詞: 特征提取  神經(jīng)網(wǎng)絡(luò)  目標(biāo)識別

   傳統(tǒng)的特征提取方法建立在目標(biāo)分割的基礎(chǔ)上,通過分割獲得目標(biāo)的形狀信息,并與已知的待識別目標(biāo)的形狀特征進(jìn)行比較,實(shí)現(xiàn)目標(biāo)分類。目標(biāo)的形狀特征通常由一組參數(shù)來描述,如不變矩、Fourier描繪子、各線特征的起點(diǎn)和終點(diǎn)、各點(diǎn)特征(角點(diǎn)、形殊點(diǎn))的位置等。故傳統(tǒng)的特征提取方法可視作參數(shù)化方法。但由于目標(biāo)分割問題自身的內(nèi)在復(fù)雜性,目前還不存在通用的、理想的目標(biāo)分割方法。近年來,人們的注意力較多地集中于所謂的無分割(Segmentation Free)目標(biāo)識別,即利用目標(biāo)的灰度信息提取某些統(tǒng)計特征(如全局的或局部的灰度均值、灰度標(biāo)準(zhǔn)差等),構(gòu)成目標(biāo)的特征,并將其作為神經(jīng)網(wǎng)絡(luò)的輸入,對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)即可用于目標(biāo)識別,這是一類非參數(shù)化的特征提取技術(shù)。具體實(shí)現(xiàn)時,可供采用的特征提取方法很多,簡單的如進(jìn)行方向投影或提取方向邊緣特征等,復(fù)雜的如采用各種局部或全局變換等。本文重點(diǎn)研究了一種非參數(shù)化的特征提取方法——感興趣算子圖像特征提取方法。
1  感興趣算子特征提取方法
  感興趣算子(Interest Operator)提取的是圖像在其水平、垂直和二個對角線方向上的灰度方差。圖1為感興趣算子特征提取示意圖。

 


  例如對一幅大小為50×60象素的圖像采用上面的方法進(jìn)行特征提取,則選取的圖像子塊像素大小為5×5。因此可以將原圖像劃分成無重疊的120個子塊,然后針對每個圖像子塊提取圖像的感興趣特征向量。
2  模塊化的神經(jīng)網(wǎng)絡(luò)
  模塊化神經(jīng)網(wǎng)絡(luò)由若干獨(dú)立訓(xùn)練的子網(wǎng)絡(luò)組成,每一子網(wǎng)絡(luò)分別針對訓(xùn)練樣本集的某一子集進(jìn)行分類識別,通過組合各子網(wǎng)絡(luò)的分類決策確定最終的識別結(jié)果。訓(xùn)練樣本集各子集的劃分采用了數(shù)據(jù)分組技術(shù),即將樣本根據(jù)一定的相似性準(zhǔn)則劃分為多組。如此分組后,各網(wǎng)絡(luò)僅需解決一個更為簡單的分類問題,因此可提高分類識別概率。
2.1 基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)
  基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)按照某種規(guī)則將圖像特征分成幾個不同的特征組。每個特征組都用一個獨(dú)立的神經(jīng)網(wǎng)絡(luò)來訓(xùn)練識別,然后由一個融合網(wǎng)絡(luò)將各獨(dú)立神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果綜合得到最后的識別結(jié)果。這種算法的優(yōu)點(diǎn)是:通過分組,每個用于識別的神經(jīng)網(wǎng)絡(luò)只需要處理某一部分特征而不是全部,從而減少了單個網(wǎng)絡(luò)的自由參數(shù),降低了問題的復(fù)雜度。
2.2 基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)
  基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)框圖如圖2所示。

  該算法的實(shí)現(xiàn)包括以下幾個步驟:
  (1)將原始圖像按照某種規(guī)則分成若干圖像子塊,各個圖像子塊間可以有交叉也可以無交叉。圖3和圖4分別為有交叉和無交叉圖像分塊的示意圖。

  (2)對每一個圖像子塊進(jìn)行特征提取,得到其相應(yīng)的圖像特征。本文選用了感興趣算子的特征提取方法。
  (3)對步驟(2)經(jīng)過特征提取所得到的圖像特征向量進(jìn)行特征選擇,以去除特征向量間的冗余特征和選出具有更強(qiáng)分類識別能力的特征,從而降低特征維數(shù),減小識別算法中神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模。
  (4)對每幅子圖分別用一個單獨(dú)的BP網(wǎng)絡(luò)對其進(jìn)行訓(xùn)練或識別。
  (5)將各個獨(dú)立BP網(wǎng)絡(luò)的輸出結(jié)果送到一個融合網(wǎng)絡(luò)中進(jìn)行融合從而得到最終判識結(jié)果。
  基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)除了可以降低問題的復(fù)雜性外,還具有一定的抗局部遮擋能力。由于一些人為的或非人為的因素,目標(biāo)圖像可能會受到局部遮擋的影響。由于局部遮擋本身的復(fù)雜性和其對目標(biāo)遮擋部位的不可預(yù)測性,使得抗遮擋成為一個相對困難的課題。基于圖像子塊的特征分組策略具有一定的抗局部遮擋能力。
  設(shè)原圖像在長度和寬度方向分別被等分為X和Y份,于是可以得到X×Y個子塊圖像。若局部遮擋處于第(i,j)個子塊上,則只有該子塊受到影響并導(dǎo)致與它對應(yīng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行錯誤判識的可能性增大。但是由于其他子塊及對應(yīng)神經(jīng)網(wǎng)絡(luò)的判識并未受到遮擋影響,因此至少可以得到X×Y-1個網(wǎng)絡(luò)的正確輸出。經(jīng)過融合網(wǎng)絡(luò),最終可以消除對第(i,j)個子塊圖像的錯誤判識的影響而得到正確的識別結(jié)果,達(dá)到抗遮擋的效果。當(dāng)然,實(shí)際應(yīng)用中局部遮擋可能會存在于不止一個子塊圖像中,但只要這些子塊圖像的數(shù)量占總子塊圖像數(shù)的比重相對較小,這種特征分組神經(jīng)網(wǎng)絡(luò)識別策略就可以表現(xiàn)出很好的抗局部遮擋性能。
3  實(shí)驗(yàn)結(jié)果及其分析
  實(shí)驗(yàn)中訓(xùn)練樣本取kh-11、kh-12、lacrosses三類衛(wèi)星的三個譜段(CCD:可見光,MIDDLE:中波,LONG:長波)圖像作為試驗(yàn)用的樣本。
  (1)訓(xùn)練樣本:取每類不同譜段的圖像001、005、009、L、057共15幅圖像。如果三個譜段的圖像一起訓(xùn)練,則訓(xùn)練樣本個數(shù)為15×9=135;如果只有單譜段圖像參加訓(xùn)練,則訓(xùn)練樣本個數(shù)為:15×3=45。
  (2)識別樣本:取每類不同譜段的圖像003、007、0011、L、059以及060、061、L、072總共30幅圖像。如果三個譜段的圖像一起識別,則識別樣本個數(shù)為30×9=270;如果只有單譜段圖像參加識別,則識別樣本個數(shù)為30×3=90。
  表1給出了不同分辨率情況下的正確識別率。其中,All組實(shí)驗(yàn)表示對每類三個譜段的衛(wèi)星圖像進(jìn)行實(shí)驗(yàn),CCD、MIDDLE和LONG組實(shí)驗(yàn)分別表示對可見光譜段、中波紅外圖像和長波紅外圖像進(jìn)行實(shí)驗(yàn)。CCD為可見光圖像,MIDDLE為中波圖像,LONG為長波圖像。

 


  研究中還用最小距離分類器對提取的不同目標(biāo)的參數(shù)化特征進(jìn)行了實(shí)驗(yàn),以便觀察其與神經(jīng)網(wǎng)絡(luò)方法的性能差異。在實(shí)驗(yàn)中,三類目標(biāo)的圖片各為3×72=216幅,用奇數(shù)圖作為訓(xùn)練樣本,對偶數(shù)圖進(jìn)行識別。表2顯示了在三組不同分辨率下選擇不同特征集得到的識別結(jié)果。


  從實(shí)驗(yàn)中可以發(fā)現(xiàn),常規(guī)分類方法性能不穩(wěn)定,而且其識別率與神經(jīng)網(wǎng)絡(luò)方法相比要低很多。
參考文獻(xiàn)
1   Choi S M.A segmentation-free recognition of two touching
     numerals using neural network.In:Proceedings of the Fifth
     International Conference on Document Analysis and
     Recognition,1999
2   Ozdil M A,Vural F T Y.Optical character recognition
     without segmentation.In:Proceedings of the Fourth Inter-
     national Conference on Document Analysis and Recogni-
     tion,1997
3   Rocha J,Pavlidis T.Character recognition without segmen-
     tation.IEEE Transactions on,Pattern Analysis and
     Machine Intelligence,1995;17:903
4   Cai C,Shi Z.A modular neural network architecture with
     approximation capability and its applications. The Second
     IEEE International Conference on Cognitive Informatics,
     2003
5   Wang L C,Der S Z,Nasrabadi N M.Automatic target
     recognition using a feature-decomposition and data-
     decomposition modular neural network.IEEE Transactions
     on Image Processing,1998;7:1113
 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。