狠狠躁躁的嗷嗷叫,欧美日本一道高清国产

基于非參數(shù)化特征提取的神經(jīng)網(wǎng)絡(luò)識(shí)別

曾坤桑農(nóng)

摘要： 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征，再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識(shí)別，取得了較好的實(shí)驗(yàn)效果。

關(guān)鍵詞： 神經(jīng)網(wǎng)絡(luò) 特征提取目標(biāo)識(shí)別

Abstract：

Key words :

　　摘要： 本文采用非參數(shù)化的特征提取技術(shù)提取樣本的特征，再用模塊化的神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行訓(xùn)練識(shí)別，取得了較好的實(shí)驗(yàn)效果。
　　關(guān)鍵詞： 特征提取神經(jīng)網(wǎng)絡(luò) 目標(biāo)識(shí)別

　　傳統(tǒng)的特征提取方法建立在目標(biāo)分割的基礎(chǔ)上，通過分割獲得目標(biāo)的形狀信息，并與已知的待識(shí)別目標(biāo)的形狀特征進(jìn)行比較，實(shí)現(xiàn)目標(biāo)分類。目標(biāo)的形狀特征通常由一組參數(shù)來描述，如不變矩、Fourier描繪子、各線特征的起點(diǎn)和終點(diǎn)、各點(diǎn)特征(角點(diǎn)、形殊點(diǎn))的位置等。故傳統(tǒng)的特征提取方法可視作參數(shù)化方法。但由于目標(biāo)分割問題自身的內(nèi)在復(fù)雜性，目前還不存在通用的、理想的目標(biāo)分割方法。近年來，人們的注意力較多地集中于所謂的無分割(Segmentation Free)目標(biāo)識(shí)別，即利用目標(biāo)的灰度信息提取某些統(tǒng)計(jì)特征(如全局的或局部的灰度均值、灰度標(biāo)準(zhǔn)差等)，構(gòu)成目標(biāo)的特征，并將其作為神經(jīng)網(wǎng)絡(luò)的輸入，對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)即可用于目標(biāo)識(shí)別，這是一類非參數(shù)化的特征提取技術(shù)。具體實(shí)現(xiàn)時(shí)，可供采用的特征提取方法很多，簡(jiǎn)單的如進(jìn)行方向投影或提取方向邊緣特征等，復(fù)雜的如采用各種局部或全局變換等。本文重點(diǎn)研究了一種非參數(shù)化的特征提取方法——感興趣算子圖像特征提取方法。
1 感興趣算子特征提取方法
　　感興趣算子(Interest Operator)提取的是圖像在其水平、垂直和二個(gè)對(duì)角線方向上的灰度方差。圖1為感興趣算子特征提取示意圖。

　　例如對(duì)一幅大小為50×60象素的圖像采用上面的方法進(jìn)行特征提取，則選取的圖像子塊像素大小為5×5。因此可以將原圖像劃分成無重疊的120個(gè)子塊，然后針對(duì)每個(gè)圖像子塊提取圖像的感興趣特征向量。
2 模塊化的神經(jīng)網(wǎng)絡(luò)
　　模塊化神經(jīng)網(wǎng)絡(luò)由若干獨(dú)立訓(xùn)練的子網(wǎng)絡(luò)組成，每一子網(wǎng)絡(luò)分別針對(duì)訓(xùn)練樣本集的某一子集進(jìn)行分類識(shí)別，通過組合各子網(wǎng)絡(luò)的分類決策確定最終的識(shí)別結(jié)果。訓(xùn)練樣本集各子集的劃分采用了數(shù)據(jù)分組技術(shù)，即將樣本根據(jù)一定的相似性準(zhǔn)則劃分為多組。如此分組后，各網(wǎng)絡(luò)僅需解決一個(gè)更為簡(jiǎn)單的分類問題，因此可提高分類識(shí)別概率。
2.1 基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)
　　基于特征分解的模塊化神經(jīng)網(wǎng)絡(luò)按照某種規(guī)則將圖像特征分成幾個(gè)不同的特征組。每個(gè)特征組都用一個(gè)獨(dú)立的神經(jīng)網(wǎng)絡(luò)來訓(xùn)練識(shí)別，然后由一個(gè)融合網(wǎng)絡(luò)將各獨(dú)立神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果綜合得到最后的識(shí)別結(jié)果。這種算法的優(yōu)點(diǎn)是：通過分組，每個(gè)用于識(shí)別的神經(jīng)網(wǎng)絡(luò)只需要處理某一部分特征而不是全部，從而減少了單個(gè)網(wǎng)絡(luò)的自由參數(shù)，降低了問題的復(fù)雜度。
2.2 基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)
　　基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)框圖如圖2所示。

　　該算法的實(shí)現(xiàn)包括以下幾個(gè)步驟：
　　(1)將原始圖像按照某種規(guī)則分成若干圖像子塊，各個(gè)圖像子塊間可以有交叉也可以無交叉。圖3和圖4分別為有交叉和無交叉圖像分塊的示意圖。

　　(2)對(duì)每一個(gè)圖像子塊進(jìn)行特征提取，得到其相應(yīng)的圖像特征。本文選用了感興趣算子的特征提取方法。
　　(3)對(duì)步驟(2)經(jīng)過特征提取所得到的圖像特征向量進(jìn)行特征選擇，以去除特征向量間的冗余特征和選出具有更強(qiáng)分類識(shí)別能力的特征，從而降低特征維數(shù)，減小識(shí)別算法中神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模。
　　(4)對(duì)每幅子圖分別用一個(gè)單獨(dú)的BP網(wǎng)絡(luò)對(duì)其進(jìn)行訓(xùn)練或識(shí)別。
　　(5)將各個(gè)獨(dú)立BP網(wǎng)絡(luò)的輸出結(jié)果送到一個(gè)融合網(wǎng)絡(luò)中進(jìn)行融合從而得到最終判識(shí)結(jié)果。
　　基于圖像子塊的特征分組神經(jīng)網(wǎng)絡(luò)除了可以降低問題的復(fù)雜性外，還具有一定的抗局部遮擋能力。由于一些人為的或非人為的因素，目標(biāo)圖像可能會(huì)受到局部遮擋的影響。由于局部遮擋本身的復(fù)雜性和其對(duì)目標(biāo)遮擋部位的不可預(yù)測(cè)性，使得抗遮擋成為一個(gè)相對(duì)困難的課題?；趫D像子塊的特征分組策略具有一定的抗局部遮擋能力。
　　設(shè)原圖像在長(zhǎng)度和寬度方向分別被等分為X和Y份，于是可以得到X×Y個(gè)子塊圖像。若局部遮擋處于第(i，j)個(gè)子塊上，則只有該子塊受到影響并導(dǎo)致與它對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行錯(cuò)誤判識(shí)的可能性增大。但是由于其他子塊及對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)的判識(shí)并未受到遮擋影響，因此至少可以得到X×Y-1個(gè)網(wǎng)絡(luò)的正確輸出。經(jīng)過融合網(wǎng)絡(luò)，最終可以消除對(duì)第(i，j)個(gè)子塊圖像的錯(cuò)誤判識(shí)的影響而得到正確的識(shí)別結(jié)果，達(dá)到抗遮擋的效果。當(dāng)然，實(shí)際應(yīng)用中局部遮擋可能會(huì)存在于不止一個(gè)子塊圖像中，但只要這些子塊圖像的數(shù)量占總子塊圖像數(shù)的比重相對(duì)較小，這種特征分組神經(jīng)網(wǎng)絡(luò)識(shí)別策略就可以表現(xiàn)出很好的抗局部遮擋性能。
3 實(shí)驗(yàn)結(jié)果及其分析
　　實(shí)驗(yàn)中訓(xùn)練樣本取kh-11、kh-12、lacrosses三類衛(wèi)星的三個(gè)譜段(CCD：可見光，MIDDLE：中波，LONG：長(zhǎng)波)圖像作為試驗(yàn)用的樣本。
　　(1)訓(xùn)練樣本：取每類不同譜段的圖像001、005、009、L、057共15幅圖像。如果三個(gè)譜段的圖像一起訓(xùn)練，則訓(xùn)練樣本個(gè)數(shù)為15×9＝135；如果只有單譜段圖像參加訓(xùn)練，則訓(xùn)練樣本個(gè)數(shù)為：15×3＝45。
　　(2)識(shí)別樣本：取每類不同譜段的圖像003、007、0011、L、059以及060、061、L、072總共30幅圖像。如果三個(gè)譜段的圖像一起識(shí)別，則識(shí)別樣本個(gè)數(shù)為30×9＝270；如果只有單譜段圖像參加識(shí)別，則識(shí)別樣本個(gè)數(shù)為30×3＝90。
　　表1給出了不同分辨率情況下的正確識(shí)別率。其中，All組實(shí)驗(yàn)表示對(duì)每類三個(gè)譜段的衛(wèi)星圖像進(jìn)行實(shí)驗(yàn)，CCD、MIDDLE和LONG組實(shí)驗(yàn)分別表示對(duì)可見光譜段、中波紅外圖像和長(zhǎng)波紅外圖像進(jìn)行實(shí)驗(yàn)。CCD為可見光圖像，MIDDLE為中波圖像，LONG為長(zhǎng)波圖像。

　　研究中還用最小距離分類器對(duì)提取的不同目標(biāo)的參數(shù)化特征進(jìn)行了實(shí)驗(yàn)，以便觀察其與神經(jīng)網(wǎng)絡(luò)方法的性能差異。在實(shí)驗(yàn)中，三類目標(biāo)的圖片各為3×72=216幅，用奇數(shù)圖作為訓(xùn)練樣本，對(duì)偶數(shù)圖進(jìn)行識(shí)別。表2顯示了在三組不同分辨率下選擇不同特征集得到的識(shí)別結(jié)果。

　　從實(shí)驗(yàn)中可以發(fā)現(xiàn)，常規(guī)分類方法性能不穩(wěn)定，而且其識(shí)別率與神經(jīng)網(wǎng)絡(luò)方法相比要低很多。
參考文獻(xiàn)
1   Choi S M.A segmentation-free recognition of two touching
     numerals using neural network.In：Proceedings of the Fifth
     International Conference on Document Analysis and
     Recognition，1999
2   Ozdil M A，Vural F T Y.Optical character recognition
     without segmentation.In：Proceedings of the Fourth Inter-
     national Conference on Document Analysis and Recogni-
     tion，1997
3   Rocha J，Pavlidis T.Character recognition without segmen-
     tation.IEEE Transactions on，Pattern Analysis and
     Machine Intelligence，1995；17：903
4   Cai C，Shi Z.A modular neural network architecture with
     approximation capability and its applications. The Second
     IEEE International Conference on Cognitive Informatics，
     2003
5   Wang L C，Der S Z，Nasrabadi N M.Automatic target
     recognition using a feature-decomposition and data-
     decomposition modular neural network.IEEE Transactions
     on Image Processing，1998；7：1113

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容