摘 要: 介紹了中國車牌識別的研究背景和現(xiàn)狀,提出了一種基于神經(jīng)網(wǎng)絡(luò)的新方法,并設(shè)計了一種沒有直接預處理的車牌像素圖像的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該圖像變換適用于利用原始車牌來增加訓練數(shù)據(jù)庫。實驗結(jié)果驗證了本車牌識別方法的魯棒性和有無車牌的識別效率。
關(guān)鍵詞: 卷積神經(jīng)網(wǎng)絡(luò);魯棒性;預處理;車牌識別
車輛牌照自動識別系統(tǒng)LPR(License Plate Recognition)是把計算機視覺理論和技術(shù)應(yīng)用于車輛牌照識別的專用系統(tǒng),是計算機視覺與模式識別在智能交通領(lǐng)域中的綜合應(yīng)用,涉及到圖像處理、人工智能、信息論、通信技術(shù)和工程學等多門學科。LPR是智能交通系統(tǒng)ITS(Intelligent Traffic System)中的關(guān)鍵技術(shù)之一[1]。近年來,隨著ITS在社會生活中的廣泛應(yīng)用,LPR也發(fā)展得非???,已經(jīng)逐漸地應(yīng)用到現(xiàn)實生活中。由于LPR具有廣闊的發(fā)展前景,它的開發(fā)和研制工作在國內(nèi)外均受到極大的關(guān)注。
在車牌識別系統(tǒng)中,由于實際使用條件的影響,存在著許多影響識別率的因素,包括背景復雜程度、光照條件的變化、車牌污損以及由于拍攝角度或車輛運動等原因?qū)е伦址冃瓮嵝钡?。這些都對圖像處理和識別算法提出了很高的要求。識別算法中值得重視的是算法的學習能力,當出現(xiàn)新的車牌模式時,算法應(yīng)能很方便地適應(yīng)新模式。目前常用的字符識別算法包括模板匹配、輪廓匹配、拓撲特征檢測、基于Hausdo距離的模板匹配、模糊模式識別和神經(jīng)網(wǎng)絡(luò)等。其中,神經(jīng)網(wǎng)絡(luò)識別方法具有穩(wěn)健性好、識別率高、對殘損字符識別效果好等優(yōu)點,是目前較為流行的識別算法[2]。
但是目前這些技術(shù)大多依賴于圖像預處理前階段的訓練和分類。而本文設(shè)計了一種沒有直接預處理的像素車牌結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)方法的應(yīng)用避免了圖像預處理以及由其出現(xiàn)的去噪問題的影響,以確保沒有相關(guān)資料的不切實際的假設(shè),最大程度地保證了豐富的原始信號被保留。而且本卷積神經(jīng)網(wǎng)絡(luò)已被成功應(yīng)用于視覺圖形裝置,例如手寫字符識別、一般對象識別、人臉識別和行人跟蹤等。
1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是近年發(fā)展起來并引起廣泛重視的一種高效識別方法。20世紀60年代,Hubel和Wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時,發(fā)現(xiàn)其獨特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復雜性,繼而提出了卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)。目前,CNN已經(jīng)成為眾多科學領(lǐng)域的研究熱點之一,特別是在模式分類領(lǐng)域,由于該網(wǎng)絡(luò)避免了對圖像的復雜的前期預處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用[3]。FUKUSHIMA K在1980年提出的新識別機是卷積神經(jīng)網(wǎng)絡(luò)的第一個實現(xiàn)網(wǎng)絡(luò)。隨后,更多的科研工作者對該網(wǎng)絡(luò)進行了改進,其中,具有代表性的研究成果是Alexander和Taylor提出的“改進認知機”[4],該方法綜合了各種改進方法的優(yōu)點并避免了耗時的誤差反向傳播。
CNN的基本結(jié)構(gòu)一般包括兩層:(1)特征提取層。每個神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征。一旦該局部特征被提取后,與其他特征間的位置關(guān)系也隨之確定下來。(2)特征映射層。網(wǎng)絡(luò)的每個計算層由多個特征映射組成,每個特征映射是一個平面,平面上所有神經(jīng)元的權(quán)值相等。特征映射結(jié)構(gòu)采用影響函數(shù)核小的sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù)[5],使得特征映射具有位移不變性。此外,由于一個映射面上的神經(jīng)元共享權(quán)值,因而減少了網(wǎng)絡(luò)自由參數(shù)的個數(shù)。卷積神經(jīng)網(wǎng)絡(luò)中的每一個卷積層都緊跟著一個用來求局部平均與二次提取的計算層,這種特有的二次特征提取結(jié)構(gòu)減小了特征分辨率。
CNN主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形。由于CNN的特征檢測層通過訓練數(shù)據(jù)進行學習,所以在使用CNN時,避免了顯示的特征抽取,而隱式地從訓練數(shù)據(jù)中進行學習。同時,由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學習,這也是卷積網(wǎng)絡(luò)相對于神經(jīng)元彼此相連網(wǎng)絡(luò)的一大優(yōu)勢。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語音識別和圖像處理方面有著獨特的優(yōu)越性,其布局更接近于實際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò),這一特點避免了特征提取和分類過程中數(shù)據(jù)重建的復雜度。
2 卷積神經(jīng)網(wǎng)絡(luò)在車牌識別中的應(yīng)用
為了提高車牌字符的識別率,本文采用一種改進的基于卷積神經(jīng)網(wǎng)絡(luò)的識別機完成字符識別,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。圖中,S層為簡單(simple)神經(jīng)元組成的神經(jīng)層,完成特征提取,其輸入連接是可變的,并在學習過程中不斷更正。C層則是由復雜(complex)神經(jīng)元組成的神經(jīng)層,它的輸入連接是固定的,不可修改,顯示接收信心被激勵位置的近似變化。網(wǎng)絡(luò)中C層的最后一層為識別層,可以顯示模式識別的結(jié)果。經(jīng)過學習,網(wǎng)絡(luò)可以自動地識別輸入模式,而不受輸入圖片扭曲、縮放和位移的影響。


3 訓練集和測試集的描述
在訓練集中同時需要常規(guī)積極樣本和消極樣本,因此本文建立了人工采樣的不同領(lǐng)域收集得到實時交通場景的400輛車牌圖像積極訓練集。大多數(shù)基于學習方法的中國牌照的車牌識別使用一個大約為16×48的輸入窗口[9],因為作為最小的一個窗口可以做到不遺漏任何重要信息??紤]到字符識別的進程,選擇了中央部分窗口車牌,如大小為20×60的直方圖、均衡和整體亮度校正都沒有強度,正常情況下都適用于裁剪的車牌。卷積神經(jīng)網(wǎng)絡(luò)的魯棒性具有規(guī)模和地位上的優(yōu)勢,因此本文的目標是為其魯棒性提供不規(guī)范的樣本。
為了創(chuàng)造更多的樣本,并加強不變性的強度,色彩轉(zhuǎn)換和對比還原轉(zhuǎn)換適用于所有原有的訓練樣本,最后得到的積極樣本訓練集包括2 400塊車牌。圖2是一些車牌的實物圖。

4 實驗結(jié)果
實驗共分兩步進行,前期對采集到的車牌圖片進行預處理(包括定位、分割等),后期首先選取理想預處理條件下得到的200個20×60的樣本圖片(每個字符為20個)[10]訓練卷積神經(jīng)網(wǎng)絡(luò),得到各層的權(quán)值、閾值及神經(jīng)元細胞平面數(shù),然后使用優(yōu)化后的神經(jīng)網(wǎng)絡(luò)識別機對200個20×60的(每個字符為20個)測試樣本字符圖像進行識別,其正確的識別率達到99%。
對于神經(jīng)網(wǎng)絡(luò),過度訓練是一個不可忽視的嚴重問題。當過度訓練時,雖然訓練錯誤不斷減少,但是隨著時間的推移,測試誤差經(jīng)過最小值后開始一定數(shù)量的增加迭代,并且可以觀察到這一現(xiàn)象的識別率并不穩(wěn)定。其學習曲線如圖3所示。

實驗結(jié)果表明,CNN用于車牌識別切實可行,訓練樣本空間覆蓋越完備則識別率越高。卷積神經(jīng)網(wǎng)絡(luò)通過避免顯式的特征提取過程,隱式地從訓練樣本中獲取對構(gòu)筑訓練樣本空間貢獻較大的特征,與傳統(tǒng)網(wǎng)絡(luò)相比有更高的識別率和抗干擾性[11]。識別失敗原因是該類樣本在訓練樣本庫中未曾出現(xiàn)或出現(xiàn)較少。
本文利用神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,采用一種改進的基于卷積神經(jīng)網(wǎng)絡(luò)的識別機制對車牌照中的字符進行識別。該識別方法通過對理想預處理條件下的車牌字符圖片的學習,優(yōu)化了網(wǎng)絡(luò)系統(tǒng)中各層的權(quán)值參數(shù),大大提高了車牌照中的字符識別率。但實際應(yīng)用中,前期預處理會出現(xiàn)車牌定位不清、字符分割錯誤等缺點,這些都會影響識別效果,降低實際識別率。因此,在今后的工作中,將對網(wǎng)絡(luò)結(jié)構(gòu)提出進一步的改進,使其可以識別預處理較差條件下的車牌字符。
參考文獻
[1] 高雋.智能信息處理方法導論[M].北京:機械工業(yè)出版社,2004.
[2] 邊肇祺.模式識別[M].北京:清華大學出版社,1987.
[3] 高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實例[M].北京:機械工業(yè)出版社,2003.
[4] NEUBAUER C. Evaluation of convolutional neural networks for visual recognition[J]. Neural Netwoks, 1998,9(4):685-696.
[5] Li Baoqing, Li Baoxin. Building pattern classifiers using convolutional neural networks[J]. Neural Networks, 2001,5(3):3081-3085.
[6] 唐漢征.車牌識別系統(tǒng)的工作原理及其應(yīng)用[J].現(xiàn)代電子工程,2004,2(1):66-69.
[7] FUKUSHIMA K. Neocognitron for handwritten digit recognition[J]. Neurocomputing, 2003:161-180.
[8] FUKUSHIMA K. Neocognitron: a hierarchical neural network capable of visual pattern recognition[J]. Neural Networks, 1988,1(2):119-130.
[9] 魏武. 一種基于模板匹配的車牌識別方法[J].中國公路學報,2001(1):104-106.
[10] 王璞.車牌字符識別的混合特征提取方法[J].沈陽工業(yè)學院學報,2004(3):30-33.
[11] HAGAN M T, DEMUTH H B, BEALE M H.神經(jīng)網(wǎng)絡(luò)設(shè)計[M].北京:機械工業(yè)出版社,2002.
