《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 基于在線序列極限學(xué)習(xí)機的車牌字符識別方法

基于在線序列極限學(xué)習(xí)機的車牌字符識別方法

2016-02-21
作者:崔雷濤,陳 亮,馬 強
來源:2015年微型機與應(yīng)用第23期

  摘  要: 當(dāng)前基于神經(jīng)網(wǎng)絡(luò)方法的車牌字符識別技術(shù)都使用固定的訓(xùn)練樣本,學(xué)習(xí)的效果受初始樣本限制,對于識別過程中新出現(xiàn)的不同角度、光線等特征的字符圖片不能自適應(yīng)地學(xué)習(xí)。本文針對這個問題提出了基于在線序列極限學(xué)習(xí)機(OS-ELM)的車牌字符識別方法。在樣本實時更新中使系統(tǒng)自適應(yīng)調(diào)整網(wǎng)絡(luò)權(quán)值,不斷提高識別準(zhǔn)確率。本文設(shè)計了漢字、字母、字母混合數(shù)字三個字符分類器,根據(jù)車牌字符的排列特征識別相應(yīng)的字符。通過與傳統(tǒng)ELM方法和BP神經(jīng)網(wǎng)絡(luò)法對比,結(jié)果證明該字符識別技術(shù)達到了較高的識別率,在訓(xùn)練速度上也比BP神經(jīng)網(wǎng)絡(luò)法提高了2~3個數(shù)量級。

  關(guān)鍵詞: 車牌字符識別;極速學(xué)習(xí)機;在線序列;特征提取

0 引言

  車牌識別是智能交通系統(tǒng)(Intelligent Transportation System,ITS)的重要組成部分。在交通擁堵、停車場管理和套牌檢測等眾多領(lǐng)域得到了廣泛的應(yīng)用。在車牌識別系統(tǒng)中字符識別是核心與難點,目前字符識別方法主要有模板匹配法、神經(jīng)網(wǎng)絡(luò)技術(shù),以及兩者的聯(lián)合應(yīng)用。

  中國大陸車牌字符中含一位漢字且漢字結(jié)構(gòu)復(fù)雜,識別困難,出錯率高,模板匹配法對于相似的字符區(qū)分能力差,同時受光線和天氣等復(fù)雜情況的影響,在特征數(shù)據(jù)維數(shù)過大時效率較低。神經(jīng)網(wǎng)絡(luò)技術(shù)以BP(Back Propagation)算法居多[1-2]。BP神經(jīng)網(wǎng)絡(luò)具有良好的自學(xué)習(xí)性和存儲知識的能力,但網(wǎng)絡(luò)的訓(xùn)練速度慢,存在局部最優(yōu)解等問題。因而基于該方法的車牌字符識別只能離線訓(xùn)練樣本,測試精度也較依賴于初始樣本的全面性。

  Huang等[3-5]提出了極限學(xué)習(xí)機(Extreme Learning Machine,ELM),設(shè)置合適的隱藏層節(jié)點數(shù),為輸入權(quán)值和隱藏層偏差隨機賦值,輸出層權(quán)值通過最小二乘法得到,整個過程一次完成,無需迭代,與BP神經(jīng)網(wǎng)絡(luò)相比學(xué)習(xí)速度顯著提高,于是出現(xiàn)了一些基于ELM及其改進算法的車牌識別方法。Gou Chao等[6]利用ELM算法構(gòu)建分類器,設(shè)計了完整的車牌識別系統(tǒng),取得了較好的分類性能。但是所采用的訓(xùn)練樣本始終是初始樣本集,對于車牌識別,初始訓(xùn)練樣本包含全部拍攝角度的車牌字符圖片是比較困難的,所以ELM算法對于新出現(xiàn)的字符樣本沒有學(xué)習(xí)能力,限制了網(wǎng)絡(luò)的魯棒性和泛化能力。因此有必要尋找一種算法,可以將就近識別的樣本加入訓(xùn)練集,做到實時訓(xùn)練。

  本文設(shè)計了基于在線序列極限學(xué)習(xí)機[7](Online Sequential Extreme Learning Machine,OS-ELM)的車牌識別分類器,能夠在小樣本數(shù)量的基礎(chǔ)上,實時訓(xùn)練,自適應(yīng)調(diào)整網(wǎng)絡(luò)參數(shù),可快速地獲得高識別率。并提出一種新的適合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特征提取方式,以降低提取特征的維度,滿足車牌識別準(zhǔn)確性、魯棒性和實時性要求。

1 車牌字符的特征提取

  本文主要采用字符的網(wǎng)格特征和圖像矩陣行列信息作為待識別的字符特征。由于漢字字符筆劃錯綜復(fù)雜且分布不均,而字母和數(shù)字字符相對比較簡單,容易提取特征值,因而在提取特征方法的具體實施上兩者有所差別,以便后續(xù)投入不同的分類器。

  對漢字的特征提取具體步驟為:

 ?。?)網(wǎng)格特征提取。將歸一化后的漢字字符(大小為32×16)平均劃分成4×4大小相等的子區(qū)域,計算每個子區(qū)域中白色像素值數(shù)量,產(chǎn)生32個網(wǎng)格特征。

 ?。?)行列特征信息提取。從漢字圖像第一行開始,提取第一行中白色像素點的個數(shù),之后將每隔兩行的下一行定為目標(biāo)行,逐一統(tǒng)計目標(biāo)行中的白點數(shù)。用同樣方法對圖像矩陣列進行操作。至此,提取出17個行列特征信息值。漢字“浙”的字符特征提取過程示例如圖1。

001.jpg

  對于英文字母字符和數(shù)字字符的特征提取,也是采用網(wǎng)格特征結(jié)合行列特征的提取方法。但是由于字母、數(shù)字結(jié)構(gòu)簡單,為便于訓(xùn)練,提取較小維數(shù)的向量作為特征向量。本文提取了16個網(wǎng)格特征和9個行列信息特征共25維特征向量。

2 車牌字符分類器的設(shè)計

  本文根據(jù)車牌字符的排列特點構(gòu)造了三個基于OS-ELM的子網(wǎng)絡(luò)分類器,分別為漢字字符分類器、字母字符分類器以及字母/數(shù)字混合字符分類器,一方面降低了識別時間,另一方面也提高了識別精度。三種分類器如圖2所示。

002.jpg

  分類器配置方面,提取的特征向量維數(shù)即輸入節(jié)點數(shù)目。訓(xùn)練樣本中漢字字符有14種,分別為魯、京、浙、豫、粵、陜、遼、蘇、吉、瓊、滬、桂、冀、閩;車牌中沒有O和I兩個字母,所以字母有24種,字母加數(shù)字有34種。三種分類器配置如表1。

005.jpg

  3 OS-ELM車牌字符識別算法設(shè)計

  傳統(tǒng)的極限學(xué)習(xí)機只能學(xué)習(xí)不變的數(shù)據(jù),而如果初期訓(xùn)練樣本不能包含全部角度的字符圖片,則新字符圖片由于具有不同角度,以及受遮擋、污跡等影響特殊特征會難以識別,故而限制了網(wǎng)絡(luò)的泛化能力。部分特殊特征的字符圖片如圖3所示。

003.jpg

  所以本文采用OS-ELM算法,將后繼車牌樣本分批加入訓(xùn)練,增強網(wǎng)絡(luò)的泛化能力,構(gòu)建基于在線序列極限學(xué)習(xí)的車牌識別方法。網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖4。以漢字分類器設(shè)計為例,將提取400張漢字字符圖片特征數(shù)據(jù)均分為4批先后輸入網(wǎng)絡(luò),學(xué)習(xí)過程如下:

004.jpg

 ?。?)初始化階段。取k=0,其中k為送到網(wǎng)絡(luò)的字符數(shù)據(jù)批次。給定激活函數(shù)A}SS{R21]1]}YQ@G0JPJA75.png,隱層節(jié)點數(shù)目L和初始訓(xùn)練數(shù)據(jù)QGZZ)V19XCSI{92O_ZW18GL.png,其中xi為輸入特征向量,ti為每個特征向量對應(yīng)的字符類別,N0=100,L由交叉驗證法試驗后取為40。隨機產(chǎn)生輸入權(quán)值向量ωj和偏置bj初始化網(wǎng)絡(luò),則由參考文獻[6],輸出權(quán)值向量?茁(0)=P0H0TT0。其中:

  12.png

 ?。?)在線學(xué)習(xí)階段。給定第k+1批數(shù)據(jù),計算出隱層輸出矩陣為Hk+1,輸出權(quán)值向量為:

  34.png

  令k=k+1,返回到在線學(xué)習(xí)階段,不斷更新參數(shù)H和β,直到學(xué)習(xí)完4批數(shù)據(jù)。

  4 實驗結(jié)果及分析

  實驗中選取了100幅實際的車牌圖片。用三個OS-ELM分類器進行整體的識別。隱藏層節(jié)點數(shù)目本文用5折交叉驗證法選擇最優(yōu)數(shù)目。識別速度取50次測試結(jié)果的平均值。識別結(jié)果如表2所示。

  本文還將OS-ELM法與已有的ELM法、BP神經(jīng)網(wǎng)絡(luò)的車牌字符識別方法進行了實驗結(jié)果的比較。具體比較為:從大量準(zhǔn)確分割出的單個字符中選取100張包含字母及數(shù)字的字符圖像作為對比測試樣本,100張作為ELM法和BP神經(jīng)網(wǎng)絡(luò)法的訓(xùn)練樣本,同時作為OS-ELM訓(xùn)練樣本的第一批輸入樣本,再選取200張字符圖片分別作為ELM法的第二、第三批訓(xùn)練樣本。測試結(jié)果如表3所示,其中識別結(jié)果采取50次識別結(jié)果的平均值。

  從表2、表3的實驗對比結(jié)果可以看出,BP神經(jīng)網(wǎng)絡(luò)算法由于本身繁瑣的迭代過程,因而訓(xùn)練耗費時間很長。OS-ELM法相比于BP神經(jīng)網(wǎng)絡(luò)法不僅在字符的識別率上表現(xiàn)出了更令人滿意的效果,能達到90%以上,而且在識別速度上更是體現(xiàn)出很大的優(yōu)越性,訓(xùn)練速度比BP法高出近200倍。與ELM法相比,識別速度相差不多,但有更好的泛化性能。

5 結(jié)束語

  本文采用在線序列學(xué)習(xí)機算法對車牌字符進行識別,與BP法相比訓(xùn)練時間短,能夠滿足在線訓(xùn)練的要求;與ELM法相比有更好的泛化能力。采用字符的網(wǎng)格特征和圖像矩陣行列信息提取的特征提取方法,降低了特征維數(shù)。針對車牌字符的排列特征,設(shè)計了漢字、字母、字母與數(shù)字三個分類器,能夠提高分類準(zhǔn)確率并且縮短運算時間。該車牌字符識別技術(shù)可以應(yīng)用于道路監(jiān)控中對實時性要求較高的場合。

參考文獻

  [1] KOVAL V, TURCHENKO V, KOCHAN V. Smart license pattern recognition system based on imaging processing using neural network[C]. Procedings of the  Second IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing System-technology and Applications. Lviv, Ukraine: IEEE press,2003:123-127.

  [2] 劉雄飛,朱盛春.車牌字符多特征提取與BP神經(jīng)網(wǎng)絡(luò)的識別算法[J].計算機仿真,2014,31(10):161-164.

  [3] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006,70(1):489-501.

  [4] HUANG G B, WANG D H, LAN Y. Extreme learning machines: a survey[J]. Intelligent Journal of Machine Learning and Cybernetics, 2011,2(2):107-122.

  [5] HUANG G B, ZHOU H M, DING X J, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on System, Man, and Cybernetics, 2012,42(2):513-529.

  [6] Gou Chao, Wang Kunfeng, Yu Zhongdong. License plate recognition using MSER and HOG based on ELM[C]. IEEE Service Operation and Logistics, and Informatics,2014:217-221.

  [7] Liang Nanying, Huang Guangbin, SARATCHANDRAN P, et al. A fast and accurate online sequential learning algorithm for feedforward networks[J]. IEEE Transactions on Neural Networks, 2006,17(6):1411-1423.


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。