《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 設計應用 > 數(shù)據(jù)融合在車牌字符識別中的應用
數(shù)據(jù)融合在車牌字符識別中的應用
來源:微型機與應用2012年第7期
岳 鵬1,李慧娜2,任 璇3
(1.中電第20研究所,陜西 西安 710068; 2.西安交大出版社,陜西 西安 710049;
摘要: 將D-S證據(jù)理論引入車牌字符識別,結(jié)合神經(jīng)網(wǎng)絡容錯能力強、能夠自適應學習等優(yōu)點,對待識別字符進行統(tǒng)計和結(jié)構(gòu)等多方面的特征提取后,分別經(jīng)過神經(jīng)網(wǎng)絡分類器得到相應的結(jié)果,并應用D-S證據(jù)理論對各種結(jié)果進行數(shù)據(jù)融合,從而實現(xiàn)了字符各方面特征的優(yōu)勢互補,進一步提高了字符識別的成功率。
Abstract:
Key words :

摘  要:D-S證據(jù)理論引入車牌字符識別,結(jié)合神經(jīng)網(wǎng)絡容錯能力強、能夠自適應學習等優(yōu)點,對待識別字符進行統(tǒng)計和結(jié)構(gòu)等多方面的特征提取后,分別經(jīng)過神經(jīng)網(wǎng)絡分類器得到相應的結(jié)果,并應用D-S證據(jù)理論對各種結(jié)果進行數(shù)據(jù)融合,從而實現(xiàn)了字符各方面特征的優(yōu)勢互補,進一步提高了字符識別的成功率。
關鍵詞: 字符識別;特征提取;D-S證據(jù)理論;數(shù)據(jù)融合

 字符識別是模式識別的一個重要分支,是LPR系統(tǒng)中最后一個環(huán)節(jié),同時也是一個典型的大類別數(shù)模式識別問題。在車牌字符識別的過程中需要處理大量字符信息,傳統(tǒng)的字符識別流程如圖1所示。

 通常提取的特征主要有紋理特征、顏色特征、形狀特征和空間關系特征等[1]。本文將待識別字符的統(tǒng)計特征和結(jié)構(gòu)特征都提取出來,揚長避短,發(fā)揮各自優(yōu)點。分別使用神經(jīng)網(wǎng)絡的分類器得到相應的結(jié)果,再將各種結(jié)果通過D-S證據(jù)理論進行數(shù)據(jù)融合,充分利用字符各方面特征,從而達到進一步提高字符識別成功率的目的。
1 字符識別
1.1 預處理

 對輸入的數(shù)字圖像先進行定位、二值化、去噪和大小規(guī)格化等預處理工作,這一環(huán)節(jié)是字符識別的重要步驟。二值化主要把原始圖像轉(zhuǎn)換成識別器所能接收的形式,尺寸和位置的規(guī)格化主要是消除一些與類別無關的因素。
1.2 特征提取
 本文主要從待識別字符中提取基于網(wǎng)格特征和基于方向線素特征兩組統(tǒng)計特征,后者主要是對數(shù)字圖像分別在水平方向和垂直方向三等分的地方作水平線和垂直線穿過字符看其與字符邊緣交叉的次數(shù),以此作為特征進行提取。雖然這兩組特征已然包含了較多的信息,具備一定的識別成功率,但是僅從這兩個特征入手還存在明顯的不足:(1)它們都是在尺寸歸一化以后進行的,寬高比信息并沒有體現(xiàn)出來,這樣常導致“1”與其他的數(shù)字混淆;(2)由于是統(tǒng)計特征,對字形結(jié)構(gòu)的描述不足,使得一些在統(tǒng)計特征上差別很小但結(jié)構(gòu)完全不同的字符發(fā)生混淆,如“3”和“8”。鑒于此,本文又引入了寬高比和孔洞數(shù)兩個結(jié)構(gòu)特征。誠然,僅憑這兩個結(jié)構(gòu)特征并不能完成徹底的分類效果,但與前面的統(tǒng)計特征有很好的獨立性,通過合適的集成方式,能夠進一步提高系統(tǒng)的識別成功率。
1.3 BP神經(jīng)網(wǎng)絡分類器
 BP神經(jīng)網(wǎng)絡的核心目的是通過梯度下降法讓網(wǎng)絡的實際輸出和期望的均方差最小。BP神經(jīng)網(wǎng)絡學習訓練的過程由信息的正向傳播和誤差的反向傳播兩個過程組成。當實際輸出與期望輸出不符時,進入誤差的反向傳播階段。神經(jīng)網(wǎng)絡學習訓練的過程就是周而復始的信息正向傳播和誤差反向傳播過程,同時也是各層權(quán)值不斷調(diào)整的過程。該過程一直持續(xù)到網(wǎng)絡實際輸出的誤差減少到可以接受的程度,或者預先設定的學習次數(shù)為止。
 雖然BP神經(jīng)網(wǎng)絡具有一定的先進性,但也存在著一定的缺陷:
?。?)BP算法根據(jù)梯度下降學習法進行學習時,可以使權(quán)值收斂到某個值,但無法保證該值為誤差平面的全局最小值??梢圆捎酶郊觿恿糠▉斫鉀Q該問題。
 (2)隱層和隱層節(jié)點的數(shù)目尚無理論上的指導,只能通過經(jīng)驗或反復實驗確定。
?。?)由于學習的速率是固定不變的,因此BP神經(jīng)網(wǎng)絡收斂的速度比較慢,訓練時間較長。
?。?)網(wǎng)絡的學習和記憶具有不穩(wěn)定性。
 因此,在字符識別的過程中,如果應用BP神經(jīng)網(wǎng)絡的方法,還需要根據(jù)具體的情況做相應的修改,使其發(fā)揮應有的優(yōu)勢。
 本文采用3組BP神經(jīng)網(wǎng)絡作為分類器,輸入向量分別為以上提取的統(tǒng)計和結(jié)構(gòu)特征向量,統(tǒng)計特征向量包括粗網(wǎng)格特征和方向線素特征兩組,結(jié)構(gòu)特征向量為寬高比和孔洞數(shù)。輸出向量為3組向量,第1組為42維向量,其中每個分量分別與32個省市區(qū)漢字的簡稱和10個部隊、軍區(qū)等特殊機關部門的簡稱相對應;第2組為26維向量,其中每個分量分別與英文字母A~Z相對應;第3組為10維向量,其中每個分量分別與數(shù)字0~9相對應。傳遞函數(shù)采用Sigmoid函數(shù)。訓練時,對應每個輸入的數(shù)字圖像,輸出向量中相應位置分量賦值1;測試時,為了得到下一步證據(jù)理論所需的基本概率數(shù),還需對輸出向量的分量按式(1)進行處理:


?。?)不確定性區(qū)間長度必須小于某一閾值r;
?。?)目標類別的信任度值必須大于不確定性區(qū)間長度。
 關于閾值的選取并沒有一個統(tǒng)一的標準,只能根據(jù)實際情況加以確定,閾值過大或過小都會直接影響到識別成功率,本文選取ε=0.1,r=0.3。
2 實驗結(jié)果分析
 本文所設計的車牌識別系統(tǒng)Vision1.0采用VisualC++6.0開發(fā)工具,并在具有Core(TM)2Duo CPU、2 GB內(nèi)存的計算機上實驗得到數(shù)據(jù),支持像素100×100以上BMP和JPG格式圖像文件,具有一定的識別精度。
部分車牌識別實驗的結(jié)果如圖2~圖7所示,實驗結(jié)果分析如表1所示。

 

 

 實驗結(jié)果表明,該方法實現(xiàn)了普通車牌的字符識別功能,并能應用于不同環(huán)境、不同顏色車牌的識別當中。通過大量實驗不難發(fā)現(xiàn),車牌字符識別的關鍵取決于漢字字符的識別成功與否,如果能夠成功識別出漢字字符,則在理想狀態(tài)下基本能夠準確識別車牌中其余的英文字符和數(shù)字字符。如表1所示,有6個車牌是在漢字識別成功后未能成功識別其他字符的情況,主要是由于字符受損嚴重或受污染,導致無法正常匹配識別。對于識別過程中暴露的不足,在今后的工作中還有待完善。此外,由于識別漢字字符過程中對資源消耗較大,導致識別速度指標不甚理想,在后續(xù)的研究中還需改進。
參考文獻
[1] 周培德.計算幾何-算法分析與設計[M].北京:清華大學出版社,2008.
[2] 寧坤,劉翌南,楊潔,等.基于數(shù)據(jù)融合的識別方法研究[J].無線電工程,2004,34(12):56-57.
[3] 王奉濤,馬孝江,朱泓,等.基于Dempster-Shafer證據(jù)理論的信息融合在設備故障診斷中應用[J].大連理工大學學報,2003,43(4).
[4] 何友,王國宏,彭應寧.多傳感器信息融合及應用[M].北京:電子工業(yè)出版社,2001.
[5] 焦準,王偉平,張蓉.基于證據(jù)理論的多傳感器信息融合目標識別方法[J].彈箭與制導學報,2006,26(4):276-278.
[6] 龐圣波,王力宏,王培進.證據(jù)理論合成公式的討論及一些修正[J].計算機工程與應用,2007,43(20):56-59.
[7] 李弼程,王波,魏俊,等.一種有效的證據(jù)理論合成公式[J].數(shù)據(jù)采集與處理,2002,17(1):34-36.
[8] 何冰,胡紅麗.一種修正的D2S證據(jù)融合策略[J].航空學報,2003,24(6):559-561.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。