[摘要] 本文提出了一種對噴碼文字的識別方法,先通過對字體輪廓、網(wǎng)格、投影等特征提取,然后,根據(jù)統(tǒng)計的特征所形成的分類器,進行投票法判決,最后針對文字體輪廓特征特別接近,提取內沿的局部特征進行第二次判決。這種方法已經(jīng)在工業(yè)應用中取得了很好的效果。
[關鍵詞] 特征提取 字體識別
一.概述
當今在發(fā)票,車票及門票上的數(shù)字均由噴碼產(chǎn)生,由于受噴碼時墨量和光照的影響,能產(chǎn)生多種變形,給我們的識別造成了很多難點。
圖1
二 我們的方法
1.切割和歸一化
先對圖像的文字部分進行橫向和縱向切割,我們采用的是投影的方法,然后再對切割出來的部分,進行大小歸一化,歸一化的方法主要兩種,一種是普通的大小縮放,我們采用的是另外的一種方法.我們先求出文字的質心。
式(1)中 為1時表示該像素點為黑像素,為0時表示該像素點為背景。
然后再計算水平和垂直方向的散度:
2. 特征的提取
我們分別提取了待識別字體的網(wǎng)格特征,水平和垂直方向的投影特征,以及字體的邊緣特征,但是對于光照的差別比較大的情況,這些方法受到的影響是非常大的,因為在光照偏弱的情況下,象素點的個數(shù)明顯減少,以及造成字體邊緣的缺損。對于零這個字體。
為了避免由此帶來的識別錯誤我們對先切出來的字體進行象素點比率的統(tǒng)計,假如當它小于一個特定的門限值得時候,對它實施開運算,大于門限值得時候進行閉運算。(c)為(a)圖進行膨脹后的結果,(d)為(b)細化后的結果.對于所提取的特征值我們通過正規(guī)化相交的公式求得最后的分類器。
其中 為由字體算得特征相量, 是待識別字體算得相量。然后根據(jù)這三個分類器通過簡單投票法形成多分類器進行判別,即有兩個或兩個以上形成決策A,認為A是合法的。若每個分類器形成的決策是不多的,我們就選定公式3中算的最大值作為分類器決策。假設三種特征的識別正確率分別為p1,p2,p3.那么我們的方法在理論上能達到的正確識別率為:
P = p1*p2(1-p3)+p2*p3(1-p1)+p1*p3(1-p2)+p1*p2*p3
三 實驗結果
運用我們上訴的方法,對圖象進行識別,我們的算法能夠給出正確的結果。
四結論
對我們的算法進行了一系列的測試和統(tǒng)計發(fā)現(xiàn)正確的識別率一般在99.9%以上,但是現(xiàn)在最大的問題是由于噴碼文字邊緣的不規(guī)則性,這就造成了Q,0,O,D之間有著極大的相似性。對于這類相似文字,我們對識別結果又加了一些局部特征量的判斷比如說內沿特征,來進一步提高識別率。
上海哲佑電子科技有限公司 陸峰
五參考文獻
1.丁曉青 郭繁夏 漢字識別技術的發(fā)展 電子科技導報?。保梗梗?04
2.征荊 丁曉青 吳佑壽 郭繁夏 兼顧連筆和順筆的聯(lián)機手寫漢字的識別方法 清華大學學報(自然科學版)1997.09
3.林曉帆 丁曉青 吳佑壽 基于置信度分析和多信息融合的高性能手寫數(shù)字識別