本文提出了一種對(duì)噴碼文字的識(shí)別方法,先通過(guò)對(duì)字體輪廓、網(wǎng)格、投影等特征提取,然后,根據(jù)統(tǒng)計(jì)的特征所形成的分類器,進(jìn)行投票法判決,最后針對(duì)文字體輪廓特征特別接近,提取內(nèi)沿的局部特征進(jìn)行第二次判決。這種方法已經(jīng)在工業(yè)應(yīng)用中取得了很好的效果。
一.概述
當(dāng)今在發(fā)票,車票及門票上的數(shù)字均由噴碼產(chǎn)生,由于受噴碼時(shí)墨量和光照的影響,能產(chǎn)生多種變形,給我們的識(shí)別造成了很多難點(diǎn)。
機(jī)器視覺(jué)成功應(yīng)用于噴碼文字識(shí)別" border="0" src="http://www.gongso.com/images/hyyy/2009/11/27/BDF5B0DF80364903B9061E12D6624C11.jpg" />
圖1
二 我們的方法
1.切割和歸一化
先對(duì)圖像的文字部分進(jìn)行橫向和縱向切割,我們采用的是投影的方法,然后再對(duì)切割出來(lái)的部分,進(jìn)行大小歸一化,歸一化的方法主要兩種,一種是普通的大小縮放,我們采用的是另外的一種方法.我們先求出文字的質(zhì)心。
式(1)中 為1時(shí)表示該像素點(diǎn)為黑像素,為0時(shí)表示該像素點(diǎn)為背景。
然后再計(jì)算水平和垂直方向的散度:
2. 特征的提取
我們分別提取了待識(shí)別字體的網(wǎng)格特征,水平和垂直方向的投影特征,以及字體的邊緣特征,但是對(duì)于光照的差別比較大的情況,這些方法受到的影響是非常大的,因?yàn)樵诠庹掌醯那闆r下,象素點(diǎn)的個(gè)數(shù)明顯減少,以及造成字體邊緣的缺損。對(duì)于零這個(gè)字體。
為了避免由此帶來(lái)的識(shí)別錯(cuò)誤我們對(duì)先切出來(lái)的字體進(jìn)行象素點(diǎn)比率的統(tǒng)計(jì),假如當(dāng)它小于一個(gè)特定的門限值得時(shí)候,對(duì)它實(shí)施開(kāi)運(yùn)算,大于門限值得時(shí)候進(jìn)行閉運(yùn)算。(c)為(a)圖進(jìn)行膨脹后的結(jié)果,(d)為(b)細(xì)化后的結(jié)果.對(duì)于所提取的特征值我們通過(guò)正規(guī)化相交的公式求得最后的分類器。
其中 為由字體算得特征相量, 是待識(shí)別字體算得相量。然后根據(jù)這三個(gè)分類器通過(guò)簡(jiǎn)單投票法形成多分類器進(jìn)行判別,即有兩個(gè)或兩個(gè)以上形成決策A,認(rèn)為A是合法的。若每個(gè)分類器形成的決策是不多的,我們就選定公式3中算的最大值作為分類器決策。假設(shè)三種特征的識(shí)別正確率分別為p1,p2,p3.那么我們的方法在理論上能達(dá)到的正確識(shí)別率為:
P = p1*p2(1-p3)+p2*p3(1-p1)+p1*p3(1-p2)+p1*p2*p3
三 實(shí)驗(yàn)結(jié)果
運(yùn)用我們上訴的方法,對(duì)圖象進(jìn)行識(shí)別,我們的算法能夠給出正確的結(jié)果。
四結(jié)論
對(duì)我們的算法進(jìn)行了一系列的測(cè)試和統(tǒng)計(jì)發(fā)現(xiàn)正確的識(shí)別率一般在99.9%以上,但是現(xiàn)在最大的問(wèn)題是由于噴碼文字邊緣的不規(guī)則性,這就造成了Q,0,O,D之間有著極大的相似性。對(duì)于這類相似文字,我們對(duì)識(shí)別結(jié)果又加了一些局部特征量的判斷比如說(shuō)內(nèi)沿特征,來(lái)進(jìn)一步提高識(shí)別率。