摘??要: 針對(duì)監(jiān)控畫面采樣圖像中數(shù)字的自動(dòng)識(shí)別問題,提出一種新的粘連字符圖像分割方法。該方法以預(yù)處理后二值圖像的連通狀況來判定字符粘連的存在,并對(duì)粘連字符圖像采用上下輪廓極值法確定候選粘連分割點(diǎn),以雙向最短路徑確定合適的圖像分割線路。仿真實(shí)驗(yàn)表明,該方法能有效解決粘連字符圖像的分割問題。
關(guān)鍵詞: 字符分割; 連通狀況; 粘連字符; 輪廓; 最短路徑
?
隨著監(jiān)視器等設(shè)備的廣泛使用,自動(dòng)采集、記錄和分析監(jiān)控畫面信息在實(shí)際應(yīng)用中變得越來越重要。而使用CCD攝像頭采集畫面字符時(shí),由于字符本身的大小、字體、字符間距以及攝像頭自身分辨率不高等原因,有可能造成圖像中字符的粘連。所以,在識(shí)別、分析、記錄前必須對(duì)粘連字符進(jìn)行分割。
參考文獻(xiàn)[1]中提出了基于字符投影的粘連分割方法,主要包括字符垂直投影、字符波形投影處理,但該方法分割準(zhǔn)確率不高,且分割路徑只能垂直進(jìn)行,會(huì)造成字符損傷,影響后期識(shí)別。參考文獻(xiàn)[2]采用了輪廓分裂與區(qū)域合并相結(jié)合的算法,能夠分割粘連字符,但過程復(fù)雜且準(zhǔn)確率不高,抗干擾性一般。參考文獻(xiàn)[3]提出了一種基于骨架形態(tài)分析的粘連分割算法,但該方法利用閾值判定分割點(diǎn)位置和路徑,降低了準(zhǔn)確率。參考文獻(xiàn)[4]采用滴水算法,模仿水滴從高處向低處滴落的過程實(shí)行對(duì)粘連字符的分割,即水滴從字符串頂部在重力的作用下沿字符輪廓向下滴落或水平滾動(dòng),最終水滴所經(jīng)過的軌跡就構(gòu)成了字符的分割路徑。但當(dāng)水滴陷在輪廓的凹處時(shí),將滲漏到字符筆劃中,會(huì)穿透筆劃后繼續(xù)滴落,易導(dǎo)致字符筆劃斷裂,因此也不能從根本上解決粘連字符的分割問題。參考文獻(xiàn)[5]采用了最短路徑算法,但其實(shí)行單向搜索路徑,且分割點(diǎn)的確定不準(zhǔn)確,因此分割準(zhǔn)確率不高。本文在參考文獻(xiàn)[5]的基礎(chǔ)上,設(shè)計(jì)了一種基于雙向最短路徑的粘連字符圖像分割方法,以期解決上述分割方法造成的字符損傷問題,并提高分割正確率和抗干擾能力。
1 粘連字符圖像分割算法
攝像頭采集到的圖像為彩色圖像,直接處理復(fù)雜且效果不好,因此需要對(duì)圖像進(jìn)行濾波、直方圖均衡化、顏色聚類得到二值圖像。經(jīng)過預(yù)處理后的圖像,由于字符本身的因素以及攝像頭自身分辨率不高等原因,會(huì)造成圖像中字符的粘連,因此通過提取連通分量,再采用二維檢測(cè)器[6]方法將連通分量分類。下面簡(jiǎn)要介紹二維檢測(cè)器的基本思想。
通過連通分量的寬高比和標(biāo)準(zhǔn)筆劃數(shù)[6]2個(gè)特征來確定單字符在二維空間的分布,從而得到1條直線用以正確判別單字符和粘連字符。如果這2個(gè)特征構(gòu)成的點(diǎn)落在直線的下方,則認(rèn)為連通域包含1個(gè)字符;如果由這2個(gè)特征構(gòu)成的點(diǎn)落在直線的上方,則認(rèn)為連通域包含多個(gè)字符。
經(jīng)過上述方法處理后,字符被分為兩類:一類為單字符,另一類為粘連字符。前者直接送入分類識(shí)別器,后者需進(jìn)行再分割。在對(duì)粘連字符圖像進(jìn)行分割后續(xù)處理時(shí),為避免出現(xiàn)參考文獻(xiàn)[1]~[4]的情況,以雙向最短路徑為基本思路,設(shè)計(jì)了一種新的粘連字符圖像分割方法。首先分析粘連字符圖像的上下輪廓,確定候選分割點(diǎn),再以分割點(diǎn)開始,遵循最小代價(jià)原則搜索分割路徑。該方法的具體流程如圖1所示。
預(yù)處理后的粘連字符圖像總是在其上下輪廓間的最短距離處發(fā)生粘連[7],如圖2(a)所示,通過確定粘連字符的上下輪廓,并求得上下輪廓的極值點(diǎn),可以確定候選分割點(diǎn)。參考文獻(xiàn)[8]在解決圖書索引書號(hào)粘連字符的分割問題時(shí),為確定字符的寬度,給出了字符串上、下輪廓的定義。
設(shè)待處理的二值圖像為b(i,j)∈[0,1],其中,0為背景,1為前景,i=1,2,…,m,j=1,2,…,n,則字符串上輪廓可由b(i,j)中自上而下掃描到每列的第1個(gè)黑色像素點(diǎn);相反可以給出字符串下輪廓的定義。這樣它們可以用一維向量top(j)和bottom(j)表達(dá),其生成方法可形式化描述如下:
For j=1:n
? For i=1:m
??? if b(i,j)=1,top(j)=i;
??? if b(m-i+1,j)=1,bottom(j)=m-i+1;
此處注意,當(dāng)某列無字符時(shí),表明無黑色像素點(diǎn),則令top(j)=1,而令bottom(j)=m。據(jù)此,可檢測(cè)到粘連字符圖2(a)的上、下輪廓如圖2(b)所示。
接下來,分別求取top(j)=1和bottom( j )=m的局部極大、極小值點(diǎn),從而求出上、下輪廓的極大、極小點(diǎn),即可視為字符粘連位置。以上面確定的極值點(diǎn)作為起始分割位置,分別以向上或向下雙向最小代價(jià)分析的策略來尋求最短分割路徑。定義分割移動(dòng)方向的代價(jià)函數(shù)是很關(guān)鍵的。
從(x,y)點(diǎn)出發(fā),以向下遍歷為例,按照滴水算法[4]和最短路徑[5]的思想,給出規(guī)定的3種可分割方向:垂直方向和左、右對(duì)角線方向。參考文獻(xiàn)[9]定義代價(jià)函數(shù)fee(i,j)如下:
向上遍歷代價(jià)函數(shù)與此類似。搜索1條完整路徑的處理流程如圖3所示。
2 實(shí)驗(yàn)結(jié)果和分析
選擇預(yù)處理后的二值字符圖像200幅進(jìn)行了仿真實(shí)驗(yàn),共包含字符串525個(gè),粘連字符125個(gè)。分割實(shí)驗(yàn)的部分效果如圖4所示。
?
對(duì)參考文獻(xiàn)[3]提出的骨架形態(tài)分析算法、參考文獻(xiàn)[4]提出的滴水算法的分割正確率進(jìn)行了比較,實(shí)驗(yàn)數(shù)據(jù)如表1所示。可以看出,骨架形態(tài)分析算法和滴水算法在分割粘連字符圖像時(shí),正確分割率要低于本文提出的方法。
?
在數(shù)字識(shí)別系統(tǒng)中,正確分割出單個(gè)字符是字符識(shí)別的前提和基礎(chǔ),在同等條件下,分割精度越高識(shí)別率就越高。字符粘連、有部分字符干擾是字符分割最棘手的問題,本文以雙向最短路徑方法設(shè)計(jì)的粘連字符圖像分割策略成功地解決了此問題,與現(xiàn)有方法相比,提高了正確分割率,獲得了較好的字符分割效果。
參考文獻(xiàn)
[1] 鄒榮金, 蔡士杰. 字符粘連及字線相交的分割與識(shí)別方法[J].軟件學(xué)報(bào),1999,10(3):241-247.
[2] 曹迪銘,宣國(guó)榮.牌照字符分割中的區(qū)域分裂與合并[J].計(jì)算機(jī)工程,2000,26(10):18-24.
[3] 馬瑞. 一種用于手寫數(shù)字分割的滴水算法的改進(jìn)[J].小型微型計(jì)算機(jī)系統(tǒng),2007,11(11):2110-2112.
[4] 盧達(dá),謝銘培.一種基于骨架法形態(tài)分析的粘連字符圖像分切方法[J].中文信息學(xué)報(bào),1998,2(13): 40-43.
[5] WANG J, JEAN J. Segmentation of merged characters by?neural networks and shortest path[J]. Pattern Recognition,1994, 27(5): 649-658.
[6] 張闖,吳銘.非限制自由手寫粘連數(shù)字串?dāng)?shù)字個(gè)數(shù)的判斷[J].北京郵電大學(xué)學(xué)報(bào), 2004,6(27):63-64.
[7]?DIMAURO G,IMPEDOVO S, PIRLO A,et al.Automatic bank check processing: A new engineered system[J]. International Journal of Pattern Recognition and Artificial Intelligence,?1997,11(4):467-504.
[8] 胡小鋒,陳超,葉慶泰.圖書索書號(hào)粘連字符的切分[J].上海交通大學(xué)學(xué)報(bào),2005,38(4):553-556.
[9] 陳兵.用神經(jīng)網(wǎng)絡(luò)方法分割粘連字符的一種改進(jìn)方案[D] .大連理工大學(xué), 2006,6:21-22.