張 庚,李 丹,周 亮,常 亮
(中國電力科學(xué)研究院信息通信研究所,北京 100192)
摘 要: 為了對(duì)數(shù)碼管儀表的數(shù)字識(shí)別系統(tǒng)進(jìn)行改進(jìn)和優(yōu)化,提出了一種新的數(shù)字識(shí)別方法。對(duì)于攝像機(jī)采集到的圖像,首先進(jìn)行圖像預(yù)處理,包括灰度轉(zhuǎn)換、中值濾波和二值化等。簡單介紹了字符區(qū)域定位和字符分割的算法,在字符識(shí)別之前對(duì)分割得到的區(qū)域設(shè)置了一些限制條件,防止將噪聲區(qū)域誤判為數(shù)字。從穿線法得到啟示,采用直線和字符的交點(diǎn)和標(biāo)識(shí)矩陣元素的分布來構(gòu)造識(shí)別特征對(duì)數(shù)字0-9進(jìn)行分類識(shí)別。該算法在保證識(shí)別精度和抗干擾性的條件下,大大降低了運(yùn)算量,具有較高的應(yīng)用價(jià)值。
關(guān)鍵詞: 數(shù)字識(shí)別;數(shù)碼管;外接矩形;交點(diǎn);標(biāo)識(shí)矩陣
0 引言
七段式數(shù)顯儀表有著諸如易讀數(shù)、無需估讀、準(zhǔn)確度高、可調(diào)整模式和參數(shù)等很多優(yōu)點(diǎn),被人們廣泛應(yīng)用于機(jī)械、化工、醫(yī)藥、電子、金融等各行各業(yè)中。由于電力行業(yè)惡劣環(huán)境的影響,人工操作危險(xiǎn)性極高,不利于人為去記錄儀表的數(shù)據(jù)。利用數(shù)字圖像處理技術(shù)和識(shí)別技術(shù)可以實(shí)現(xiàn)數(shù)顯儀表的自動(dòng)識(shí)別,不僅可以提高工作效率,保證提高準(zhǔn)確率,而且可以消除人工現(xiàn)場操作的危險(xiǎn)性,這些都表明數(shù)顯儀表的數(shù)字識(shí)別技術(shù)研究具有非常重要的實(shí)用價(jià)值[1,2]。對(duì)于數(shù)字字符識(shí)別,人們提出了很多方法, 包括模板匹配法、統(tǒng)計(jì)決策法、句法結(jié)構(gòu)法、模糊判別法、邏輯推理法、神經(jīng)網(wǎng)絡(luò)法等[3]。模版匹配法對(duì)每個(gè)模式類都定義一個(gè)標(biāo)準(zhǔn)的模式,這種方法適用于印刷體數(shù)字的識(shí)別;統(tǒng)計(jì)決策法是在概率論和數(shù)理統(tǒng)計(jì)的基礎(chǔ)上形成的,抗干擾能力強(qiáng),但是難以反映模式的精細(xì)結(jié)構(gòu)特征;神經(jīng)網(wǎng)絡(luò)法需要通過自身的學(xué)習(xí)機(jī)制形成決策區(qū)域,網(wǎng)絡(luò)的特性由拓?fù)浣Y(jié)構(gòu)神經(jīng)元特性決定,利用狀態(tài)信息對(duì)不同狀態(tài)的信息逐一訓(xùn)練獲得某種映射,但該方法過分依賴特征向量的選取[4]。申小陽[5]提出的交線特征提取的分類識(shí)別法,過程比較繁瑣,選取的掃描位置不具有代表性。本文提出了改進(jìn)的交線特征和標(biāo)識(shí)矩陣元素的分布特征法,并且提出對(duì)于分割得到的可能的數(shù)字區(qū)域設(shè)定限制條件,提高了數(shù)字識(shí)別的準(zhǔn)確率。
1 數(shù)字儀表的字符識(shí)別流程
七段式數(shù)顯儀表中數(shù)字字符識(shí)別是通過使用數(shù)字圖像處理、模式識(shí)別等方法,對(duì)圖片中的數(shù)字內(nèi)容進(jìn)行自動(dòng)識(shí)別。七段式數(shù)顯儀表的識(shí)別流程主要包括5部分,如圖1所示。
2 圖像預(yù)處理
攝像機(jī)在采集圖像的過程中,可能會(huì)受到實(shí)際采集環(huán)境以及攝像頭與目標(biāo)圖像的距離和角度等因素的影響,最終傳輸?shù)接?jì)算機(jī)的圖像可能存在模糊和噪聲缺陷[6,7],這些缺陷會(huì)影響到字符的正確分割和識(shí)別,所以在對(duì)圖像進(jìn)行字符分割和識(shí)別之前,需要對(duì)圖像進(jìn)行預(yù)處理操作。
2.1 灰度化
攝像頭采集到的圖像是含有大量顏色信息的彩色圖像,使用彩色圖像,增大了數(shù)據(jù)的處理量,嚴(yán)重影響圖像識(shí)別的速度和效率,而且降低了圖像識(shí)別的正確率[8]?;叶葓D像是指只含亮度信息、不含色彩信息的圖像,在RGB模型中,如果R=G=B時(shí),則彩色表示一種灰度顏色,其中R=G=B的值叫灰度值,因此,灰度圖像每個(gè)像素只需一個(gè)字節(jié)存放灰度值,灰度范圍為0-255,共256個(gè)值。本文采用的加權(quán)法來灰度化,根據(jù)重要性及其他指標(biāo),將三個(gè)分量以不同的權(quán)值進(jìn)行加權(quán)平均。由于人眼對(duì)綠色的敏感最高,對(duì)藍(lán)色敏感最低,因此,按下式對(duì)RGB三分量進(jìn)行加權(quán)平均能得到較合理的灰度圖像。轉(zhuǎn)換關(guān)系為:
f(i,j)=0.3R(i,j)+0.59G(i,j)+0.11B(i,j)(1)
2.2 中值濾波
中值濾波法是一種非線性平滑技術(shù),它將每一像素點(diǎn)的灰度值設(shè)置為該點(diǎn)某鄰域窗口內(nèi)的所有像素點(diǎn)灰度值的中值。中值濾波的基本原理是把數(shù)字圖像或數(shù)字序列中一點(diǎn)的值用該點(diǎn)的一個(gè)鄰域中各點(diǎn)值的中值代替,讓周圍的像素值接近真實(shí)值,從而消除孤立的噪聲點(diǎn)。
2.3 二值化
圖像二值化的關(guān)鍵在于通過尋找合適的閾值將要識(shí)別的目標(biāo)和圖像的背景區(qū)分開來[9]。采用最大類間方差法Otsu來實(shí)現(xiàn)二值化,假設(shè)分割閾值是T,屬于前景的像素點(diǎn)數(shù)占整幅圖像的比例記為w0,其平均灰度u0;背景像素點(diǎn)數(shù)占整幅圖像的比例為w1,其平均灰度為u1。另g為類間方差,則g表示為:
g=w1w0(u0-u1)2 (2)
采用遍歷的的方式,當(dāng)g取最大值時(shí),T值即為分割閾值。
3 數(shù)字區(qū)域定位和分割
字符區(qū)域定位的主要目的是從預(yù)處理后的二值圖像中確定儀表顯示區(qū)域的具體位置,并將包含字符的子圖像從整個(gè)圖像中劃分出來[10]。儀表顯示區(qū)域字符串的定位方法主要有雙向投影法、區(qū)域生長法、邊緣檢測法。
字符分割是指將用戶所選取的數(shù)字區(qū)域分割成單個(gè)的數(shù)字區(qū)域。本文中字符分割采用的是雙向投影法,這一環(huán)節(jié)效果的好壞將會(huì)直接關(guān)系到下一個(gè)環(huán)節(jié),會(huì)影響到數(shù)字字符特征提取和識(shí)別的正確與否。因此本文對(duì)于字符分割得到的區(qū)域設(shè)置了一些限制條件,以解決遇到混入噪聲的區(qū)域被判斷成其他數(shù)字的問題[11,12]。設(shè)第k個(gè)被識(shí)別為數(shù)字區(qū)域的外接矩形為Rk,這個(gè)可能區(qū)域的橫坐標(biāo)、縱坐標(biāo)、寬度和高度分別為xk,yk,wk,hk,設(shè)定以下限制條件:
s0<wk,hk<s1 (3)
|yk-yi|<<a0(k≠i) (4)
|hk-hi|<<a1(k≠i)(5)
以上三個(gè)式子分別從區(qū)域外接矩形的面積、高度差、縱坐標(biāo)三個(gè)方面進(jìn)行了限制。式(3)限制區(qū)域的大小,七段數(shù)碼管的每個(gè)數(shù)字顯示區(qū)域的大小除了1外,其余大都相同。s0值應(yīng)該取1的外接矩形的最小值,s1應(yīng)該比實(shí)際值略大一點(diǎn)。式(4)和式(5)表示外接矩形的高度和縱坐標(biāo)應(yīng)該基本相同,但是考慮到拍攝的圖像中可能存在傾斜,因此a1的值略大于a0,但兩者的值都很小。下面對(duì)區(qū)域內(nèi)部的像素設(shè)置一些限制條件,設(shè)圖像第m行第n列的像素為p(m,n),值為0表示黑,值為1表示白。
在經(jīng)過上述限制條件后,得到的數(shù)字區(qū)域在外形上是可信的,式(6)表示該區(qū)域的像素不能是全白或者全黑,b0的值接近于0,b1的值接近于1。
4 交點(diǎn)特征提取的數(shù)字識(shí)別
4.1 數(shù)字識(shí)別
字符識(shí)別屬于模式識(shí)別的范疇,模式識(shí)別的方法主要有統(tǒng)計(jì)方法和結(jié)構(gòu)方法[13]。本文提出的方法結(jié)合了統(tǒng)計(jì)和結(jié)構(gòu),從穿線法得到啟示,采用直線和字符的交點(diǎn)作為提取字符特征和識(shí)別的手段。例如選取0和2,在中垂線處掃描,0的交點(diǎn)數(shù)為2,2的交點(diǎn)數(shù)為3,這樣就把2和3區(qū)分開了。在實(shí)際提取特征時(shí)還需考慮到字符和直線的交點(diǎn)是假想的,當(dāng)字符在直線的方向像素由白變黑就認(rèn)為字符和這條直線有一個(gè)交點(diǎn)[5]。從理論上來講,掃描線的數(shù)量越多,提取的特征越準(zhǔn)確,但是會(huì)增大運(yùn)算量,因此選取的直線數(shù)和位置很關(guān)鍵。選取的直線數(shù)和位置如圖2所示。
由圖2可知,選取了3個(gè)位置進(jìn)行掃描,分別標(biāo)記為A、B、C。對(duì)于字符先進(jìn)行水平掃描,直線A、B在數(shù)碼管的3/4和1/4處,從左到右掃描,如果出現(xiàn)像素由白變黑就加1,直到掃描結(jié)束。然后進(jìn)行垂直掃描,選取直線C為1/2處,將字符垂直平均分割成兩部分,從上到下掃描,同樣每次出現(xiàn)像素由白變黑就加1,直到掃描結(jié)束,得到的0-9的交點(diǎn)數(shù)如表1所示。
對(duì)于字符1的識(shí)別可以提取字符寬度特征,寬度特征是一個(gè)相對(duì)值,它表示的是字符最大寬度與最小寬度的比值[8],該特征對(duì)于將 1 與其他數(shù)字分開是很有效的。由表1可知2、3、5的交點(diǎn)數(shù)完全一樣,根據(jù)交線特征無法識(shí)別出來,可以根據(jù)標(biāo)識(shí)矩陣[13]中數(shù)字豎直中線左側(cè)一列非0 和非 1 元素的重心分布來分類。對(duì)于數(shù)字“3”,豎直中線左側(cè)幾乎沒有目標(biāo)元素,像素重心位于水平中線下側(cè)的則為“2”,重心位于上側(cè)的則為“5”。
4.2 小數(shù)點(diǎn)識(shí)別
一般儀器顯示的數(shù)據(jù)都存在小數(shù)點(diǎn),所以確定小數(shù)點(diǎn)的位置極其重要。本文提出的方法對(duì)于小數(shù)點(diǎn)的識(shí)別不是很理想,因此根據(jù)小數(shù)點(diǎn)的幾何特征以及位置特征對(duì)其進(jìn)行識(shí)別,最后加入到數(shù)字識(shí)別結(jié)果中。首先考慮到小數(shù)點(diǎn)的外形類似圓,因此它的外接矩形應(yīng)該類似于正方形,它的坐標(biāo)雖然寬度與1相近,但高度上與1有著很大的區(qū)別[14],它的外接矩形長寬比接近 1 ,并結(jié)合位置信息,小數(shù)點(diǎn)通常處于數(shù)字的右下角,這樣就可以準(zhǔn)確地識(shí)別出來了。
5 結(jié)束語
本文從七段式數(shù)顯儀表中的數(shù)字字符識(shí)別入手,提出了一種新的數(shù)字識(shí)別方法,結(jié)合了字符寬度、直線和字符的交點(diǎn)、標(biāo)識(shí)矩陣元素分布和重心等多個(gè)特征來提取字符特征,并提出數(shù)字分割后得到的區(qū)域進(jìn)行篩選后再識(shí)別,實(shí)現(xiàn)了效果比較好的儀表數(shù)字實(shí)時(shí)識(shí)別系統(tǒng)。采用這種方法的優(yōu)點(diǎn)還在于這種處理方法不需要進(jìn)行歸一化與細(xì)化處理。在具體的實(shí)施中,利用C++編程實(shí)現(xiàn)該系統(tǒng),實(shí)驗(yàn)表明該方法正確識(shí)別率達(dá)到96%以上,但是對(duì)于實(shí)時(shí)系統(tǒng)來說,字符區(qū)域的定位速度和識(shí)別時(shí)間還不是很理想,因此在后續(xù)的工作中,要進(jìn)一步優(yōu)化和完善字符分割和識(shí)別算法,以達(dá)到識(shí)別率更高和實(shí)時(shí)性更好的目的。
參考文獻(xiàn)
[1]鄭小清.數(shù)顯儀表的自動(dòng)識(shí)別檢測技術(shù)應(yīng)用實(shí)例[J].科技世界,2013(21):49-50.
[2]穆克,韓志剛.有毒有害氣體報(bào)警器數(shù)字檢測系統(tǒng)的設(shè)計(jì)[J].遼寧石油化工大學(xué)學(xué)報(bào),2012,32(1):75-83.
[3]劉丹,穆林麗,余曉鍔,等.一種七段數(shù)碼管式醫(yī)用儀表的自動(dòng)識(shí)別方法[J].科學(xué)技術(shù)與工程,2010,10(16).
[4]張彤,肖南峰.基于BP網(wǎng)絡(luò)的數(shù)字識(shí)別方法[J]. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2010,3(24):43-47.
[5]申小陽,唐軼峻,姜柏軍,等.儀表的數(shù)字字符識(shí)別系統(tǒng)[J]. 儀表技術(shù)與傳感器,2005(6).
[6]田自君.數(shù)顯儀表數(shù)字字符快速識(shí)別系統(tǒng)的研究[D].成都:電子科技大學(xué),2007.
[7]郭爽. 數(shù)碼管數(shù)字儀表自動(dòng)識(shí)別方法的研究[J]. 通信技術(shù),2012,8(45):91-93.
[8]郝巧紅. 高壓變電站數(shù)顯儀表的識(shí)別[D].天津:天津大學(xué),2007.
[9]尤曉俊.基于圖像識(shí)別的數(shù)字儀表自動(dòng)校驗(yàn)系統(tǒng)研究[D].安徽:安徽理工大學(xué),2013.
[10]崔行臣 .數(shù)顯與指針儀表示值識(shí)別技術(shù)的研究與應(yīng)用[D].山東:山東師范大學(xué),2011.
[11]GONZALEZ R C,WOODS R E. Digital Image processing [M]. Beijing:Publishing House of Electronics Industry,2007.
[12]劉文亮.七段式數(shù)顯儀表中數(shù)字識(shí)別的研究與實(shí)現(xiàn)[D].大連:大連理工大學(xué),2013.
[13]崔行臣,段會(huì)川,王金玲,等.數(shù)顯儀表數(shù)字實(shí)時(shí)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2010,31(1):0214-0217.
[14]王蓉芳,汪仁煌,康亞芬.基于數(shù)碼管機(jī)器視覺的小數(shù)點(diǎn)識(shí)別[J].電子測試,2008(11):17-20.