《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 一種基于SVM的數(shù)字儀表顯示值識別方法
一種基于SVM的數(shù)字儀表顯示值識別方法
現(xiàn)代電子技術(shù)
李文博
摘要: 數(shù)字儀表識別在工業(yè)中應(yīng)用廣泛,但各種儀表差別較大,方法也差別很多。在此提出了一種數(shù)字儀表顯示值的快速識別方法,該方法首先由計算機自動定位分割圖像中的數(shù)字區(qū)域,并實現(xiàn)了單個數(shù)字的切分,然后根據(jù)數(shù)字特點,創(chuàng)新性地改進了特征提取方法,對每個數(shù)字圖像提取了一組具有較高區(qū)分度,且計算簡單的典型特征。最后,基于SVM識別,構(gòu)造了一種數(shù)字識別器,實現(xiàn)了儀表顯示值的實時識別。
Abstract:
Key words :

數(shù)字儀表結(jié)構(gòu)簡單,使用方便,已廣泛應(yīng)用于科學(xué)實驗和生產(chǎn)中。為了提高檢定效率、檢定精度,實現(xiàn)自動化檢定是十分必要的。由于數(shù)字儀表的檢定是一項大批量、重復(fù)性的檢測過程,其操作過程簡單、規(guī)范,外界環(huán)境要求不高,這為其實現(xiàn)檢定自動化提供了有利條件。近年來計算機視覺技術(shù)和數(shù)字圖像處理技術(shù)的不斷發(fā)展,為滿足上述要求提供了可能。利用攝像機完成表盤及背景圖像的采集,并將其轉(zhuǎn)換成數(shù)字信號,然后利用數(shù)字圖像處理技術(shù)實現(xiàn)關(guān)鍵操作,實現(xiàn)數(shù)字儀表的自動檢定,提高了檢定精度、生產(chǎn)效率、降低了生產(chǎn)成本。本文開發(fā)的儀表顯示值自動實時識別系統(tǒng)主要包括:圖像預(yù)處理、特征提取和數(shù)字識別3部分。其中數(shù)字識別是關(guān)鍵一環(huán),主要采用了學(xué)習(xí)理論中的支持向量機方法。學(xué)習(xí)理論是一種研究有限樣本情況下機器學(xué)習(xí)性質(zhì)和規(guī)律的理論。在這一理論下發(fā)展出的一種通用的模式分類器——支持向量機,由于與傳統(tǒng)的模式識別方法相比,具有推廣能力強,能保證全局最優(yōu)等優(yōu)點,這使得支持向量機技術(shù)在數(shù)字識別系統(tǒng)中有很好的應(yīng)用前景,因而引起了國內(nèi)外學(xué)者的極大興趣。支持向量機通過結(jié)構(gòu)風(fēng)險最小化準則和核函數(shù)方法,較好地解決了模式分類器復(fù)雜性與推廣性之間的矛盾,因而也引起了模式識別領(lǐng)域?qū)W者的極大關(guān)注。

1 儀表示值自動識別原理
   
儀表顯示值自動實時識別系統(tǒng)的流程:首先,由攝像頭獲取儀表顯示的視頻幀;然后,將視頻幀進行灰度變換,二值化得到二值圖像;再通過邊緣檢測,操作微分直方圖,計算表盤水平和垂直投影,進行峰谷分析定位出數(shù)字區(qū)域,并切分出單個數(shù)字的二值圖像;對單個數(shù)字的圖像進行特征提取,得到一組特征;最后,將特征送入識別器進行識別。
1.1 預(yù)處理
   
數(shù)字儀表在檢定過程中,首先要定位表盤區(qū)域,然后確定數(shù)字位置。攝像頭提取圖像后,經(jīng)過灰度變換(見圖1)和二值化(見圖2),其效果將對后續(xù)的數(shù)字切分和特征提取產(chǎn)生直接的影響,其中二值化是圖像預(yù)處理的關(guān)鍵環(huán)節(jié),在實際應(yīng)用中受室內(nèi)燈光及儀表屏幕自身亮度等因素影響,圖像中往往存在灰度分布不均和灰度突變的情況。本文采用了OTSU算法,根據(jù)最大方差二值化獲得良好的二值圖像,這里主要為了提取表盤區(qū)域。通過標識連通區(qū)域,連通區(qū)域的外接矩形,然后根據(jù)外接矩形的長與寬定位數(shù)字儀表的顯示區(qū)域。本文采用了一個8連通區(qū)域提取算法。首先按照一定的標號規(guī)則掃描圖像,得到一定數(shù)量的連通區(qū)域;然后針對同一區(qū)域內(nèi)標號不一致的情況進行處理,即得到最終處理結(jié)果。


1.2 數(shù)字分割
   
表盤區(qū)域分割之后,繼續(xù)分割數(shù)字區(qū)域。在實際應(yīng)用中,攝像頭是固定的,數(shù)字的顯示區(qū)域在圖像中的位置、大小等是基本相似的。本文根據(jù)數(shù)字儀表顯示屏幕的特點,采用投影法找到顯示屏的邊框。圖像中數(shù)字區(qū)域的準確定位分割是實現(xiàn)儀表顯示值識別的重要前提。在表盤的二值圖內(nèi),先通過邊緣檢測,利用微分直方圖進行數(shù)字分割,圖3為水平投影后的直方圖。


    經(jīng)過水平投影將圖像分割成上、中、下3部分。對中部數(shù)字區(qū)域的二值圖像從上到下逐行掃描;獲取到圖像的水平投影圖。利用行間間隔形成的水平投影間隙,即可將各數(shù)字行分割開來,如圖4所示,然后提取中部截圖,再對中部數(shù)字區(qū)域做垂直投影,如圖5所示,計算峰谷可以將單個數(shù)字分割出來。字切割是從行切分后,得到的圖像中將每一個數(shù)字分割出來,利用每行字符的垂直投影中字符之間的間隙即可將各個數(shù)字分割出來。


1.3 特征提取
   
由于數(shù)字具有明顯的局部結(jié)構(gòu)特征,因此本文采用一種非對稱分塊統(tǒng)計特征,作為表征數(shù)字的特征向量。方法如下:
    (1)應(yīng)用otsu方法將分割出的數(shù)字圖像二值化,然后將圖像歸一化為70×50大?。?br />     (2)將圖片等分為35塊,每塊子圖為10×10大小,按式(1)計算每一塊中背景點的分布特征;
   
    式中:p(m,n)為10×10子圖中m行n列像素灰度值,前景點為255,背景點為0。
    (3)將每一塊子圖的背景點統(tǒng)計特征作為一維特征向量,構(gòu)造35維向量[a1 a2 … a34 a35]作為支持向量機的輸入特征向量。
1.4 數(shù)字識別
   
基于支持向量機的數(shù)字識別支持向量機(Support Vector Machines,SVM)基于結(jié)構(gòu)風(fēng)險最小化準則工作,能在訓(xùn)練誤差和分類器容量間達到較好平衡,因而具有更好的性能,在模式識別領(lǐng)域有著廣泛的應(yīng)用。對于兩類模式識別問題,假設(shè)給定n個樣本作為訓(xùn)練集:
   
    這里yi=+1或-1,要找到一個最優(yōu)超平面,使訓(xùn)練集中的點距離分類面盡可能的遠,也就是使M=2/‖ω‖最大的分類面就是最優(yōu)分類面。對于線性可分的情況,要找到最優(yōu)超平面:
 
    即求解下面的二次規(guī)劃問題:
  
    此二次規(guī)劃問題,可用Lagrange乘子法把式(5)化成其對偶形式:
  
    設(shè)[a1 a2 … a3]為二次優(yōu)化問題的解,可以證明解中只有小部分ai不為0,稱對應(yīng)的xi為支持向量,ai是對應(yīng)的Lagrange系數(shù),b是常數(shù)(閾值)。于是最優(yōu)超平面方程為:
   
    最優(yōu)超平面的分類規(guī)則為:
   
    對于線性不可分情,在條件式(5)中引入非負松弛變量ξi,原約束條件改為:
   
    相應(yīng)的目標函數(shù)改為:
   
    最優(yōu)分類面的對偶問題改為:
   
    若ai>0,稱相應(yīng)的xi為支持向量(Support Vector)。更進一步,若O)計算內(nèi)積。在可分的情況下求解:
   
    找出的支持向量充分描述了整個訓(xùn)練數(shù)據(jù)集的特征,使得對SV集的線性分類等價于對整個數(shù)據(jù)集的分類,檢測流程圖如圖6。所示。


1.5 實驗結(jié)果與分析
   
實驗中選取了3組典型的樣本,每組樣本數(shù)200個,在PC機上進行了試驗,結(jié)果如表1所示。每個樣本有6或5個數(shù)字,其中3或4個是表示小時和分鐘,2個表示秒鐘。


    從表1可以看出,在二值化較好,數(shù)字清晰的情況下,識別率達到了100%,對有輕微點狀噪聲和輕微斷痕的樣本,識別率也很高,但對存在數(shù)字殘缺的樣本,識別率有所下降。就識別時間而言,整屏數(shù)字(6或5個數(shù)字)的識跗時間小于200 ms,明顯低于儀表數(shù)字的最快變化時間1 000 ms。

2 結(jié)語
   
主要研究了數(shù)字式儀表的自動判讀方法,為儀表盤上的儀表實現(xiàn)自動識別打下基礎(chǔ)。首先對采集到的數(shù)字式儀表進行預(yù)處理,主要包括圖像灰度化、二值化、噪聲消除等。參考現(xiàn)有的數(shù)字識別算法,本文主要采用垂直投影法來分割各個字符,然后對分割后的每個字符提取分塊統(tǒng)計特征。最后用SVM訓(xùn)練樣本實現(xiàn)相應(yīng)數(shù)字字符識別,最終判讀出數(shù)字儀表的讀數(shù)。該方法算法簡單,實時性高,可靠性好,是一種比較理想且具有一定應(yīng)用價值的識別算法。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。