摘要:文章以條碼技術、圖象處理技術以及計算機軟件技術為基礎,設計出比較完善可靠的條形碼識別算法。文中著重介紹了條形碼識別的算法,并且對三種情況下即:理想的、小于五度傾斜的、稍微模糊的條形碼進行了識別測試并給出改進思路。
關鍵詞:圖像;條形碼;算法
0 引言
本設計的目的是在AOI(Automatic Optical Inspection,自動光學檢測)設備提供的PCB板圖片中對PCB板的條形碼信息進行識別,應用于電子通訊產品的生產線上,進行PCB板的錯誤檢測。AOI通過攝像頭自動掃描PCB、采集圖像、測試的焊點與數據庫中的合格參數進行比較,經過圖像處理,檢查出PCB上的缺陷,并通過顯示器把缺陷顯示、標識出來,供維修人員修正。PCB上所貼的條形碼記錄了該PCB的身份信息,通過識別該條形碼字符來認證PCB板。
本文主要解決的問題是條形碼的編碼規(guī)則如何轉換為實際獲得的像素點的參照標準,如何分割條形碼以及如何以后臺數據庫為基準識別條形碼。
1 條形碼識別的算法研究及其實現
1.1 條碼識別算法步驟
條形碼識別算法的過程主要分為以下這三個步驟:
(1) 對于一個條形碼圖像,要識別的是從靜區(qū)開始的有效區(qū)域,算法中考慮了判別是否到達靜區(qū),以此作為條碼識別工作的開始標志;
(2) 算法中總體上采用把整個條形碼按照39碼型的編碼規(guī)則進行分割,再依次找尋每個條形碼字符的邏輯值在數據庫中的匹配字符來輸出。
1.2 算法分析
在條形碼識別的算法分析過程中必須要解決三個比較關鍵的問題:1)條碼的長寬在圖像文件中用什么來衡量;2)條碼的碼字是不是要在識別之前分割出來,如果要分割出來,那么如何分割;3)分割后要怎么把對應的碼字進行處理。
在設計之前理解了這三個問題,整個設計就會獲得良好的解決。首先明確,所要處理的碼型是39碼。39碼的一個重要的特點就是,具有不可伸縮性,也就是說,一個條碼字符就是由占一定長度的,9個元素組成的,其中3個寬元素6個窄元素。39碼符號均以*號開始和結尾,即木號是39碼的起始,終止字符,并且39碼是離散碼,符號中兩個相鄰字符之間用一個位空分開。假設把條形碼抽取9個元素,然后跳過1個往下抽取9個,依次類推,把抽取獲得的每9個元素組成條形碼的每個字符,只要檢測到前9條元素(由條和空組成,為了更好說明,文中把條說成黑條,而把空說成白條)是*就開始進行條碼字符的識別,如果不是則放棄。
對于掃描得到的條碼BMP文件其白條和黑條的寬度及幾何長度已經失去意義,必須用另一種方法來表示。此時可以給出問題1)的答案:長寬用像素的個數來表示。對一個BMP文件,其像素的數據包含對應的RGB值,用以表征它的顏色。因此可以通過該像素的RGB值來辨認出是白色還是黑色。在理想的狀況下,白顏色的RGB值為(255,255,255)而黑顏色的RGB值為(0,0,0),但是實際條件下,一個條碼圖像不會達到那樣標準的RGB值,也就是有模糊的狀況,規(guī)定這樣一個判決準則:把RGB值大于(125,125,125)的像素認為是白色像素,而把RGB值小于(12 5,125,125)的像素認為是黑色的像素。在程序中采用列表PixelList=[]來存儲這些像素。然后基于以上的判決原則,程序實現“掃描”X軸,獲得每個像素,如果該當前的像素值符合是黑色的條件,就記錄到BlackCount,這時如果下一個的像素值還是黑色的就累加,如果下一個像素值符合是白色的條件,則把存儲黑色像素個數的變量BlackCount清空,以方便來記錄下一個黑條的像素個數。同樣地,對于白色像素也有類似的操作。至此得到了一個列表GeneralList=[],里面存放著掃描X軸每個被認為是黑條或是白條其對應的像素個數。
通過上面一步,把實際的條形碼轉換為用計算機所能運算和操作的方式,這里必須解決第(2)個問題,即在開始條碼識別的時候,要不要進行碼字分割。顯然,這一點對簡化整個識別工作是個很大的幫助,如果能夠正確地把條碼的各個碼字分離出來,那么剩下的工作就僅僅是把獨立的碼字的邏輯值和數據庫相匹配,找尋到數據庫中匹配的字符,再把它輸出來,實現這一點是容易的。因此,條碼分割是整個識別工作的難點和核心,整個算法重心也在此。
首先定義一個大列表CharList=[],由于列表中的元素可以為小列表,所以創(chuàng)建這個列表來放碼字,每個碼字為每個小列表,小列表里的元素是對應的黑條和白條的像素個數。如何實現碼字分割,首先考慮到39碼的特點:一個碼字為9個元素,每個碼字中間用一個白條隔開。所以只要在GeneralList=[]進行操作,把需要的那個元素抽取存放到新的列表中即可。
其次是判斷是寬條還是窄條。先計算出黑條的平均像素個數,之所以考慮采用計算平均像素個數的方法,是為了解決條形碼出現小角度傾斜依然能夠成功識別這樣的況。寬條或窄條的判斷原則是:對黑條而言,如果其像素個數大于這個平均值就是寬條,如果小于這個平均值就是窄條。如果是寬條就賦邏輯值1,如果是窄條就賦邏輯值0。把這些邏輯值都放到列表中,這個時候的列表,也是列表的列表,大列表的元素是單個條碼字符的黑條的邏輯值列表,小列表里的元素是01010這樣的邏輯值,用來表示寬窄。同樣地,對于白條而言,也有類似操作。至此,獲得了兩個大列表。一個是放黑條邏輯值的列表:BLogicList;一個是放白條邏輯值的列表WLogicList。大列表中的元素是每個碼字的邏輯值列表,這樣實現了碼字的分割工作。
對于第3)個問題:分割之后要對碼字如何處理。首先,可以建立一個數據庫,將條碼規(guī)則的信息放入數據庫中。然后,只要在條形碼識別軟件中把數據庫和相應的程序相連接,查找匹配值即可。在Access 2000數據庫中,黑條邏輯值和白條邏輯值都是以文本的數據類型來存放,但是在列表中各個0101都是整型。因此把列表里面元素進行數據類型轉換,列表里的數字轉換為字符,成為一個字符串作為列表的元素存儲。
1.3 軟件調試及其分析
根據算法的實現功能,選擇理想的和非理想的(小角度傾斜和輕微模糊的情況)三張條形碼進行識別測試。
采用這三張條形碼進行測試,步驟如下:
(1) 啟動調試軟件,出現一個用戶界面菜單,供用戶載入條碼圖片。
(2)選擇一個條碼的BMP文件后將其載入,可以獲得:
(3) 開始條碼的識別程序,此時可以獲得條碼識別成功的信息框,理想的條碼圖片的識別結果為:
傾斜角度小于5°情況下的條形碼圖片和表面輕微模糊的條形碼圖片的識別結果如圖8所示:
從以上三種情況的條碼圖片測試可以看出所設計的條形碼識別算法達到了預期的功能,實現了設計的目標。
2 結論
本文主要解決的問題是條形碼的編碼規(guī)則如何轉換為實際獲得的像素點的參照標準,如何分割條形碼以及如何以后臺數據庫為基準識別條形碼,這些都已經獲得了良好的解決。
條形碼的字符分割部分是本設計的難點所在。根據39碼的編碼規(guī)則進行算法設計,突破了該難點。設計對于一定程度的不理想條形碼也做了處理。