摘 要: 提出了一種對含字符的交通警告標(biāo)志進行檢測和識別的方法。根據(jù)交通標(biāo)志顏色的分布范圍,以顏色分量為基礎(chǔ)進行閾值分割,將圖像中大部分不滿足顏色要求的區(qū)域去掉,借助連通域標(biāo)記、形狀因子來進行交通標(biāo)志的定位。將定位后的交通標(biāo)志,通過預(yù)處理、字符的旋轉(zhuǎn)矯正和分割,得到人眼可以識別的字符。通過歐氏距離匹配法進行字符的計算機識別,最終可使計算機識別率達到75%左右。
關(guān)鍵詞: 歐氏距離;交通警告標(biāo)志;閾值分割;連通域標(biāo)記;形狀因子;匹配法;計算機識別
0 引言
交通標(biāo)志本身數(shù)量眾多,形態(tài)復(fù)雜,而自然場景下存在著光照變化、褪色污損、扭曲變形等情況對交通標(biāo)志表觀的影響,為自動識別帶來了很大的挑戰(zhàn)。何耀平等人在分析交通標(biāo)志特征的基礎(chǔ)上,將Adaboost算法與SVM算法融合用于自然場景下的交通標(biāo)志識別。該方法具有較高的識別率和較快的識別速度,在智能汽車系統(tǒng)中具有較高的應(yīng)用價值[1]。在實際采集中,圖像不免會發(fā)生幾何變化或目標(biāo)被部分遮擋,這會對識別帶來許多困難。史延彥等人研究了基于不變矩和角點特征的目標(biāo)識別算法,這兩種都具有平移、旋轉(zhuǎn)、尺度不變形的特征。經(jīng)過分析表明,在一般情況下不變矩可以獲得較高的識別率,而當(dāng)目標(biāo)被部分遮擋時,角點是一種有效的識別方法[2]。同樣,交通標(biāo)志會受自然環(huán)境和時間的影響,出現(xiàn)許多退化的現(xiàn)象,為解決這一問題,丁淑艷等人提出了采用模糊-仿射不變矩直接提取圖像的特征而不需要圖像的清晰化處理的一種新的分類算法,在利用模糊-仿射不變矩提取圖像特征的基礎(chǔ)上,采用遞歸正交最小二乘法設(shè)計了一種新的徑向基概率神經(jīng)網(wǎng)絡(luò)分類器,這種方法不僅具有精簡的結(jié)果,而且具有較好的分類和推廣性能[3]。在2014年,Andrzej、Ruta等人介紹了一種關(guān)于圖像表示和辨別局部特征選擇的新方法,給出了在一種離散顏色圖像表之上的基于CDT的距離度量,這是一種前向特征選擇技術(shù),高質(zhì)量的辨別標(biāo)志描述符,從基于一對多相異極大化原則的理想模板中建立。采用這些描述符,使傳統(tǒng)分類器可以與最先進的方法相競爭,處理輸入視頻序列接近于實時[4]。
盡管國內(nèi)外學(xué)者已取得了較多的成果,但是具體針對含有字符這種警告標(biāo)志進行檢測和計算機識別的研究較少,因而,研究適合此類交通標(biāo)志的識別算法是有價值的。
1 交通標(biāo)志的檢測
本文研究的是對含有字符這種警告標(biāo)志進行檢測和計算機識別,此類交通標(biāo)志的顏色有鮮明的特證:圓形紅色外框,內(nèi)為白色,中間是黑色字符。典型交通標(biāo)志如圖1所示,可以先根據(jù)顏色找到圖像中感興趣的區(qū)域。
不妨假設(shè)所提取的像素中紅綠藍的每個灰度值分別為Ur、Ug、Ub,再求出各個分量所占顏色的百分比Kr=Ur/(Ur+Ug+Ub),Kg=Ug/(Ur+Ug+Ub),Kb=Ub/(Ur+Ug+Ub)
例如判斷是否為紅色,再根據(jù)如下方法進行判斷:
(1)若Ur+Ug+Ub>T,則進入下一步,否則將像素點設(shè)為黑色。
?。?)若Kr<Tr,則進入下一步,否則將像素點設(shè)為白色。
?。?)求出紅色分量百分比到藍色分量百分比和綠色分量百分比的距離H1=|Kr-Kb|,H2=|Kr-Kg|,再根據(jù)H1與T1、H2與T2的關(guān)系來判定(也可以根據(jù)需要再對Kb和Kg設(shè)定閾值進行分析)。如滿足關(guān)系則將像素點設(shè)為白色,否則將像素點設(shè)為黑色[5]。
其中,T、Tr都是設(shè)置的閾值,選擇的方法可以根據(jù)不同需求和反復(fù)實驗的經(jīng)驗試定。
下面對圖1中的限速標(biāo)志按照上述的方法進行紅色分量的閾值劃分。(1)設(shè)置閾值T為75,保證像素的亮度達到一定的要求。(2)分別求出R、G、B三個分量的百分比Kr、Kb、Kg,不妨設(shè)閾值Tr為0.5,如果大于這個閾值,則表明像素滿足要求,設(shè)為白色,如果不滿足要求,即可能是紅色也可能不是,就需要進入步驟(3)進行討論。(3)首先要求R分量的百分比不能太小,這里設(shè)為0.4,其次G和B分量的比重差距也不能太大,否則顏色看上去會偏重于黃色或者紫色,所以通常會使用Kb<2×Kg,Kg<2×Kb;另外根據(jù)反復(fù)實驗又增加了一個附加條件Kr-Kg>0.1。綜上所述,步驟(3)的整體條件是Kr>0.4&&2×Kg>Kb&&2×Kb>Kg&&(Kr-Kg)>0.1若滿足,則符合要求置為白色,否則為黑色。
對圖1不同條件處理的效果如圖2所示。
通過圖2(a)可以看到,僅僅通過比較高的紅色分量判別會除去許多符合條件的紅色像素;圖2(b)可以達到較好的效果。
通過圖2(b)可以看到,圖像中存在很多噪聲點,通過圖像形態(tài)學(xué)腐蝕、膨脹處理,可以將噪聲點除掉,處理效果如圖3所示。
經(jīng)過上面幾步處理之后,可以得到交通標(biāo)志的區(qū)域,而將其余的部分除掉,實現(xiàn)了交通標(biāo)志的檢測。
2 交通標(biāo)志的定位
交通標(biāo)志的輪廓形狀是交通標(biāo)志的重要信息,對于交通標(biāo)志的識別起著決定性作用。交通標(biāo)志的定位過程即檢測圓形的過程,進一步尋找感興趣區(qū)域。在進行檢測之前需要先對圖3所得的二值圖像進行填充處理,以得到圓形區(qū)域[6]。
二值圖像的連通域標(biāo)記處理操作就是從白色像素和黑色像素組成的一幅點陣圖像中,將互相鄰接的具有像素值“1”或“0”的像素集合提取出來,并為圖像中不同的連通域填入不等的數(shù)字標(biāo)記,同時統(tǒng)計連通域的數(shù)目,每一個數(shù)字標(biāo)記都代表了一個區(qū)域[7]。有幾個連通域就有幾個白色部分,再通過形狀因子來判斷連通域的形狀,記錄圓形部分的標(biāo)記數(shù)就可以確定交通標(biāo)志所在的連通域,因而可以確定交通標(biāo)志所在的位置。
將形狀因子定義為:
C=P2/(4πA)
其中,P表示周長,A表示面積。
在相同面積的條件下,在各種形狀當(dāng)中具有光滑周界的圓形的周長最短,可稱為是最密集的形狀,圓形的密集度C=1。隨著周界凹凸變化程度的增加,周長P相應(yīng)增加,C隨之加大。
對于在幾何上相似的兩個形狀,雖然它們的大小不同、取向不同或位置不同,但它們有相同的C值。因此C是一個僅與形狀有關(guān)的特征,常被稱為形狀因子。
另定義:為與第i個連通域具有相同標(biāo)準(zhǔn)二階中心矩的橢圓的長軸長度(像素意義下);′S(i)MinorAxisLength′為與第i個連通域具有相同標(biāo)準(zhǔn)二階中心矩的橢圓的短軸長度(像素意義下);′S(i)Area′為圖像第i個連通域中像素總個數(shù)。
當(dāng)滿足條件:
K<1.5&&C>0.8&&C<1.2&&M>150時,可以得到滿足此條件的第i個連通域即為交通標(biāo)志所在的位置。根據(jù)上述方法可以將圖1中的交通標(biāo)志進行定位,如圖4所示。
3 交通標(biāo)志的字符分割
3.1 交通標(biāo)志的預(yù)處理
找到交通標(biāo)志的位置以及提取相應(yīng)位置后,需要對字符進行處理。主要目的是把圖像中紅色的外框和多余的噪聲去掉[8]。圖4中就有樹蔭的影響,處理后得到的二值圖像如圖5所示。
3.2 字符的矯正
由于拍攝角度或者一些其他原因,有可能導(dǎo)致所取得的圖像中的交通標(biāo)志傾斜[9],如圖6(a)傾斜較為嚴(yán)重,圖6(b)傾斜較為輕微,如果直接對字符進行分割會出現(xiàn)一些不愿發(fā)生的事情,比如圖像的字符是橫向的,或者帶有原圖一樣的傾斜,而且可能會包含一些其他字符的信息,這都會給處理帶來麻煩。
為避免這些情況的發(fā)生,需要進行校正處理,而現(xiàn)在其傾斜多少角度并不知道,需要借助一些方法來判斷其是否選擇到了合適的位置。在這里,提供一種垂直方向像素累加的直方圖映射的方法,圖7(a)、(b)分別是圖6(a)、(b)在垂直方向上的直方圖。
再對比一張本身不需要校正的交通標(biāo)志的直方圖如圖8所示。
從圖8可以發(fā)現(xiàn),在直方圖的中間有明顯的空隙,這是因為圖像已經(jīng)處理為二值圖像,只有在有字符的地方才為白色,而其余地方為黑色,像素在垂直方向的直方圖累加就是將垂直方向上的像素值進行累加,將和值表現(xiàn)出來的直方圖。
根據(jù)這個特點,每次將為滿足校正條件的圖片進行5°的旋轉(zhuǎn),直到其直方圖在中間位置滿足一定的閾值條件;如果旋轉(zhuǎn)一周后都沒有滿意的結(jié)果,這說明圖像不含有兩個字符的標(biāo)準(zhǔn),或者前面的預(yù)處理做得并不好,有太多的噪聲。由此可以得到圖6(a)、(b)校正后的圖像,如圖9所示。
3.3 字符的切割與歸一化
當(dāng)圖像經(jīng)過校正后就可以分割圖中的字符,以便進行字符的識別。具體的方法是:根據(jù)連通域的知識,先找到圖中較大的連通域并做好記錄,找到每個連通域的最左、最右、最上和最下的像素位置,再根據(jù)4個范圍值分別將標(biāo)記好的連通域按矩形分割下來就可以了,切割后的字符圖像如圖10所示。
為方便在字符識別階段的處理,需要將分割下來的字符圖像進行格式上的歸一化,這里將圖像縮小為10×15的像素格式,寬為10,高為15。
4 交通標(biāo)志字符的識別
各種模式在特征空間的分布狀態(tài)是模式識別成功與否的重要因素。只有對這一分布狀態(tài)進行分析,才能斷定模式的特征空間描述是否有利于分類,才能決定哪些特征起到主導(dǎo)作用,哪些特征可以忽略,從而進行特征的選取。本文采用歐氏距離描述模式在特征空間分布狀態(tài)的測度[10]。
在n維特征空間中,一個模式表征為一個點,點a=(a1,a2,…,an)T和點b=(b1,b2,…,bn)T之間的歐氏距離表示為:
統(tǒng)計歸一化格式后的字符在橫向和縱向共25個方向上所占像素的個數(shù),這樣求得4的特征值為[3 4 6 5 5 6 14 15 3 2 1 2 2 3 10 10 5 4 4 5 5 4 3 3 2],向量中共有25個數(shù)值,其中前10個為縱向的統(tǒng)計數(shù)值(從左向右,如3表示在第1列上有3個點像素值為255),后15個為橫向的統(tǒng)計數(shù)值(從下到上,如向量中的第11個值1表示最下列中有1個點像素的值為255)。如此,對于每一個要識別的字符都能得到一組特征向量。為了能夠識別字符是什么,選擇字體為交通標(biāo)志專用的一組數(shù)來作為標(biāo)準(zhǔn),如圖11所示。
分別求出他們的特征向量作為標(biāo)準(zhǔn),0~9特征向量為:
對于每個輸入的字符,分別求出其到0~9的歐氏距離,取距離最小的最為相匹配的字符。
5 算法的測試
上面介紹了具體的實施方法,現(xiàn)在對字符識別的算法做如下測試:收集實際生活中帶有限速標(biāo)志的圖像,然后提取交通標(biāo)志,再對其中的字符進行分割,最后對每一個字符進行識別,連續(xù)測試40幅圖片。圖12為40幅圖片中3幅的識別結(jié)果示例,識別情況如表1所示。
通過測試可以知道,有些字符的識別并不正確,分析有幾點原因:
(1)由于設(shè)定的標(biāo)準(zhǔn)字符與實際交通標(biāo)志上的字符有差異,因此所匹配的字符特征并不一定最準(zhǔn)確。
(2)在進行旋轉(zhuǎn)校正和字符大小歸一化時,圖像要使用插值算法,這樣會導(dǎo)致一些誤差,而影響到最后的特征提取。
?。?)圖片中交通標(biāo)志的位置不一定是正面取景,有可能圖像是偏斜的,這樣分割下來的字符也存在形變。
6 結(jié)論
對于交通標(biāo)志識別這個課題,本文借鑒了許多已有的技術(shù),主體步驟和大多數(shù)的研究相一致,主要是顏色預(yù)處理、形態(tài)學(xué)濾波、圖像分割、特征提取與識別。但這里也有一些經(jīng)過反復(fù)對比和改進而使用的方法。首先,顏色預(yù)處理上,閾值的尋找,由于交通標(biāo)志的顏色有限地分布在一定范圍內(nèi),這樣通過在模型上的劃分就可以找到。還有,在圓的檢測上沒有使用比較一般化的方法,而是受到一些邊界標(biāo)記的啟發(fā),進行了檢測。本文所研究的某一類特定的交通標(biāo)志,基本達到了要求。
參考文獻
[1] 何耀平,徐麗珍.自然場景下交通標(biāo)志的自動識別算法[J].微計算機信息,2010(4):161-163.
[2] 史廷彥,趙書斌.基于不變矩和角點特征的目標(biāo)識別[J].指揮控制與仿真,2008,30(2):32-34.
[3] 丁淑艷,宋婀娜,李倫波.退化交通標(biāo)志圖像的RBPNN分類算法研究[J].計算機仿真,2010,27(1):281-284.
[4] 羅冰潔.基于顏色與形狀特征的圓形交通標(biāo)志識別[D].西安:長安大學(xué),2013.
[5] 齊飛.交通標(biāo)志識別技術(shù)研究[D].北京:北京交通大學(xué),2013.
[6] 關(guān)學(xué)忠,劉勇智.基于數(shù)字圖像處理的車牌定位及字符分割方法[J].裝備制造,2010(1):143.
[7] 張恒,胡文龍,丁赤飆.基于快速連通域分析的目標(biāo)特征提取算法[J].計算機工程與應(yīng)用,2009(29):230-232.
[8] 嚴(yán)筱永,閻浩,沈維燕,等.基于改進的Hough變換的圓檢測[J].金陵科技學(xué)院學(xué)報,2009(1):1462-1465.
[9] 高俊釵,韓冰,王澤民,等.向量空間彩色圖像的Canny邊緣檢測[J].科學(xué)技術(shù)與工程,2008(3):686-689.
[10] 饒永全,周珩.基于標(biāo)記矯正的目標(biāo)特征提取算法[J].航空兵器,2006(6):37-40.