摘 要: 針對(duì)復(fù)雜背景的視頻圖像車(chē)型識(shí)別,提出了一種利用尺度顯著性的車(chē)型識(shí)別方法。由于尺度顯著性對(duì)圖像均一亮度變化、縮放、旋轉(zhuǎn)以及噪聲都具有不變性,因此引入尺度顯著性算法提取車(chē)輛圖像的分類(lèi)特征。最后采用RBF網(wǎng)絡(luò)分類(lèi)驗(yàn)證該方法對(duì)多種車(chē)型的識(shí)別。實(shí)驗(yàn)結(jié)果表明,提取尺度顯著性特征能夠有效地識(shí)別汽車(chē)車(chē)型。
關(guān)鍵詞: 車(chē)型識(shí)別;尺度顯著性算法;特征提取;RBF神經(jīng)網(wǎng)絡(luò)
車(chē)輛自動(dòng)識(shí)別技術(shù)是智能交通系統(tǒng)ITS(Intelligent Transportation System)的重要組成部分,它對(duì)特定地點(diǎn)和時(shí)間的車(chē)輛進(jìn)行識(shí)別和分類(lèi),并以之作為交通收費(fèi)、調(diào)度和統(tǒng)計(jì)的依據(jù)。
根據(jù)GB/T 3730.1-2001《汽車(chē)和掛車(chē)類(lèi)型的術(shù)語(yǔ)和定義》[1],汽車(chē)分為乘用車(chē)(不超過(guò)9座)和商用車(chē)。車(chē)型識(shí)別的研究主要應(yīng)用在車(chē)輛結(jié)構(gòu)和車(chē)輛型號(hào)(不同品牌型號(hào))兩個(gè)方面。本文主要是在車(chē)輛結(jié)構(gòu)上進(jìn)行車(chē)型識(shí)別,將識(shí)別的車(chē)輛分為乘用車(chē)(小車(chē))和商用車(chē)(大車(chē))兩類(lèi)。
車(chē)型識(shí)別的汽車(chē)圖片中汽車(chē)所處環(huán)境復(fù)雜多變,并且同類(lèi)車(chē)型包括眾多不同的車(chē)輛,車(chē)型識(shí)別的難點(diǎn)在于獲取最本質(zhì)、最有代表性的特征。在提取特征方面,英國(guó)曼徹斯特大學(xué)的PETROVIC V S等人對(duì)汽車(chē)前景圖像的參考曲面提取梯度特征[2],NEGRI P和CLADY X等人提取汽車(chē)正面圖像定向輪廓點(diǎn)特征[3-4],但是光線特征和輪廓點(diǎn)特征對(duì)光線變換敏感,當(dāng)光線不同時(shí),識(shí)別率變化較大。隨后,PSYLLOS A等人采用尺度不變換特征(SIFT)提取車(chē)臉圖像特征[5]。SIFT特征具有圖像尺度(特征大小)和旋轉(zhuǎn)不變性,而且對(duì)光照變化也具有一定程度的不變性,但是圖像出現(xiàn)損壞、遮擋時(shí),識(shí)別率也會(huì)受到影響。
本文根據(jù)人眼分辨事物的特點(diǎn)提取車(chē)輛前景圖像(車(chē)臉圖像)尺度顯著性特征,然后用徑向基神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器去測(cè)試提取特征方法的識(shí)別效果。實(shí)驗(yàn)結(jié)果表明,本文所提出的方法能有效地對(duì)車(chē)型進(jìn)行識(shí)別處理。
1 尺度顯著性算法
尺度顯著性算子是基于提取魯棒而有關(guān)聯(lián)的特征的需要而提出的[6]。如果一幅圖像的某些區(qū)域不能在特征和尺度空間同時(shí)進(jìn)行預(yù)測(cè),尺度顯著性算法將認(rèn)為這些區(qū)域是顯著特征區(qū)域,即人眼辨別事物時(shí)的感興趣區(qū)域。其中的不可預(yù)測(cè)性通過(guò)統(tǒng)計(jì)方法確定,計(jì)算出位置和尺度的顯著特征值空間作為進(jìn)一步理解圖像的基礎(chǔ)。與傳統(tǒng)方法相比,其目標(biāo)是成為一個(gè)尺度和顯著特征的通用方法,因?yàn)檫@兩者的定義與特殊的基本形態(tài)意義無(wú)關(guān),這些基本形態(tài)意義不是基于粒子、邊緣和角點(diǎn)等特殊的幾何特征。該方法通過(guò)確定某一尺度上圖像塊內(nèi)的熵(entropy,即一種稀有性的量度)進(jìn)行處理,熵HD定義為:
3 算法性能分析
鑒于基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的模式分類(lèi)方法在網(wǎng)絡(luò)結(jié)構(gòu)方面的簡(jiǎn)潔性以及在識(shí)別率和訓(xùn)練速度方面的優(yōu)勢(shì),本文采用其作為車(chē)型識(shí)別方法。用采集到的部分車(chē)輛圖去訓(xùn)練已經(jīng)設(shè)計(jì)好的RBF網(wǎng)絡(luò),最后驗(yàn)證該特征提取方法的有效性,計(jì)算車(chē)型識(shí)別率。
3.1 網(wǎng)絡(luò)模型設(shè)計(jì)
為驗(yàn)證提取顯著性特征的區(qū)分性,選擇RBF神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)一般采用具有輸入層、隱藏層和輸出層的3層模型,各層的權(quán)值向量維數(shù)等于其神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)。
輸入層的節(jié)點(diǎn)數(shù)由特征向量的維數(shù)決定,本文選取車(chē)臉圖像的前15個(gè)顯著性區(qū)域作為車(chē)臉圖像顯著性特征,每個(gè)顯著性區(qū)域包含中心點(diǎn)(x,y)和尺度s,提取得到的特征向量為15×3=45維,故輸入層節(jié)數(shù)為45。
輸出層的節(jié)點(diǎn)數(shù)由輸出向量維數(shù)決定。本文將帶識(shí)別的車(chē)型分為乘務(wù)車(chē)(小車(chē))和商務(wù)車(chē)(大車(chē))兩類(lèi),因此輸出向量為二維向量,即輸出層節(jié)點(diǎn)數(shù)為2。
隱藏層的節(jié)點(diǎn)數(shù)可以通過(guò)網(wǎng)絡(luò)學(xué)習(xí)自適應(yīng)獲得。
3.2 試驗(yàn)與結(jié)果分析
實(shí)驗(yàn)數(shù)據(jù)來(lái)自于相機(jī)采圖,相機(jī)不是固定的,放置在車(chē)輛正前方3~5 m處,距離地面1.4~1.6 m,因此采集的車(chē)輛圖片在尺度和角度±5°都有的變化。在一個(gè)月時(shí)間內(nèi)不同天氣和不同光線條件下采集1 046幅車(chē)臉圖像,圖5為采集到的車(chē)臉圖像樣例。其中,700幅圖像用于訓(xùn)練(大車(chē)和小車(chē)圖像各350幅),346幅圖像用于測(cè)試(198幅小車(chē)圖像和148幅大車(chē)圖像),用這些訓(xùn)練圖像一次性完成對(duì)已設(shè)計(jì)好的RBF網(wǎng)絡(luò)的訓(xùn)練,得到車(chē)型識(shí)別結(jié)果如表2所示。
從表2可知,基于尺度顯著性的車(chē)型識(shí)別方法,乘用車(chē)(小車(chē))和商務(wù)車(chē)(大車(chē))的識(shí)別率都在94%以上,達(dá)到較好的效果。未能正確識(shí)別的車(chē)輛圖像中,大部分都是背景比較復(fù)雜,或是車(chē)輛目標(biāo)不是很明顯。為進(jìn)一步提高識(shí)別率,需在復(fù)雜背景下提取車(chē)輛圖像,這也是今后改進(jìn)的方向。
本文首次提取圖像尺度顯著性因子作為圖像的分類(lèi)特征,并應(yīng)用到圖像識(shí)別領(lǐng)域,提出了一種基于尺度顯著性的車(chē)型識(shí)別方法。相比于傳統(tǒng)的特征提取方法,尺度顯著性因子對(duì)圖像均一亮度變化、縮放、旋轉(zhuǎn)以及噪聲都具有不變性,并對(duì)視點(diǎn)的細(xì)微變化也有魯棒性。用RBF神經(jīng)網(wǎng)絡(luò)去驗(yàn)證算法性能,實(shí)驗(yàn)結(jié)果顯示,基于尺度顯著性的車(chē)型識(shí)別方法是有效的。鑒于圖像尺度顯著性因子的特性,可以將這種方法應(yīng)用復(fù)雜背景下的目標(biāo)檢測(cè)和跟蹤,這也是下一步將研究的問(wèn)題。
參考文獻(xiàn)
[1] GB/T 3730·1-2001. Motor Vehicles and Trailers-Types:Terms and Definitions[S].
[2] PETROVIC V S, COOTES T F. Vehicle type recognition with match refinement[C]. International Conference on Pattern Recognition, 2004(3):95-98.
[3] NEGRI P, CLADY X, MILGRAM M, et al. An oriented-contour point based voting algorithm for vehicle type classification[C]. 18th International Conference on Pattern Recognition, 2006(1):574-577.
[4] CLADY X, NEGRI P, MILGRAM M, et al. Multi-class vehicle type recognition system[C]. Lecture Notes in Computer Science, 2008(5064):228-239.
[5] PSYLLOS A, ANAGNOSTOPOULOS C N, KAYAFAS E. Vehicle model recognition from frontal view image measurements[J]. Journal Computer Standards & Interfaces, 2011(33):142-151.
[6] KADIR T, BRADY M. Scale, saliency and image description [J]. International Journal of Computer Vision, 2001, 45(2):83-97.