文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2014)11-0120-03
0 引言
傳統(tǒng)的昆蟲識別主要是通過專家觀察昆蟲的外部特征并與標(biāo)準(zhǔn)的樣本進(jìn)行鑒別,工作量大。為科學(xué)準(zhǔn)確地識別害蟲與預(yù)防蟲害,利用計算機(jī)模式識別可有效地管理昆蟲圖像數(shù)據(jù)庫?;趦?nèi)容的圖像檢索自動提取昆蟲的底層與高層特征,匹配視覺特征,將相似性較大的圖像反饋給用戶,不僅較少了工作量,且提高了檢索精度。
顏色特征作為重要的圖像視覺特征之一,其不受圖像的尺寸、平移、旋轉(zhuǎn)的影響。提取顏色特征的方法相對容易,研究者提出了基于顏色特征的諸多算法[1],如顏色直方圖、顏色矩、顏色熵、顏色聚合向量、顏色相關(guān)圖等。顏色特征檢索方法只是基于內(nèi)容圖像檢索的一種方法, 在實(shí)際應(yīng)用中應(yīng)與其他特征檢索方法相結(jié)合, 檢索效果會更佳[2]。紋理特征是圖像另一個重要特征,不僅體現(xiàn)了灰度值間的相互關(guān)系,而且反映出紋理變化規(guī)律的周期性,成為分析圖像特征的重要方法。單一特征片面地描述圖像信息,丟失了圖像的部分信息,檢索通用性差,檢索效果不好[3]。采用綜合特征提取圖像視覺特征,可有效地改善檢索效果,更加符合人的視覺要求。本文首先實(shí)現(xiàn)了顏色特征和紋理特征的SVM圖像檢索仿真,在此基礎(chǔ)上結(jié)合圖像分塊,實(shí)現(xiàn)三者結(jié)合的SVM圖像檢索仿真。
1 算法描述
1.1 顏色矩
顏色矩于1995年被Stricker和Orengo提出,是一種簡單且有效的圖像顏色特征描述方法。圖像的顏色分布信息主要集中在低階矩中,采用顏色直方圖的一階矩、二階中心矩和三階中心矩就可以表達(dá)圖像的顏色特征[4]。
其中,hij表示第i個顏色通道分量中灰度為j的像素出現(xiàn)的概率,n表示灰度級。
1.2 灰度共生矩陣
灰度共生矩陣方法是公認(rèn)的有效方法,具有較強(qiáng)的適應(yīng)能力和魯棒性[5]。
假設(shè)f(x,y)為一幅灰度圖像,對圖像中任一區(qū)域R,定義S為區(qū)域中具有特定空間聯(lián)系的像素對的集合,則灰度共生矩陣可表示為:
其中,為圖像任意一點(diǎn)與其他相鄰點(diǎn)的偏離方向,d為偏離距離。在實(shí)際應(yīng)用中,為減小計算量,需對式(4)進(jìn)行歸一化,即式(5)所示:
為減少θ的方向數(shù),通常計算4個方向的灰度共生矩陣,即θ取值為0°、45°、90°、135°。根據(jù)在共生矩陣基礎(chǔ)上提取的數(shù)字統(tǒng)計量,取主要5種描述紋理統(tǒng)計量,分別為能量、相關(guān)性、熵、對比度和逆差矩。
1.3 SVM
SVM(支持向量機(jī))建立在統(tǒng)計學(xué)習(xí)和VC維理論的基礎(chǔ)上[6],在解決小樣本問題中存在特有的優(yōu)勢,其主要思想是構(gòu)造一個使分類間隔最大的超平面,使得離分類超平面最近的樣本點(diǎn)間的間隔最大,從而控制VC維大小,降低了機(jī)器學(xué)習(xí)的復(fù)雜度。在訓(xùn)練小樣本情況下,不需要特定問題的先驗(yàn)知識,可以很好地控制學(xué)習(xí)機(jī)器的推廣能力,因而在圖像檢索中可以有效地改善檢索結(jié)果[7]。
SVM解決分類問題,使得一些在低維特征空間不可分問題在高維空間變得可分。SVM分類器主要受兩個關(guān)鍵因素的影響:其一,誤差懲罰參數(shù)C;其二,核函數(shù)形式及其參數(shù)設(shè)置[8]。選擇不同的核函數(shù)以及相同核函數(shù)設(shè)置不同參數(shù)對其分類性能均有影響。這里借用MATLAB自帶的Libsvm軟件包,構(gòu)造訓(xùn)練模型,實(shí)現(xiàn)圖像樣本預(yù)測。LIBSVM中最重要的是核函數(shù)及其相關(guān)參數(shù)的選取。常用的核函數(shù)有線性核、多項(xiàng)式核和RBF核。一般選擇RBF核及徑向基核函數(shù),它只有一個待定參數(shù),其值越大,收斂速度越快[9]。
本實(shí)驗(yàn)分別從正、負(fù)類圖像中選取前N張用于訓(xùn)練集,其余的1 000-N用于測試集。選取SVM類型為e-SVR,核函數(shù)選用RBF(徑向基函數(shù))核,又稱高斯核函數(shù),SVM分類器優(yōu)化問題就轉(zhuǎn)化式(6)的最小化問題:
其中,ai為拉格朗日乘子,C為懲罰參數(shù)。式(6)的最小值取決于參數(shù)(C,?酌)的設(shè)置,合適的參數(shù)可使得SVM分類器的性能最佳,其推廣能力最好。經(jīng)過多次試驗(yàn),C取100,?酌取1/k,k為類數(shù)。用訓(xùn)練數(shù)據(jù)訓(xùn)練SVM分類器,預(yù)測測試樣本,同時,為了避免數(shù)值計算困難問題,采用尺度因子壓縮數(shù)據(jù),用ROC曲線與AUC值作為評價分類器性能的指標(biāo)。
2 改進(jìn)算法
2.1 圖像分塊
圖像分塊通過綜合利用圖像全局特征和綜合特征,更好地描述了圖像內(nèi)容。由于顏色空間分布存在差異性,故將圖像分成若干個子塊[10]。分塊圖像特征檢索方法具有良好的旋轉(zhuǎn)、平移和尺度不變性,得到的檢索結(jié)果能夠很好地滿足人的視覺感受[11]。圖像的空間分布信息對圖像相似性判斷的影響極大,圖像分塊注重了圖像的空間分布信息,實(shí)現(xiàn)了基于均勻分塊的圖像檢索算法[12],三者結(jié)合更加全面地描述了圖像信息,使得檢索結(jié)果更加準(zhǔn)確。
2.2 Bag of Words算法描述
Bag of Words算法也稱為詞袋算法,是一種有效的基于語義特征提取與描述的物體識別算法。其基本思想是假定對于一個文本,忽略其詞序和語法、句法,僅僅將其看作是一些詞匯的集合,而文本中的每個詞匯都是獨(dú)立的[13]。Bag of Words算法首先要提取圖像的特征點(diǎn),通過描述方式轉(zhuǎn)化為特征描述符,利用K-Means對描述符進(jìn)行聚類,得到每個類的聚類中心,所有的聚類中心的集合成為視覺詞匯,最后利用機(jī)器學(xué)習(xí)的方法對多個類別的描述符進(jìn)行訓(xùn)練。
2.3 Bag of Words模型
Bag of Words模型應(yīng)用于圖像表示,為了能表示一幅圖像,需將圖像視為文檔。K-Means算法是基于樣本間相似度測量的間接聚類算法,其特點(diǎn):理論可靠、算法簡單、收斂速度快[14]。
實(shí)驗(yàn)將圖像庫里的圖像大小分成50×50,采用重疊的分塊方式,并提取每塊的顏色紋理特征,由于圖像大小不同,故分塊的數(shù)量也不同。為了能用標(biāo)準(zhǔn)的SVM學(xué)習(xí)與檢索,借鑒Bag of Words模型,則步驟如下:
(1)用K-Means對所有訓(xùn)練圖像的所有分塊的顏色與紋理特征進(jìn)行聚類,找到聚類中心點(diǎn),構(gòu)造視覺詞匯;
(2)將每幅圖像的分塊特征向量在聚類中心點(diǎn)映射,得到圖像的映射向量;
(3)以圖像的映射向量作為圖像的特征向量,從而利用SVM學(xué)習(xí)與檢索。
用K-Means算法將訓(xùn)練類的所有圖像示例聚成100類,并產(chǎn)生每一類的投影特征,建立每小類的視覺字,分別計算訓(xùn)練與測試類的投影特征。
3 實(shí)驗(yàn)分析
實(shí)驗(yàn)選取蝴蝶、蜻蜓、蜜蜂、蟋蟀、蝗蟲、螳螂、天牛、棉鈴蟲(幼蟲)、瓢蟲與蚜蟲10類各100張圖片構(gòu)建昆蟲圖像數(shù)據(jù)庫。分別采用顏色矩小波紋理綜合特征與圖像分塊結(jié)合顏色矩小波紋理綜合特征的方法,進(jìn)行SVM圖像檢索。實(shí)驗(yàn)結(jié)果如表1所示。
根據(jù)每類圖像的AUC值繪制PR曲線,如圖1所示。
實(shí)驗(yàn)表明,圖像分塊特征結(jié)合顏色紋理綜合特征檢索效果比顏色紋理綜合特征SVM圖像檢索結(jié)果精度高,同時也表明了全面的綜合特征描述了圖像的完整信息。
4 結(jié)論
利用計算機(jī)模式識別可有效地識別昆蟲,通過提取綜合特征描述昆蟲圖像信息,構(gòu)建訓(xùn)練模型,使用SVM訓(xùn)練樣本,并預(yù)測測試樣本。圖像分塊彌補(bǔ)了圖像空間分布信息,更加全面描述了圖像內(nèi)容,SVM在圖像檢索中的應(yīng)用提高了檢索精度。
參考文獻(xiàn)
[1] 李勃,章毓晉.基于特征元素和關(guān)聯(lián)規(guī)則的圖像分類方法[J].電子學(xué)報,2002,30(9):1262-1265.
[2] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344-348.
[3] 肖秦琨,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計算機(jī)技術(shù)與發(fā)展,2013,23(4):107-110.
[4] 孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009.
[5] 侯群群,王飛,嚴(yán)麗.基于灰度共生矩陣的彩色遙感圖像紋理特征提取[J].國土資源遙感,2013,25(12):26-32.
[6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,2001,23(8):800-810.
[7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 奉國和.SVM分類核函數(shù)及參數(shù)選擇比較[J].計算機(jī)工程與應(yīng)用,2011,47(3):126-127.
[9] 羅成石.基于LIBSVM 的糧食水分?jǐn)?shù)據(jù)融合研究[J].科學(xué)技術(shù)與工程,2012,12(2):292-294.
[10] 陳雅芳,薛清福,陳方芳,等.基于圖像全局和局部顏色特征的圖像檢索[J].長春教育學(xué)院學(xué)報,2013,29(24):50-51.
[11] 郭麗,黃元元,楊靜宇.用分塊圖像特征進(jìn)行商標(biāo)圖像檢索[J].計算機(jī)輔助設(shè)計與圖形學(xué)報,2004,16(7):968-972.
[12] 張磊,林福宗,張鈸.基于支持向量機(jī)的相關(guān)反饋圖像索算法[J].清華大學(xué)學(xué)報,2002,42(1):80-83.
[13] 孫孟柯,張紅梅.基于Bag of words模型的圖像檢索系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].電腦知識與技術(shù),2012,8(5):1139-1141.
[14] 曾接賢,王軍婷,符祥.K均值聚類分割的多特征圖像檢索方法[J].計算機(jī)工程與應(yīng)用,2013,49(2):226-227.