《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 一種改進(jìn)的SVM的昆蟲圖像檢索算法及仿真
一種改進(jìn)的SVM的昆蟲圖像檢索算法及仿真
2014年電子技術(shù)應(yīng)用第11期
孫中華,許俊偉,古麗米拉·克孜爾別克
(新疆農(nóng)業(yè)大學(xué) 計算機(jī)與信息工程學(xué)院,新疆 烏魯木齊830052)
摘要: 物種的變異性導(dǎo)致種群數(shù)量繁多,如何快速、準(zhǔn)確地從海量的昆蟲圖像數(shù)據(jù)庫查詢吻合用戶意圖的圖像成為棘手問題?;趦?nèi)容的圖像檢索從圖像本身出發(fā),提取圖像的底層特征與語義特征,提高了檢索結(jié)果準(zhǔn)確性。提取圖像顏色與紋理綜合特征,運(yùn)用SVM建立訓(xùn)練模型,使得預(yù)測圖像樣本逼近訓(xùn)練樣本,實(shí)現(xiàn)了基于SVM的圖像檢索仿真。在此基礎(chǔ)上,提出顏色與紋理特征結(jié)合圖像分塊特征,并借鑒Bag of Words模型,彌補(bǔ)了圖像空間分布信息,更加全面地描述了圖像內(nèi)容。實(shí)驗(yàn)表明,全面的特征提取提高了檢索精度。
中圖分類號: TP391.9
文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2014)11-0120-03
An improved SVM insect image retrieval algorithm and simulation
Sun Zhonghua,Xu Junwei,GuLimila·Kezierbieke
Institute of Computer and Information Engineering,Xinjiang Agricultural University,Urumqi 830052,China
Abstract: The variability of species results in various populations. How to demand images which match user intent fast and accurately from the mass of insects image database becomes a thorny issue. Content-based image retrieval is based on the image itself,and extracts the image features and semantic features of the bottom of society, which improves the accuracy of the retrieval results. By comprehensive features extraction of image color and texture, this paper uses the SVM training model to forecast the image sample close to the training sample, and realizes the simulation of image retrieval based on SVM. On this basis, the color and texture feature combing with image block features, and drawing lessons from the Bag of Words model, this paper makes up the image spatial distribution information, and describes the image content more fully. Experiments show that the comprehensive feature extraction improves the retrieval accuracy.
Key words : color features;texture features;image block;SVM;Bag of Words

0 引言

  傳統(tǒng)的昆蟲識別主要是通過專家觀察昆蟲的外部特征并與標(biāo)準(zhǔn)的樣本進(jìn)行鑒別,工作量大。為科學(xué)準(zhǔn)確地識別害蟲與預(yù)防蟲害,利用計算機(jī)模式識別可有效地管理昆蟲圖像數(shù)據(jù)庫?;趦?nèi)容的圖像檢索自動提取昆蟲的底層與高層特征,匹配視覺特征,將相似性較大的圖像反饋給用戶,不僅較少了工作量,且提高了檢索精度。

  顏色特征作為重要的圖像視覺特征之一,其不受圖像的尺寸、平移、旋轉(zhuǎn)的影響。提取顏色特征的方法相對容易,研究者提出了基于顏色特征的諸多算法[1],如顏色直方圖、顏色矩、顏色熵、顏色聚合向量、顏色相關(guān)圖等。顏色特征檢索方法只是基于內(nèi)容圖像檢索的一種方法, 在實(shí)際應(yīng)用中應(yīng)與其他特征檢索方法相結(jié)合, 檢索效果會更佳[2]。紋理特征是圖像另一個重要特征,不僅體現(xiàn)了灰度值間的相互關(guān)系,而且反映出紋理變化規(guī)律的周期性,成為分析圖像特征的重要方法。單一特征片面地描述圖像信息,丟失了圖像的部分信息,檢索通用性差,檢索效果不好[3]。采用綜合特征提取圖像視覺特征,可有效地改善檢索效果,更加符合人的視覺要求。本文首先實(shí)現(xiàn)了顏色特征和紋理特征的SVM圖像檢索仿真,在此基礎(chǔ)上結(jié)合圖像分塊,實(shí)現(xiàn)三者結(jié)合的SVM圖像檢索仿真。

1 算法描述

  1.1 顏色矩

  顏色矩于1995年被Stricker和Orengo提出,是一種簡單且有效的圖像顏色特征描述方法。圖像的顏色分布信息主要集中在低階矩中,采用顏色直方圖的一階矩、二階中心矩和三階中心矩就可以表達(dá)圖像的顏色特征[4]。

  123.png

  其中,hij表示第i個顏色通道分量中灰度為j的像素出現(xiàn)的概率,n表示灰度級。

  1.2 灰度共生矩陣

  灰度共生矩陣方法是公認(rèn)的有效方法,具有較強(qiáng)的適應(yīng)能力和魯棒性[5]。

  假設(shè)f(x,y)為一幅灰度圖像,對圖像中任一區(qū)域R,定義S為區(qū)域中具有特定空間聯(lián)系的像素對的集合,則灰度共生矩陣可表示為:

  4.png

  其中,為圖像任意一點(diǎn)與其他相鄰點(diǎn)的偏離方向,d為偏離距離。在實(shí)際應(yīng)用中,為減小計算量,需對式(4)進(jìn)行歸一化,即式(5)所示:

  5.png

  為減少θ的方向數(shù),通常計算4個方向的灰度共生矩陣,即θ取值為0°、45°、90°、135°。根據(jù)在共生矩陣基礎(chǔ)上提取的數(shù)字統(tǒng)計量,取主要5種描述紋理統(tǒng)計量,分別為能量、相關(guān)性、熵、對比度和逆差矩。

  1.3 SVM

  SVM(支持向量機(jī))建立在統(tǒng)計學(xué)習(xí)和VC維理論的基礎(chǔ)上[6],在解決小樣本問題中存在特有的優(yōu)勢,其主要思想是構(gòu)造一個使分類間隔最大的超平面,使得離分類超平面最近的樣本點(diǎn)間的間隔最大,從而控制VC維大小,降低了機(jī)器學(xué)習(xí)的復(fù)雜度。在訓(xùn)練小樣本情況下,不需要特定問題的先驗(yàn)知識,可以很好地控制學(xué)習(xí)機(jī)器的推廣能力,因而在圖像檢索中可以有效地改善檢索結(jié)果[7]。

  SVM解決分類問題,使得一些在低維特征空間不可分問題在高維空間變得可分。SVM分類器主要受兩個關(guān)鍵因素的影響:其一,誤差懲罰參數(shù)C;其二,核函數(shù)形式及其參數(shù)設(shè)置[8]。選擇不同的核函數(shù)以及相同核函數(shù)設(shè)置不同參數(shù)對其分類性能均有影響。這里借用MATLAB自帶的Libsvm軟件包,構(gòu)造訓(xùn)練模型,實(shí)現(xiàn)圖像樣本預(yù)測。LIBSVM中最重要的是核函數(shù)及其相關(guān)參數(shù)的選取。常用的核函數(shù)有線性核、多項(xiàng)式核和RBF核。一般選擇RBF核及徑向基核函數(shù),它只有一個待定參數(shù),其值越大,收斂速度越快[9]。

  本實(shí)驗(yàn)分別從正、負(fù)類圖像中選取前N張用于訓(xùn)練集,其余的1 000-N用于測試集。選取SVM類型為e-SVR,核函數(shù)選用RBF(徑向基函數(shù))核,又稱高斯核函數(shù),SVM分類器優(yōu)化問題就轉(zhuǎn)化式(6)的最小化問題:

  67.png

  其中,ai為拉格朗日乘子,C為懲罰參數(shù)。式(6)的最小值取決于參數(shù)(C,?酌)的設(shè)置,合適的參數(shù)可使得SVM分類器的性能最佳,其推廣能力最好。經(jīng)過多次試驗(yàn),C取100,?酌取1/k,k為類數(shù)。用訓(xùn)練數(shù)據(jù)訓(xùn)練SVM分類器,預(yù)測測試樣本,同時,為了避免數(shù)值計算困難問題,采用尺度因子壓縮數(shù)據(jù),用ROC曲線與AUC值作為評價分類器性能的指標(biāo)。

2 改進(jìn)算法

  2.1 圖像分塊

  圖像分塊通過綜合利用圖像全局特征和綜合特征,更好地描述了圖像內(nèi)容。由于顏色空間分布存在差異性,故將圖像分成若干個子塊[10]。分塊圖像特征檢索方法具有良好的旋轉(zhuǎn)、平移和尺度不變性,得到的檢索結(jié)果能夠很好地滿足人的視覺感受[11]。圖像的空間分布信息對圖像相似性判斷的影響極大,圖像分塊注重了圖像的空間分布信息,實(shí)現(xiàn)了基于均勻分塊的圖像檢索算法[12],三者結(jié)合更加全面地描述了圖像信息,使得檢索結(jié)果更加準(zhǔn)確。

  2.2 Bag of Words算法描述

  Bag of Words算法也稱為詞袋算法,是一種有效的基于語義特征提取與描述的物體識別算法。其基本思想是假定對于一個文本,忽略其詞序和語法、句法,僅僅將其看作是一些詞匯的集合,而文本中的每個詞匯都是獨(dú)立的[13]。Bag of Words算法首先要提取圖像的特征點(diǎn),通過描述方式轉(zhuǎn)化為特征描述符,利用K-Means對描述符進(jìn)行聚類,得到每個類的聚類中心,所有的聚類中心的集合成為視覺詞匯,最后利用機(jī)器學(xué)習(xí)的方法對多個類別的描述符進(jìn)行訓(xùn)練。

  2.3 Bag of Words模型

  Bag of Words模型應(yīng)用于圖像表示,為了能表示一幅圖像,需將圖像視為文檔。K-Means算法是基于樣本間相似度測量的間接聚類算法,其特點(diǎn):理論可靠、算法簡單、收斂速度快[14]。

  實(shí)驗(yàn)將圖像庫里的圖像大小分成50×50,采用重疊的分塊方式,并提取每塊的顏色紋理特征,由于圖像大小不同,故分塊的數(shù)量也不同。為了能用標(biāo)準(zhǔn)的SVM學(xué)習(xí)與檢索,借鑒Bag of Words模型,則步驟如下:

  (1)用K-Means對所有訓(xùn)練圖像的所有分塊的顏色與紋理特征進(jìn)行聚類,找到聚類中心點(diǎn),構(gòu)造視覺詞匯;

  (2)將每幅圖像的分塊特征向量在聚類中心點(diǎn)映射,得到圖像的映射向量;

  (3)以圖像的映射向量作為圖像的特征向量,從而利用SVM學(xué)習(xí)與檢索。

  用K-Means算法將訓(xùn)練類的所有圖像示例聚成100類,并產(chǎn)生每一類的投影特征,建立每小類的視覺字,分別計算訓(xùn)練與測試類的投影特征。

3 實(shí)驗(yàn)分析

  實(shí)驗(yàn)選取蝴蝶、蜻蜓、蜜蜂、蟋蟀、蝗蟲、螳螂、天牛、棉鈴蟲(幼蟲)、瓢蟲與蚜蟲10類各100張圖片構(gòu)建昆蟲圖像數(shù)據(jù)庫。分別采用顏色矩小波紋理綜合特征與圖像分塊結(jié)合顏色矩小波紋理綜合特征的方法,進(jìn)行SVM圖像檢索。實(shí)驗(yàn)結(jié)果如表1所示。

001.jpg

  根據(jù)每類圖像的AUC值繪制PR曲線,如圖1所示。

002.jpg

  實(shí)驗(yàn)表明,圖像分塊特征結(jié)合顏色紋理綜合特征檢索效果比顏色紋理綜合特征SVM圖像檢索結(jié)果精度高,同時也表明了全面的綜合特征描述了圖像的完整信息。

4 結(jié)論

  利用計算機(jī)模式識別可有效地識別昆蟲,通過提取綜合特征描述昆蟲圖像信息,構(gòu)建訓(xùn)練模型,使用SVM訓(xùn)練樣本,并預(yù)測測試樣本。圖像分塊彌補(bǔ)了圖像空間分布信息,更加全面描述了圖像內(nèi)容,SVM在圖像檢索中的應(yīng)用提高了檢索精度。

參考文獻(xiàn)

  [1] 李勃,章毓晉.基于特征元素和關(guān)聯(lián)規(guī)則的圖像分類方法[J].電子學(xué)報,2002,30(9):1262-1265.

  [2] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344-348.

  [3] 肖秦琨,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計算機(jī)技術(shù)與發(fā)展,2013,23(4):107-110.

  [4] 孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009.

  [5] 侯群群,王飛,嚴(yán)麗.基于灰度共生矩陣的彩色遙感圖像紋理特征提取[J].國土資源遙感,2013,25(12):26-32.

  [6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,2001,23(8):800-810.

  [7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.

  [8] 奉國和.SVM分類核函數(shù)及參數(shù)選擇比較[J].計算機(jī)工程與應(yīng)用,2011,47(3):126-127.

  [9] 羅成石.基于LIBSVM 的糧食水分?jǐn)?shù)據(jù)融合研究[J].科學(xué)技術(shù)與工程,2012,12(2):292-294.

  [10] 陳雅芳,薛清福,陳方芳,等.基于圖像全局和局部顏色特征的圖像檢索[J].長春教育學(xué)院學(xué)報,2013,29(24):50-51.

  [11] 郭麗,黃元元,楊靜宇.用分塊圖像特征進(jìn)行商標(biāo)圖像檢索[J].計算機(jī)輔助設(shè)計與圖形學(xué)報,2004,16(7):968-972.

  [12] 張磊,林福宗,張鈸.基于支持向量機(jī)的相關(guān)反饋圖像索算法[J].清華大學(xué)學(xué)報,2002,42(1):80-83.

  [13] 孫孟柯,張紅梅.基于Bag of words模型的圖像檢索系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].電腦知識與技術(shù),2012,8(5):1139-1141.

  [14] 曾接賢,王軍婷,符祥.K均值聚類分割的多特征圖像檢索方法[J].計算機(jī)工程與應(yīng)用,2013,49(2):226-227.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。