文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2016.07.030
中文引用格式: 李雷. 一種基于Curvelet相關(guān)圖紋理圖像檢索方法[J].電子技術(shù)應(yīng)用,2016,42(7):119-121,129.
英文引用格式: Li Lei. A texture image retrieval approach based on Curvelet correlogram[J].Application of Electronic Technique,2016,42(7):119-121,129.
0 引言
近二十年來(lái),隨著計(jì)算機(jī)多媒體技術(shù)的普及和應(yīng)用,出現(xiàn)了大規(guī)模數(shù)字圖像庫(kù),基于內(nèi)容的圖像檢索技術(shù)因此得到發(fā)展。它是使用同一種方法分別從查詢圖像和目標(biāo)圖像中提取特征,通過(guò)特征對(duì)比輸出最終檢索結(jié)果[1]。紋理是一種基本視覺(jué)和全局特征,它反映了圖像中不依賴于顏色和亮度的同質(zhì)現(xiàn)象,在基于內(nèi)容的圖像檢索中已經(jīng)得到廣泛的應(yīng)用[2]。紋理分析方法分為統(tǒng)計(jì)方法、結(jié)構(gòu)方法、模型方法和頻譜方法。
目前提取紋理特征的方法主要采用頻譜方法,其建立在時(shí)頻分析與多尺度分析基礎(chǔ)上[3],并取得一定的成績(jī)。HALEY G M利用Gabor小波提取紋理特征,但其具有較高的復(fù)雜性[4-5];MANTHALKAR R[6]用離散小波包分解方法,但是由于小波不具有方向性信息,因此一定程度上丟失了紋理方向性信息。曲懷敬[7]采用基于金字塔雙樹(shù)方向?yàn)V波器組,結(jié)合濾波器的選擇和相對(duì)相位的統(tǒng)計(jì)紋理圖像檢索,其對(duì)系數(shù)進(jìn)行統(tǒng)計(jì)建模處理,增加了算法復(fù)雜度。由于Curvelet變換相對(duì)Gabor變換能夠更有效地提取圖像曲線特性,近年來(lái)在數(shù)字圖像處理中得到廣泛應(yīng)用[8]。
為了圖像檢索不受紋理旋轉(zhuǎn)變化的影響,提高圖像檢索性能,本文采用Curvelet變換對(duì)紋理圖像進(jìn)行多尺度分析,根據(jù)粗尺度反映圖像輪廓、細(xì)尺度反映圖像紋理特性特點(diǎn),對(duì)各尺度系數(shù)進(jìn)行閾值處理,去除噪聲等冗余信息,然后采用不同的量化等級(jí),以更好地保留紋理信息。在此基礎(chǔ)上計(jì)算各尺度系數(shù)自相關(guān)圖,充分考慮量化后不同系數(shù)比例和其空間相關(guān)性。通過(guò)對(duì)Brodatz紋理數(shù)據(jù)庫(kù)圖像檢索,證明該方法有效提高圖像檢索精度。
1 Curvelet變換
Curvelet變換是一種圖像多尺度幾何分析工具。第1代Curvelet變換實(shí)質(zhì)是在不同的位置和方向上進(jìn)行Ridgelet變換,其構(gòu)造思想是在足夠精細(xì)的尺度下曲線可近似為直線。為了降低數(shù)據(jù)冗余度和提高運(yùn)算速度,第2代Curvelet變換實(shí)現(xiàn)過(guò)程中并沒(méi)有用到Ridgelet。離散Curvelet變換中,其頻率窗表現(xiàn)為“楔形”且具有任意角度的方向性,所以認(rèn)為這種頻率窗具有“各向異性”的特征。在頻域楔形分塊中,只有其方向與奇異性特征的幾何形狀相互匹配情況下,才具有較大的Curvelet特征系數(shù)。文獻(xiàn)[9]給出了其快速離散實(shí)現(xiàn)算法。
設(shè)0≤t1≤t2<n,離散Curvelet的系數(shù)可定義為:
2 顏色自相關(guān)圖
顏色相關(guān)圖是圖像的一種低層特征,其結(jié)合了圖像中的顏色與空間信息,是圖像顏色分布的一種表達(dá)方式。這種特征具有旋轉(zhuǎn)不變性,刻畫(huà)了不同顏色對(duì)之間空域相關(guān)性,還反映了特定顏色像素在整個(gè)圖像中的比例。不同于傳統(tǒng)的顏色直方圖,顏色相關(guān)圖是用各種顏色之間的量化距離來(lái)構(gòu)建直方圖。
假設(shè)I表示一幅N×N圖像,圖像I中的顏色被量化成m種顏色C1,…,Cm,對(duì)于某個(gè)像素點(diǎn)P(x,y)∈I。令I(lǐng)C={p|I(p)=C},因此ICi表示顏色為Ci的所有像素。圖像中2個(gè)像素點(diǎn)p1(x1,y1)、p2(x2,y2)之間的距離如下:
定義圖像I的顏色相關(guān)圖為:
γ(i,j,k)表示顏色對(duì)為Ci與Cj的像素之間的距離小于等于k的概率。顏色相關(guān)圖矩陣的大小m2×k,k代表不同距離的總數(shù)目。
如果考慮任意顏色對(duì)之間的空間相關(guān)性,顏色相關(guān)圖將會(huì)非常復(fù)雜和龐大,這樣將大大影響處理速度。為了簡(jiǎn)化處理降低復(fù)雜度,引入顏色自相關(guān)圖。其表示為:
根據(jù)顏色自相關(guān)的表達(dá)式可以看出其只考慮相同顏色像素對(duì)之間的空間關(guān)系。自相關(guān)圖是顏色相關(guān)圖的子集,其矩陣的大小為m×k,空間需求低于顏色相關(guān)圖,也更加容易實(shí)現(xiàn)。
Curvelet充分利用了多尺度分析的特點(diǎn),因此在時(shí)域和頻域都具有良好的局部化分析能力,能逐步聚焦到分析對(duì)象的任何細(xì)節(jié)。它引入了尺度、位移和方向3個(gè)參量,其不但能反映信號(hào)的點(diǎn)奇異性,且具有良好的方向辨識(shí)能力。Curvelet相關(guān)圖充分運(yùn)用了Curvelet多尺度分析特性和顏色自相關(guān)圖的旋轉(zhuǎn)不變性,可以用于紋理圖像檢索。
算法流程如下:
(1)對(duì)紋理圖像進(jìn)行Curvelet分解;
(2)各尺度Curvelet系數(shù)閾值處理;
(3)采用不同量化等級(jí)量化Curvelet系數(shù);
(4)計(jì)算各尺度系數(shù)的自相關(guān)圖;
(5)構(gòu)造特征向量。
3.1 Curvelet圖像分解
對(duì)紋理圖像進(jìn)行Curvelet分解需確定其分解層數(shù),層數(shù)大小直接影響紋理特征提取的效果和數(shù)據(jù)量大小。分解層數(shù)太小,細(xì)尺度下各方向的圖像紋理等細(xì)節(jié)信息不能夠被有效提取,數(shù)據(jù)中包含較多的冗余信息;如果分解層數(shù)太大,分解計(jì)算時(shí)間明顯增加,粗尺度下圖像的概貌信息會(huì)產(chǎn)生一定重合,將丟失一部分圖像的基本特征,且影響整體的檢索速度。
Curvelet分解頻帶劃分示意見(jiàn)圖1。為了保證既能有效提取圖像紋理等細(xì)節(jié)信息,又加快檢索速度,按圖1方法確定分解層數(shù)。若將紋理圖像大小設(shè)為N×N,則Curvelet分解尺度變?yōu)椋?/p>
假設(shè)紋理圖像大小為128×128,則由式(11)計(jì)算得到Curvelet分解層數(shù)為3。通過(guò)計(jì)算可知細(xì)尺度高頻每層方向數(shù)為8的倍數(shù)。在本算法中粗尺度為第一層,個(gè)數(shù)為1,細(xì)尺度共有兩層,個(gè)數(shù)分別為16和32,因此總共3層Curvelet分解,將會(huì)產(chǎn)生40(=1+16+32)個(gè)子帶。由于Curvelet分解的方向性,在細(xì)尺度層上角度θ和π+θ的分塊將具有相同的Curvelet系數(shù),因此在以下的分析中只需要考慮細(xì)尺度各層的一半子帶,由此得到參與相關(guān)圖運(yùn)算的共25(=1+8+16)個(gè)子帶。
3.2 Curvelet各層系數(shù)閾值處理
在Curvelet頻域楔形分塊中,只有那些與分塊方向相同的奇異特征的幾何形狀才具有較大的Curvelet特征系數(shù)。相對(duì)來(lái)說(shuō),圖像中紋理等細(xì)節(jié)信息Curvelet系數(shù)值大于輪廓信息Curvelet系數(shù)。因此可以通過(guò)閾值處理去掉圖像一些冗余信息,閾值處理后各層Curvelet系數(shù)為:
WM是圖像I的第M層Curvelet系數(shù),nM是與層數(shù)相關(guān)的參數(shù),σM為第 M層Curvelet系數(shù)的標(biāo)準(zhǔn)差。
3.3 Curvelet各層系數(shù)量化
由于閾值處理后Curvelet系數(shù)仍表現(xiàn)為具有較大分布范圍的一組實(shí)數(shù),為了便于后面相關(guān)圖分析,必須對(duì)系數(shù)進(jìn)行相應(yīng)的量化。系數(shù)的能量主要分布在粗尺度系數(shù)上,此層上包含了圖像的輪廓信息。本算法粗尺度的低頻系數(shù)采用4個(gè)量化等級(jí),細(xì)尺度的高頻系數(shù)采用8個(gè)量化等級(jí)。
3.4 Curvelet自相關(guān)圖計(jì)算
WM是圖像I的第M層Curvelet系數(shù),對(duì)該層進(jìn)行量化成L級(jí)W1…WL,且點(diǎn)P1(x,y),P2(x,y)都是屬于第M層的Curvelet系數(shù)。則Curvelet相關(guān)圖為:
式中k∈{1…K}代表指定距離,i,j∈{1…L}。計(jì)算Curvelet自相關(guān)圖時(shí),選定i=j。由于Curvelet變換的多尺度分析特性,因此總的距離數(shù)K的值大小要遠(yuǎn)小于直接計(jì)算顏色自相關(guān)圖的值大小,本算法中選K=3。
3.5 紋理圖像特征向量構(gòu)造
Curvelet相關(guān)圖算法中的特征向量大小與Curvelet分解后各層系數(shù)量化大小和自相關(guān)圖總的距離數(shù)相關(guān),其構(gòu)造簡(jiǎn)單,總的分量個(gè)數(shù)為:
由此可得本算法中特征向量的分量個(gè)數(shù)為60。
4 實(shí)驗(yàn)結(jié)果
檢索實(shí)驗(yàn)圖像采用Brodatz紋理庫(kù)圖像,該紋理庫(kù)包含91幅512×512的灰度紋理圖像,共13類圖像,且每類圖像包含旋轉(zhuǎn)0°、30°、60°、90°、120°、150°和200°后的7幅圖像。將91幅圖像每幅紋理圖像無(wú)重疊地分割為16個(gè)128×128的圖像,將總共得到1 456幅128×128的紋理圖像,并將這些圖像組成最終的紋理檢索測(cè)試集。實(shí)驗(yàn)將基本的Curvelet檢索方法、Md Monirul Islam的基于Curvelet旋轉(zhuǎn)不變特性檢索方法和Curvelet相關(guān)圖方法用于圖像數(shù)據(jù)庫(kù)中圖像檢索進(jìn)行對(duì)比,采用精確度(presision)和檢索率(recall)進(jìn)行評(píng)價(jià)不同算法的檢索性能。
檢索返回結(jié)果隊(duì)列中檢索到的正確目標(biāo)圖像數(shù)與檢索結(jié)果隊(duì)列中所有的圖像數(shù)之比定義為精確度,即:
檢索返回結(jié)果隊(duì)列中檢索到的正確目標(biāo)圖像數(shù)與數(shù)據(jù)庫(kù)中全部的同類目標(biāo)圖像數(shù)之比定義為檢索率,即:
式中,F(xiàn)為圖像庫(kù)中與檢索圖像同類的目標(biāo)圖像總數(shù),X代表檢索結(jié)果隊(duì)列中的圖像總數(shù),Y為查詢結(jié)果中與檢索圖像同類的目標(biāo)圖像數(shù)。通過(guò)對(duì)紋理圖像庫(kù)中的每幅圖像進(jìn)行檢索,據(jù)此得出檢索的平均檢索精度和查全率,從而給出算法的檢索性能評(píng)價(jià)。
表1給出了當(dāng)X=20時(shí),上述3種算法的平均精確度。
圖2顯示3種不同算法的準(zhǔn)確度-檢索率性能。從圖2可以看出,Curvelet相關(guān)圖檢索算法檢索性能優(yōu)于其他兩種算法的檢索性能,且該方法具有旋轉(zhuǎn)不變性。
5 結(jié)論
本文提出了一種新的基于Curvelet相關(guān)圖紋理圖像檢索方法。通過(guò)對(duì)Brodatz紋理圖像庫(kù)實(shí)驗(yàn),結(jié)果表明該方法相較于原有的Curvelet方法能夠更有效地進(jìn)行紋理圖像檢索。該算法時(shí)間復(fù)雜度相對(duì)于其他方法有所提高。后續(xù)研究可以考慮與調(diào)整量化等級(jí)、顏色距離大小等方法相結(jié)合以進(jìn)一步提高檢索效率。
參考文獻(xiàn)
[1] SMEULDERS A W M,WORRING M,SANTINI S,et al.Content-based image retrieval at the end of the early years[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2000,22(12):1349-1380.
[2] 孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009.
[3] 韓曉晨.圖像紋理分割綜述[J].科技與企業(yè),2015(9):76.
[4] HALEY G M,MANJUNATH B S.Rotation-invariant texture classification using a complete space-frequency model[J].IEEE Trans.on Image Processing,1999,8(2):255-269.
[5] SALEMBIER P,SIKORA T.Introduction to MPEG-7[M].New York:John Wiley & Son Inc.,2002.
[6] MANTHALKAR R,BISWAS P K,CHATTERJI B N.Rotation and scale invariant texture features using discrete wavelet packet transform[J].Pattern Recognition Letter,2003,24(14):2455-2462.
[7] 曲懷敬,李健,吳延榮,等.結(jié)合濾波器選擇和相位信息的統(tǒng)計(jì)紋理圖像檢索[J].計(jì)算機(jī)應(yīng)用研究,2014,31(12):3894-3897.
[8] STARCK J L,CANDES E J,DONOHO D L.The curvelet transform for image denoising[J].IEEE Trans.on Image Processing,2002,11(6):670-684.
[9] CANDES E,DEMANET L,Ying Lexing,et al.Fast discrete curvelet transforms[J].Multiscale Model Simulation,2006,5(3):861-899.