摘 要: 針對已有的基于形狀的圖像檢索中目標(biāo)形狀描述方法的不足對其進(jìn)行改進(jìn)。首先對目標(biāo)圖像進(jìn)行一系列預(yù)處理,得到圖像的外部輪廓,利用改進(jìn)的霍夫變換提取目標(biāo)輪廓的線性特征;然后引入成對幾何特征即有向相對角和有向相對位置來描述圖像的形狀;最后利用直方圖相交算法衡量圖像特征間的相似度。實驗證明,利用本文改進(jìn)的方法所描述的形狀屬性來檢索數(shù)據(jù)庫中的圖像具有較高的效率。
關(guān)鍵詞: 基于內(nèi)容的圖像檢索;霍夫變換;成對幾何特征;有向相對角;有向相對位置
近年來,由于數(shù)字化和信息化技術(shù)的快速發(fā)展,越來越多的圖像都被數(shù)字化后保存在多媒體庫中。為了更好地使用這些圖像,就必須要求有一種快速、便捷的圖像檢索方法。因此,基于內(nèi)容的圖像檢索技術(shù)已經(jīng)成為人們研究的熱點。而在設(shè)計基于內(nèi)容的圖像檢索系統(tǒng)時,檢索的有效率和準(zhǔn)確率則是兩個需要重點考慮的問題[1]。
在基于內(nèi)容的圖像檢索方法中,其步驟一般是首先提取出圖像的突出特征(如顏色、紋理、形狀等),然后再根據(jù)這些特征來檢索。由于人類視覺在辨別物體的時候,最容易根據(jù)目標(biāo)的形狀來區(qū)分各個物體,因此形狀特征備受關(guān)注[2]。對基于目標(biāo)形狀的圖像檢索來說,目標(biāo)形狀的描述和匹配方法無疑是要首先解決的重要問題,而通常使用的形狀描述符有:小波輪廓描述符[3]、不變矩(Moment Invariants)[4]、Zernike矩[5]、曲率尺度空間(Curvature Scale Space)[6]和區(qū)域密度函數(shù)[7]等。但是這些方法在尺度變換、旋轉(zhuǎn)變換以及抗噪性能上都有所缺陷。針對上述描述方法的缺陷,本文引入了成對幾何特征直方圖作為目標(biāo)形狀的描述方法,并將其應(yīng)用到基于形狀的圖像檢索系統(tǒng)中。
1 形狀描述符的構(gòu)造
目標(biāo)的形狀可以通過輪廓的提取或圖像分割的方法獲得。本文首先利用一系列的圖像預(yù)處理操作將圖像的外部輪廓提取出來;然后利用改進(jìn)的Hough變換得到目標(biāo)輪廓的線性特征,再引入成對幾何直方圖描述目標(biāo)形狀的屬性;最后利用運(yùn)算復(fù)雜度比較低的直方圖相交算法來衡量目標(biāo)形狀的相似度,從而進(jìn)行目標(biāo)形狀的圖像檢索。
1.1 目標(biāo)輪廓的提取
(1)用戶輸入圖像,由計算機(jī)對輸入的圖像進(jìn)行預(yù)處理,包括圖像格式的轉(zhuǎn)換、尺寸的統(tǒng)一、圖像的增強(qiáng)與去噪等功能,為圖像的特征提取打下基礎(chǔ)。
(2)進(jìn)行圖像邊緣提取,經(jīng)過邊緣提取獲得圖像的輪廓特征。本文采取Canny算子[8]進(jìn)行邊緣提取。但由于有些圖像經(jīng)過邊緣提取過程所獲得的輪廓圖中存在著許多雜亂的線條,針對這種圖像,操作員要確認(rèn)是否對其進(jìn)行進(jìn)一步輪廓清晰化處理。對此,本文采用二值化以及圖像輪廓跟蹤處理來達(dá)到輪廓清晰化。通過輪廓清晰化處理后就基本得到了能夠較好反映圖像邊緣的輪廓圖像。
1.2 改進(jìn)的Hough變換算法
霍夫變換(Hough Transform)[8]用來檢測圖像中的直線和曲線。由于本系統(tǒng)要求得到的特征值中相對位置的幾何特征是要通過直線段獲取,但并沒有限制必須是全連接的直線段,因此,只要是圖像中存在的處于一條直線上的直線分割段都記為一條直線段。一般的霍夫變換算法只能檢測到直線,并不能劃分出符合試驗要求的直線段,所以要對霍夫變換算法進(jìn)行改進(jìn)。即在現(xiàn)有的Hough變換中加入線段長度測定功能。
改進(jìn)的算法基本思路是:充分利用Hough變換的參數(shù)空間數(shù)據(jù),增加Hough變換的后處理,克服Hough變換的缺陷,以檢測出包括諸如端點、方向等一些屬性的線段。具體的算法描述如下:
(7)轉(zhuǎn)到第(3)步。
(8)由Hough變換的局限性可知,某一條線段有可能同時被檢測出多條線段,所以要將這些相同的線段進(jìn)行合并,最后統(tǒng)計出圖像的線段條數(shù),以及它們的始末位置等一些屬性。
程序執(zhí)行完后,在數(shù)組Temp_Point[n]中保存了所檢測到的第n條線段的所有像素,由這些像素可以很容易地得到該線段的兩個端點以及其他參數(shù)。
1.3 成對幾何直方圖描述符
本文利用如圖1所示的成對幾何特征,即相對角和相對位置作為形狀特征來描述目標(biāo)輪廓,并采用關(guān)系直方圖統(tǒng)計這對幾何特征來進(jìn)行形狀索引。
1.3.3 成對幾何直方圖
二維幾何直方圖的描述是以上述成對幾何特征為基礎(chǔ)的。有向相對角的范圍為[-π,π],而有向相對位置的范圍為[1/2,∞)。當(dāng)計算直方圖時處理∞不是很實際,因為在設(shè)計位置特征時是不一致的二進(jìn)制處理過程。所以為方便統(tǒng)計,本文將有向相對位置公式稍做如下改動:
其中,i、j為從原始圖像中提取出的兩條線段,E為符合條件的邊集,eij為分段i和分段j的圖像邊界。
為了便于描繪直方圖,本文將原來直方圖矩陣中處于第i行第j列的元素轉(zhuǎn)換到直方圖數(shù)組中的第i×len+j位置處(其中,len為二維幾何直方圖水平方向總的等份數(shù)),這樣不但便于直方圖的描繪,還提高了直方圖相似性計算的速度。另外,為了便于描繪,對直方圖的范圍也統(tǒng)一量化到[0,255],對整個直方圖表達(dá)出來的統(tǒng)計效果不會產(chǎn)生不良的影響。直方圖量化示意圖如圖2所示。
1.4 直方圖相似度計算
對建立好的特征直方圖進(jìn)行匹配操作是:將所得的直方圖與特征數(shù)據(jù)庫中存儲的直方圖進(jìn)行匹配,在匹配閾值范圍之內(nèi)的圖像則認(rèn)為是與樣本圖像相關(guān)的圖像。
本系統(tǒng)中采用運(yùn)算復(fù)雜度比較低的直方圖相交算法來計算直方圖距離,其算法原理為:假定兩個目標(biāo)輪廓的直方圖A和B各有n個歸一化的直方圖單元{Ai}和{Bi},則這兩個直方圖之間的距離d為:
d值越小,則兩個直方圖之間的距離越近,表明兩幅圖像越相似;相反,則表明兩幅圖像相似性較小。當(dāng)d=0時,表明兩幅圖像完全相同;d=1時,則兩幅圖像完全不同。
2 實驗與結(jié)果分析
實驗利用VS2005和SQL 2005數(shù)據(jù)庫實現(xiàn)了基于目標(biāo)形狀的圖像檢索,模型系統(tǒng)實現(xiàn)了半自動目標(biāo)輪廓提取,并計算目標(biāo)輪廓的幾何特征及描繪出相應(yīng)的幾何特征直方圖;檢索過程中提取并計算目標(biāo)輪廓幾何特征后,系統(tǒng)可以自動完成檢索功能,減少了系統(tǒng)的繁瑣性。
2.1 實驗步驟及結(jié)果
用一幅樣本圖像進(jìn)行試驗,系統(tǒng)對每幅圖像都進(jìn)行了圖像輸入、二值化、邊緣提取、輪廓跟蹤、Hough變換、特征提取6個處理步驟,其結(jié)果如圖3所示。
2.2 檢索結(jié)果
本文的實驗圖庫為從標(biāo)準(zhǔn)測試圖像庫CBIR(Content-Based Image Retrieval)中選取的,由貓、狗、鳥類、蝴蝶等組成的120幅圖片。取CBIR中的一幅貓的圖像為樣本圖像(如圖3(a)),進(jìn)行特征提取及圖像匹配之后,在CBIR中檢索出了與樣本圖像形狀相似的圖像結(jié)果如圖4所示。
2.3 算法性能分析
為了檢驗本文算法的魯棒性和有效性,實驗中對原始圖像分別進(jìn)行了方向變換、尺度變換和部分遮擋變換。
2.3.1 方向變換下的算法性能
圖5為樣本圖像形狀經(jīng)過任意角度旋轉(zhuǎn)后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀的方向發(fā)生了變換,但是其相應(yīng)的幾何直方圖仍然非常相近,這說明了本文的算法對方向具有不變性。
2.3.2 尺度變換下的算法性能
圖6為樣本圖像形狀經(jīng)過各種尺度變換后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀的尺度發(fā)生了變換,但是其相應(yīng)的幾何直方圖仍然非常相近,這說明了本文的算法對尺度具有不變性。
2.3.3 部分遮擋下的算法性能
圖7為樣本圖像形狀經(jīng)過部分遮擋后的圖像及其相應(yīng)的幾何直方圖。由圖可知,雖然目標(biāo)形狀被不同部位的部分遮擋了,但是其相應(yīng)的幾何直方圖仍然非常相近,這說明了本文的算法對部分遮擋情形有魯棒性。
基于內(nèi)容的圖像檢索技術(shù)是數(shù)字圖書館檢索的關(guān)鍵技術(shù),作為一個新興技術(shù),對它的研究才剛剛起步,還有許多問題有待研究和進(jìn)一步完善。本文對其中的基于形狀的圖像檢索進(jìn)行了探討,通過對圖像的預(yù)處理、邊緣檢測、二值化、邊界跟蹤得到圖像的邊界輪廓,并采用Hough變換檢測線段的方法將輪廓邊界簡化為直線表示,進(jìn)而用成對幾何特征方法來描述目標(biāo)輪廓。實驗證明了此描述方法簡單而有效,為多媒體信息檢索提供了一種有效的表示方法。
參考文獻(xiàn)
[1] KIM Y S, KIM W Y. Content-based trademark retrieval system using a visually salient feature [J].Image and Vision Computing, 1998, 16(9): 931-939.
[2] ZHANG D S, LU G J. Study and evaluation of different fourier methods for image retrieval [J]. Image and Vision Computing, 2005, 23(1): 33-49.
[3] 姚玉榮,章毓晉.利用小波和矩進(jìn)行基于形狀的圖像檢索[J].中國圖像圖形學(xué)報,2000(3).
[4] CHEN C C. Improved moment invariants for shape discrimination[J]. Pattern Recognition, 1993,26(5):683-686.
[5] 云挺,顧磊,吳慧中.基于Zernike矩的區(qū)域匹配方法 [J].中國圖像圖形學(xué)報,2008(8).
[6] MOKHTARIAN K, BOBER M. Curvature scale space representation: theory, applications and MPEG-7 standardization[M]. Boston MA, USA: Kluwer Academic Publishers(now Springer), 2003.
[7] 謝紅.基于目標(biāo)形狀的圖像檢索模型的改進(jìn)策略及其原型系統(tǒng)[D].廣州:暨南大學(xué),2001.
[8] 艾海舟,武勃.圖像處理、分析與機(jī)器視覺(第2版)[M].北京:人民郵電出版社,2003.