摘 要: 為增強圖像的顯著性檢測效果,提出了一種基于圖像聚類與均勻分布的顯著性檢測算法。首先用聚類算法對圖像進行預(yù)處理,突顯出圖像中感興趣的目標(biāo)區(qū)域;然后對聚類后的圖像進行均勻的顯著性檢測,在此過程中采用雙邊濾波對粗糙的金字塔顯著性圖像進行精化;最后將多層次的視覺顯著性圖整合到結(jié)果顯著性圖中。大量實驗結(jié)果比較表明,該算法可以得到更準(zhǔn)確、與人類視覺注意機制較為一致的顯著性檢測結(jié)果。
關(guān)鍵詞: 顯著性檢測;圖像聚類;均勻分布;預(yù)處理;視覺注意機制
人類視覺系統(tǒng)對視覺場景中感興趣區(qū)域的抽取是一個視覺注意機制顯著性檢測的過程[1]。在圖像理解的同時若能模擬人類視覺機制提取出圖像中顯著性區(qū)域,將會很大程度上提高圖像理解的效率。目前,圖像的顯著性檢測已經(jīng)廣泛地運用到許多計算機視覺的應(yīng)用領(lǐng)域中,如目標(biāo)檢測、場景渲染和視覺界面設(shè)計等。
近年來,隨著研究的深入,研究者們提出了各種圖像顯著性區(qū)域檢測算法。最早的ITTI L等人[2]提出了一種模擬生物視覺注意機制的算法,目前只適用于自然圖像。針對Itti模型的不足,田明輝[3]提出一種適用于自然場景的視覺顯著度模型,在此基礎(chǔ)上結(jié)合模糊區(qū)域增長方法進行顯著性檢測。對于不可預(yù)知以及復(fù)雜場景圖像,Hou Xiaodi等[4]和Guo Chenlei等[5]利用圖像頻域的統(tǒng)計特性(如對數(shù)幅度和相角)來衡量圖像顯著性。GOFERMAN S等人[6]提出了一種基于上下文的顯著性檢測機制,效率比較低。黃志勇等人[7]在參考文獻[6]算法基礎(chǔ)上進行改進,提出了隨機的顯著性檢測算法,旨在提高顯著性檢測的速度。
顯著性檢測的最終結(jié)果即檢測出人們感興趣的目標(biāo)區(qū)域,而圖像的聚類分析通常依據(jù)相似性和相鄰性構(gòu)造分類器,可以將數(shù)據(jù)對象分割為不同的類。理論上,圖像聚類算法可以分割出圖像中的前景部分,而人們的感興趣區(qū)域一般也隸屬于圖像中的前景。因此,可以在進行顯著性檢測算法之前對圖片應(yīng)用圖像聚類算法以實行粗檢測。
本文提出了一種新的基于圖像聚類與均勻分布的顯著性檢測算法。在該算法中,首先用圖像聚類算法(如K-均值聚類[8]、金字塔聚類[9]和均值漂移聚類[10])對圖片進行粗檢測;然后用均勻查找方法檢測出聚類后的圖像的每一層的粗糙的顯著性區(qū)域;再采用濾波方式精化粗糙的顯著性區(qū)域;最后將每層精化了的顯著性區(qū)域圖進行合并。大量實驗結(jié)果表明,該算法與已有方法相比,準(zhǔn)確性明顯提高,與人類視覺注意機制較為一致。
1 圖像上下文顯著性檢測原理
基于上下文的顯著性檢測機制主要依賴于兩個定理。
定理1 設(shè)兩個向量化了的圖像塊pi和pj在Lab顏色空間的歐氏距離為dcolor(pi,pj),將其歸一化到[0,1]范圍內(nèi)。當(dāng)dcolor(pi,pj)相對于任意的圖像塊都大時,則像素i是顯著的。
定理2 設(shè)兩個向量化了的圖像塊pi和pj所在位置之間的歐氏距離為dposition(pi,pj),將其歸一化到[0,1]范圍內(nèi)。
此種顯著性檢測方法計算量大、效率低,通常只針對于處理規(guī)格較小的圖片。參考文獻[7]提出了一種致力于改善檢測速度的隨機顯著性檢測算法:隨機地從圖像中選取2K個圖像塊,并且只考慮K個最相似的圖像塊;采用金字塔分層,并使用8鄰域方法對粗糙顯著性圖進行精化。
參考文獻[7]算法計算量明顯減少,但由于其算法中2K個圖像塊的隨機選取,導(dǎo)致顯著性檢測效果不太穩(wěn)定,噪聲影響較大,一些檢測結(jié)果如圖1所示。從圖1可以看出顯著性檢測效果不佳,噪聲影響較大。基于此,本文考慮從兩方面對其進行改善:(1)采用均勻分布,兼顧圖像全局信息;(2)采用聚類算法進行圖像區(qū)域顯著性聚類,提高檢測的穩(wěn)定性,避免噪聲影響。
2 基于聚類與均勻分布的顯著性檢測算法
本文算法的主要步驟是:首先利用聚類算法對輸入圖像進行聚類,突出圖像的感興趣區(qū)域,在此基礎(chǔ)上進行均勻采樣顯著性檢測,再用雙邊濾波對粗糙顯著性圖進行精化。算法總體流程如圖2所示。
(3)基于均勻分布的顯著性檢測
在對圖像進行聚類后,在此基礎(chǔ)上進行基于均勻分布的顯著性檢測。本文首先將圖像均勻地分成2K個圖像塊,然后找出每個圖像塊的質(zhì)心像素點,如此獲得圖片中均勻的2K個像素點。具體算法為:假設(shè)將一幅圖像分成2K=N×M個圖像塊,則每個圖像塊的中心像素點的坐標(biāo)值為:
至此,合并后的顯著性圖已經(jīng)比較精細(xì),可以用于一些基本的圖像應(yīng)用。
3 實驗結(jié)果分析及討論
本文使用VSC++程序設(shè)計語言在Windows XP系統(tǒng)環(huán)境下實現(xiàn)算法,機器硬件配置為:雙核的CPU E6300 CPU,2 GB內(nèi)存。實驗在Achanta等人提供的公開測試集上進行算法測試,此測試集是此類數(shù)據(jù)最大的測試集,并且已由人工精確標(biāo)注了顯著性區(qū)域,實驗過程中設(shè)置圖像尺寸規(guī)格為640×480。
3.1 顯著性檢測過程中不同參數(shù)的分析比較
3.1.1 圖像聚類的實驗結(jié)果分析
圖4是對圖像分別用3種圖像聚類方法進行聚類后的實驗結(jié)果。實驗結(jié)果表明,均值漂移聚類算法得到的聚類效果中,圖像的前景和背景分離較為徹底,突出的前景與人的主觀意志最為一致,而其他兩種算法得到的聚類效果則相差太遠(yuǎn),不利于進行后續(xù)的顯著性檢測。本文最終選取的聚類算法為均值漂移聚類算法,其能給后續(xù)的顯著性檢測工作提供一個較為準(zhǔn)確的人們感興趣的粗檢區(qū)域。
3.2 本文方法與其他顯著性檢測算法的實驗結(jié)果比較
為了分析和驗證本文提出的基于聚類以及均勻分布的顯著性檢測算法的實際效果,本文同時采用了參考文獻[7]的隨機的顯著性檢測算法、參考文獻[6]的基于上下文的顯著性檢測算法、均勻的顯著性檢測算法、基于聚類以及隨機的顯著性檢測算法進行比較,實驗結(jié)果如圖7所示。
圖7表明,均勻的顯著性檢測結(jié)果與參考文獻[6]和參考文獻[7]的檢測結(jié)果相比更加精細(xì),更加能突出感興趣區(qū)域,只是還存在少量噪聲;基于聚類的隨機的顯著性檢測結(jié)果與基于均勻分布的顯著性檢測結(jié)果相比,部分圖像最后顯示不出檢測結(jié)果,而能顯示出檢測結(jié)果的圖像與均勻的顯著性檢測結(jié)果相比,去掉了大部分噪聲,這點歸功于聚類算法?;诖?,本文提出的算法將聚類以及均勻分布相結(jié)合,在此基礎(chǔ)上進行顯著性檢測。從圖7(g)可以看出,本文算法得到的顯著性檢測結(jié)果明顯優(yōu)于其他4種算法的檢測結(jié)果,在去掉了大部分噪聲的同時還能保證顯著性區(qū)域的清晰存在,較符合人類視覺注意機制。
從時間消耗這一因素來說,本文的算法也明顯優(yōu)于參考文獻[6]的算法。在隨機的顯著性檢測算法以及本文算法中,圖像塊的采樣量比較少,加速了程序運行的速度。而參考文獻[6]的算法是利用全部的圖像塊來進行像素顯著性值的計算,計算效率非常低下。此外,均勻的顯著性檢測與隨機的顯著性檢測算法相比,時間消耗明顯減少許多,這是由于隨機的顯著性檢測算法中,圖像塊需要按照一定的規(guī)則去逐個尋找,這個過程需耗費一定的時間,而均勻的顯著性檢測算法中,圖像塊是固定的,省去了查找圖像塊的時間。最終各算法的時間消耗如圖8所示。
3.3 關(guān)于顯著性檢測結(jié)果穩(wěn)定性的結(jié)果討論
顯著性檢測結(jié)果的穩(wěn)定性源于整個檢測過程中圖像聚類和圖像塊的選取方式兩個關(guān)鍵步驟。先對圖像用聚類算法進行粗檢測,可以很好地去除圖像中的背景信息,保留前景部分中感興趣的區(qū)域;然后將圖像均勻進行分塊,選取每個圖像塊的中心像素點,如此獲得2K個圖像塊,這將避免隨機的顯著性檢測中出現(xiàn)的情況,兼顧圖像的全局信息,因此其顯著性檢測結(jié)果較為穩(wěn)定。結(jié)合聚類算法能更好地去除圖像中的背景信息,加強了最終的檢測結(jié)果的穩(wěn)定性。本文算法與其他算法生成的顯著性結(jié)果穩(wěn)定性比較如圖9所示。
大量實驗表明,本文提出的基于聚類以及均勻分布的顯著性檢測算法能得到一個比較準(zhǔn)確的顯著性檢測結(jié)果,與人類視覺注意機制符合程度較高,這表明本文方法存在較大的價值。在未來的工作中,將進一步致力于研究顯著性檢測的困難問題——背景復(fù)雜圖像的顯著性檢測算法,以進一步獲取對圖像顯著性檢測原理的認(rèn)識。
參考文獻
[1] 李寅.基于張量分解的視覺顯著性算法[D].上海:上海交通大學(xué),2011.
[2] ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11): 1254-1259.
[3] 田明輝.視覺注意機制建模及其應(yīng)用研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2010.
[4] Hou Xiaodi, Zhang Liqing. Saliency detection: a spectral residual approach[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2007: 1-8.
[5] Guo Chenlei, Ma Qi, Zhang Liming. Spatio-temporal saliency detection using phase spectrum of quaternion fourier transform[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2008: 116-124.
[6] GOFERMAN S, ZELNIK-MANOR L, TAL A. Context-aware saliency detection[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2010: 2376-2383.
[7] 黃志勇,何發(fā)智,蔡賢濤,等.一種隨機的視覺顯著性檢測算法[J].中國科學(xué)(信息科學(xué)),2011,41(7):863-874.
[8] 李翠,馮冬青.基于改進K-均值聚類的圖像分割算法研究[J].鄭州大學(xué)學(xué)報(理學(xué)版),2011,43(1):109-113.
[9] JAHNE B. Digital image processing(5rd ed)[M]. Berlin:Springer-Verlag, 2002.
[10] 劉技,康曉東,賈富倉.基于圖割與均值漂移算法的脊椎骨自動分割[J].計算機應(yīng)用,2011,31(3):760-762.
[11] RAFAEL C G, RICHARD E W. Digital image processing (2rd ed)[M].阮秋奇, 阮宇智,譯. New Jersey, Prentice Hall, 2002.