摘 要: 為增強(qiáng)圖像的顯著性檢測(cè)效果,提出了一種基于圖像聚類與均勻分布的顯著性檢測(cè)算法。首先用聚類算法對(duì)圖像進(jìn)行預(yù)處理,突顯出圖像中感興趣的目標(biāo)區(qū)域;然后對(duì)聚類后的圖像進(jìn)行均勻的顯著性檢測(cè),在此過(guò)程中采用雙邊濾波對(duì)粗糙的金字塔顯著性圖像進(jìn)行精化;最后將多層次的視覺(jué)顯著性圖整合到結(jié)果顯著性圖中。大量實(shí)驗(yàn)結(jié)果比較表明,該算法可以得到更準(zhǔn)確、與人類視覺(jué)注意機(jī)制較為一致的顯著性檢測(cè)結(jié)果。
關(guān)鍵詞: 顯著性檢測(cè);圖像聚類;均勻分布;預(yù)處理;視覺(jué)注意機(jī)制
人類視覺(jué)系統(tǒng)對(duì)視覺(jué)場(chǎng)景中感興趣區(qū)域的抽取是一個(gè)視覺(jué)注意機(jī)制顯著性檢測(cè)的過(guò)程[1]。在圖像理解的同時(shí)若能模擬人類視覺(jué)機(jī)制提取出圖像中顯著性區(qū)域,將會(huì)很大程度上提高圖像理解的效率。目前,圖像的顯著性檢測(cè)已經(jīng)廣泛地運(yùn)用到許多計(jì)算機(jī)視覺(jué)的應(yīng)用領(lǐng)域中,如目標(biāo)檢測(cè)、場(chǎng)景渲染和視覺(jué)界面設(shè)計(jì)等。
近年來(lái),隨著研究的深入,研究者們提出了各種圖像顯著性區(qū)域檢測(cè)算法。最早的ITTI L等人[2]提出了一種模擬生物視覺(jué)注意機(jī)制的算法,目前只適用于自然圖像。針對(duì)Itti模型的不足,田明輝[3]提出一種適用于自然場(chǎng)景的視覺(jué)顯著度模型,在此基礎(chǔ)上結(jié)合模糊區(qū)域增長(zhǎng)方法進(jìn)行顯著性檢測(cè)。對(duì)于不可預(yù)知以及復(fù)雜場(chǎng)景圖像,Hou Xiaodi等[4]和Guo Chenlei等[5]利用圖像頻域的統(tǒng)計(jì)特性(如對(duì)數(shù)幅度和相角)來(lái)衡量圖像顯著性。GOFERMAN S等人[6]提出了一種基于上下文的顯著性檢測(cè)機(jī)制,效率比較低。黃志勇等人[7]在參考文獻(xiàn)[6]算法基礎(chǔ)上進(jìn)行改進(jìn),提出了隨機(jī)的顯著性檢測(cè)算法,旨在提高顯著性檢測(cè)的速度。
顯著性檢測(cè)的最終結(jié)果即檢測(cè)出人們感興趣的目標(biāo)區(qū)域,而圖像的聚類分析通常依據(jù)相似性和相鄰性構(gòu)造分類器,可以將數(shù)據(jù)對(duì)象分割為不同的類。理論上,圖像聚類算法可以分割出圖像中的前景部分,而人們的感興趣區(qū)域一般也隸屬于圖像中的前景。因此,可以在進(jìn)行顯著性檢測(cè)算法之前對(duì)圖片應(yīng)用圖像聚類算法以實(shí)行粗檢測(cè)。
本文提出了一種新的基于圖像聚類與均勻分布的顯著性檢測(cè)算法。在該算法中,首先用圖像聚類算法(如K-均值聚類[8]、金字塔聚類[9]和均值漂移聚類[10])對(duì)圖片進(jìn)行粗檢測(cè);然后用均勻查找方法檢測(cè)出聚類后的圖像的每一層的粗糙的顯著性區(qū)域;再采用濾波方式精化粗糙的顯著性區(qū)域;最后將每層精化了的顯著性區(qū)域圖進(jìn)行合并。大量實(shí)驗(yàn)結(jié)果表明,該算法與已有方法相比,準(zhǔn)確性明顯提高,與人類視覺(jué)注意機(jī)制較為一致。
1 圖像上下文顯著性檢測(cè)原理
基于上下文的顯著性檢測(cè)機(jī)制主要依賴于兩個(gè)定理。
定理1 設(shè)兩個(gè)向量化了的圖像塊pi和pj在Lab顏色空間的歐氏距離為dcolor(pi,pj),將其歸一化到[0,1]范圍內(nèi)。當(dāng)dcolor(pi,pj)相對(duì)于任意的圖像塊都大時(shí),則像素i是顯著的。
定理2 設(shè)兩個(gè)向量化了的圖像塊pi和pj所在位置之間的歐氏距離為dposition(pi,pj),將其歸一化到[0,1]范圍內(nèi)。
此種顯著性檢測(cè)方法計(jì)算量大、效率低,通常只針對(duì)于處理規(guī)格較小的圖片。參考文獻(xiàn)[7]提出了一種致力于改善檢測(cè)速度的隨機(jī)顯著性檢測(cè)算法:隨機(jī)地從圖像中選取2K個(gè)圖像塊,并且只考慮K個(gè)最相似的圖像塊;采用金字塔分層,并使用8鄰域方法對(duì)粗糙顯著性圖進(jìn)行精化。
參考文獻(xiàn)[7]算法計(jì)算量明顯減少,但由于其算法中2K個(gè)圖像塊的隨機(jī)選取,導(dǎo)致顯著性檢測(cè)效果不太穩(wěn)定,噪聲影響較大,一些檢測(cè)結(jié)果如圖1所示。從圖1可以看出顯著性檢測(cè)效果不佳,噪聲影響較大?;诖耍疚目紤]從兩方面對(duì)其進(jìn)行改善:(1)采用均勻分布,兼顧圖像全局信息;(2)采用聚類算法進(jìn)行圖像區(qū)域顯著性聚類,提高檢測(cè)的穩(wěn)定性,避免噪聲影響。
2 基于聚類與均勻分布的顯著性檢測(cè)算法
本文算法的主要步驟是:首先利用聚類算法對(duì)輸入圖像進(jìn)行聚類,突出圖像的感興趣區(qū)域,在此基礎(chǔ)上進(jìn)行均勻采樣顯著性檢測(cè),再用雙邊濾波對(duì)粗糙顯著性圖進(jìn)行精化。算法總體流程如圖2所示。
?。?)基于均勻分布的顯著性檢測(cè)
在對(duì)圖像進(jìn)行聚類后,在此基礎(chǔ)上進(jìn)行基于均勻分布的顯著性檢測(cè)。本文首先將圖像均勻地分成2K個(gè)圖像塊,然后找出每個(gè)圖像塊的質(zhì)心像素點(diǎn),如此獲得圖片中均勻的2K個(gè)像素點(diǎn)。具體算法為:假設(shè)將一幅圖像分成2K=N×M個(gè)圖像塊,則每個(gè)圖像塊的中心像素點(diǎn)的坐標(biāo)值為:
至此,合并后的顯著性圖已經(jīng)比較精細(xì),可以用于一些基本的圖像應(yīng)用。
3 實(shí)驗(yàn)結(jié)果分析及討論
本文使用VSC++程序設(shè)計(jì)語(yǔ)言在Windows XP系統(tǒng)環(huán)境下實(shí)現(xiàn)算法,機(jī)器硬件配置為:雙核的CPU E6300 CPU,2 GB內(nèi)存。實(shí)驗(yàn)在Achanta等人提供的公開(kāi)測(cè)試集上進(jìn)行算法測(cè)試,此測(cè)試集是此類數(shù)據(jù)最大的測(cè)試集,并且已由人工精確標(biāo)注了顯著性區(qū)域,實(shí)驗(yàn)過(guò)程中設(shè)置圖像尺寸規(guī)格為640×480。
3.1 顯著性檢測(cè)過(guò)程中不同參數(shù)的分析比較
3.1.1 圖像聚類的實(shí)驗(yàn)結(jié)果分析
圖4是對(duì)圖像分別用3種圖像聚類方法進(jìn)行聚類后的實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)結(jié)果表明,均值漂移聚類算法得到的聚類效果中,圖像的前景和背景分離較為徹底,突出的前景與人的主觀意志最為一致,而其他兩種算法得到的聚類效果則相差太遠(yuǎn),不利于進(jìn)行后續(xù)的顯著性檢測(cè)。本文最終選取的聚類算法為均值漂移聚類算法,其能給后續(xù)的顯著性檢測(cè)工作提供一個(gè)較為準(zhǔn)確的人們感興趣的粗檢區(qū)域。
3.2 本文方法與其他顯著性檢測(cè)算法的實(shí)驗(yàn)結(jié)果比較
為了分析和驗(yàn)證本文提出的基于聚類以及均勻分布的顯著性檢測(cè)算法的實(shí)際效果,本文同時(shí)采用了參考文獻(xiàn)[7]的隨機(jī)的顯著性檢測(cè)算法、參考文獻(xiàn)[6]的基于上下文的顯著性檢測(cè)算法、均勻的顯著性檢測(cè)算法、基于聚類以及隨機(jī)的顯著性檢測(cè)算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果如圖7所示。
圖7表明,均勻的顯著性檢測(cè)結(jié)果與參考文獻(xiàn)[6]和參考文獻(xiàn)[7]的檢測(cè)結(jié)果相比更加精細(xì),更加能突出感興趣區(qū)域,只是還存在少量噪聲;基于聚類的隨機(jī)的顯著性檢測(cè)結(jié)果與基于均勻分布的顯著性檢測(cè)結(jié)果相比,部分圖像最后顯示不出檢測(cè)結(jié)果,而能顯示出檢測(cè)結(jié)果的圖像與均勻的顯著性檢測(cè)結(jié)果相比,去掉了大部分噪聲,這點(diǎn)歸功于聚類算法?;诖?,本文提出的算法將聚類以及均勻分布相結(jié)合,在此基礎(chǔ)上進(jìn)行顯著性檢測(cè)。從圖7(g)可以看出,本文算法得到的顯著性檢測(cè)結(jié)果明顯優(yōu)于其他4種算法的檢測(cè)結(jié)果,在去掉了大部分噪聲的同時(shí)還能保證顯著性區(qū)域的清晰存在,較符合人類視覺(jué)注意機(jī)制。
從時(shí)間消耗這一因素來(lái)說(shuō),本文的算法也明顯優(yōu)于參考文獻(xiàn)[6]的算法。在隨機(jī)的顯著性檢測(cè)算法以及本文算法中,圖像塊的采樣量比較少,加速了程序運(yùn)行的速度。而參考文獻(xiàn)[6]的算法是利用全部的圖像塊來(lái)進(jìn)行像素顯著性值的計(jì)算,計(jì)算效率非常低下。此外,均勻的顯著性檢測(cè)與隨機(jī)的顯著性檢測(cè)算法相比,時(shí)間消耗明顯減少許多,這是由于隨機(jī)的顯著性檢測(cè)算法中,圖像塊需要按照一定的規(guī)則去逐個(gè)尋找,這個(gè)過(guò)程需耗費(fèi)一定的時(shí)間,而均勻的顯著性檢測(cè)算法中,圖像塊是固定的,省去了查找圖像塊的時(shí)間。最終各算法的時(shí)間消耗如圖8所示。
3.3 關(guān)于顯著性檢測(cè)結(jié)果穩(wěn)定性的結(jié)果討論
顯著性檢測(cè)結(jié)果的穩(wěn)定性源于整個(gè)檢測(cè)過(guò)程中圖像聚類和圖像塊的選取方式兩個(gè)關(guān)鍵步驟。先對(duì)圖像用聚類算法進(jìn)行粗檢測(cè),可以很好地去除圖像中的背景信息,保留前景部分中感興趣的區(qū)域;然后將圖像均勻進(jìn)行分塊,選取每個(gè)圖像塊的中心像素點(diǎn),如此獲得2K個(gè)圖像塊,這將避免隨機(jī)的顯著性檢測(cè)中出現(xiàn)的情況,兼顧圖像的全局信息,因此其顯著性檢測(cè)結(jié)果較為穩(wěn)定。結(jié)合聚類算法能更好地去除圖像中的背景信息,加強(qiáng)了最終的檢測(cè)結(jié)果的穩(wěn)定性。本文算法與其他算法生成的顯著性結(jié)果穩(wěn)定性比較如圖9所示。
大量實(shí)驗(yàn)表明,本文提出的基于聚類以及均勻分布的顯著性檢測(cè)算法能得到一個(gè)比較準(zhǔn)確的顯著性檢測(cè)結(jié)果,與人類視覺(jué)注意機(jī)制符合程度較高,這表明本文方法存在較大的價(jià)值。在未來(lái)的工作中,將進(jìn)一步致力于研究顯著性檢測(cè)的困難問(wèn)題——背景復(fù)雜圖像的顯著性檢測(cè)算法,以進(jìn)一步獲取對(duì)圖像顯著性檢測(cè)原理的認(rèn)識(shí)。
參考文獻(xiàn)
[1] 李寅.基于張量分解的視覺(jué)顯著性算法[D].上海:上海交通大學(xué),2011.
[2] ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11): 1254-1259.
[3] 田明輝.視覺(jué)注意機(jī)制建模及其應(yīng)用研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2010.
[4] Hou Xiaodi, Zhang Liqing. Saliency detection: a spectral residual approach[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2007: 1-8.
[5] Guo Chenlei, Ma Qi, Zhang Liming. Spatio-temporal saliency detection using phase spectrum of quaternion fourier transform[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2008: 116-124.
[6] GOFERMAN S, ZELNIK-MANOR L, TAL A. Context-aware saliency detection[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2010: 2376-2383.
[7] 黃志勇,何發(fā)智,蔡賢濤,等.一種隨機(jī)的視覺(jué)顯著性檢測(cè)算法[J].中國(guó)科學(xué)(信息科學(xué)),2011,41(7):863-874.
[8] 李翠,馮冬青.基于改進(jìn)K-均值聚類的圖像分割算法研究[J].鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2011,43(1):109-113.
[9] JAHNE B. Digital image processing(5rd ed)[M]. Berlin:Springer-Verlag, 2002.
[10] 劉技,康曉東,賈富倉(cāng).基于圖割與均值漂移算法的脊椎骨自動(dòng)分割[J].計(jì)算機(jī)應(yīng)用,2011,31(3):760-762.
[11] RAFAEL C G, RICHARD E W. Digital image processing (2rd ed)[M].阮秋奇, 阮宇智,譯. New Jersey, Prentice Hall, 2002.