《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 設計應用 > 基于顏色空間采樣的摳圖算法
基于顏色空間采樣的摳圖算法
2014年微型機與應用第19期
陳 玲,舒志彪
福州大學 數(shù)學與計算機科學學院,福建 福州 350108
摘要: 由于自然圖像摳圖具有高度的不確定性,目前的摳圖方法中對于前背景顏色較為復雜的圖片處理效果并不理想。本文首先通過采集大量的樣本對來估計初始的掩膜值,但是通過采樣得到的樣本對并不能很好地估計掩膜值,為此定義未知像素與前背景樣本點的空間距離和顏色距離函數(shù)來對其進行優(yōu)化。通過最小化該代價函數(shù)來求得最優(yōu)的樣本對,使得最終得到的結(jié)果實現(xiàn)了準確性和魯棒性的良好均衡。自然圖像摳圖實驗結(jié)果表明,與其他幾種摳圖算法相比,本算法在視覺效果上和均差誤差上都優(yōu)于其他算法。
Abstract:
Key words :

  摘 要: 由于自然圖像摳圖具有高度的不確定性,目前的摳圖方法中對于前背景顏色較為復雜的圖片處理效果并不理想。本文首先通過采集大量的樣本對來估計初始的掩膜值,但是通過采樣得到的樣本對并不能很好地估計掩膜值,為此定義未知像素與前背景樣本點的空間距離和顏色距離函數(shù)來對其進行優(yōu)化。通過最小化該代價函數(shù)來求得最優(yōu)的樣本對,使得最終得到的結(jié)果實現(xiàn)了準確性和魯棒性的良好均衡。自然圖像摳圖實驗結(jié)果表明,與其他幾種摳圖算法相比,本算法在視覺效果上和均差誤差上都優(yōu)于其他算法。

  關鍵詞: 自然圖像摳圖;掩膜值;信度函數(shù)

0 引言

  摳圖就是從一張給定的圖片中提取出感興趣的部分,數(shù)字圖像摳圖可以表示為前景F和背景B的線性組合,即顏色組合公式:

  1.png

  對于圖像中的每個像素點(x, y),式(1)中的I(x, y)代表該點的像素值,F(xiàn)(x, y)和B(x, y)代表該點的前景色和背景色的像素值,α代表前景色所占的比例,稱之為透明度或者掩膜值,α的取值介于[0, 1]之間,當α=1時表明當前像素是完全前景像素,當α=0時表示當前像素是完全背景像素,而摳圖的本質(zhì)就是求出每個像素點對應的α值。由于式(1)中α、F和B都是未知的,所以式(1)的解具有高度不確定性,因此自然圖像摳圖實際上是一個不能精確求解的過程。

  當前的摳圖方法根據(jù)研究圖像近鄰像素的相關性和圖像統(tǒng)計,可分為基于采樣、基于傳播、采樣傳播相結(jié)合三種方法。其中基于采樣的摳圖方法通過計算前景和背景的顏色來估計掩膜值,早期的方法如Bayesian Matting[1]、Ruzon-Tomasi[2]、Hillman[3]等都是基于采樣的方法,但是通過采樣的方法采集到的前景和背景像素的樣本點具有不確定性,使得最終得到的掩膜值不夠精確;基于傳播的方法不需要通過采集樣本點來估計掩膜值,它假設未知像素在一個小窗口內(nèi)是局部平滑的,再在閉合空間中求解α。Random Walk Matting[4] 、Closed Form Solution[5] 、Poisson Matting[6]等都屬于基于傳播的方法,該方法對大部分圖片都能取得較好的結(jié)果,但是對一些前景和背景顏色較為復雜的圖像,采樣與傳播相結(jié)合的方法能取得更好的結(jié)果,如Shared Matting[7]、Robust Matting[8]、Comprehensive Sampling Matting[9]等。

  對于復雜的圖像,要計算得到精確的掩膜值是比較困難的。本文首先采集大量的與未知像素相鄰的樣本點,然后通過未知像素與前景和背景樣本點的顏色空間距離來定義一個目標函數(shù)對其進行優(yōu)化,從而選出最優(yōu)的樣本對來求圖像的掩膜值,最后結(jié)合拉普拉斯矩陣和信度值函數(shù)對其進行優(yōu)化得到最終的掩膜值。將本文得到的結(jié)果與多種摳圖算法進行比較,結(jié)果表明本文算法能取得更好的掩膜值。

1 Comprehensive Sampling Sets方法介紹

  為了求出每個未知像素的最優(yōu)樣本對,Comprehensive Sampling Sets方法根據(jù)光學和圖像空間統(tǒng)計來建立一個目標函數(shù):

  2.png

  其中K表示像素點Iz與由式(1)求出的估計值之間的彩色誤差:

  3.png

  S表示樣本對(F,B)和未知像素的空間距離:

  4.png

  其中SzF是像素z的所有前景樣本點的集合,│SzF│表示樣本點的個數(shù),SzB與其類似,F(xiàn)iS表示樣本點Fi的空間坐標。

  C表示圖像中的顏色統(tǒng)計:

  5.png

  其中d(Fi, Bi)是Fi和Bi的顏色分布:

  6.png

  9KSGPQ32Y8V]8CR]}P]`%ET.png是樣本 Fi的均值、方差以及樣本群的大小。根據(jù)目標函數(shù)O,從中選出最優(yōu)的樣本對,再根據(jù)下式:

  7.png

  計算出一個初始的掩膜值α,然后根據(jù)參考文獻[7]的方法對初始掩膜值進行優(yōu)化。

2 基于顏色采樣摳圖

  2.1 區(qū)域劃分

  本文的算法需要用戶預先提供一張原圖像的trimap圖,也叫三分圖,它通過用戶手工操作得到目標邊界的前景、背景和未知區(qū)域的精細劃分,在得到的三分圖中,白色部分即為已知的前景區(qū)域,黑色部分為已知的背景區(qū)域,灰色部分則是需要計算的未知區(qū)域。

  區(qū)域劃分的目的是減少計算的復雜度,因為圖像中大部分區(qū)域的掩膜值都是已知的,即前景部分的掩膜值為1,背景部分的掩膜值為0,只需要計算未知區(qū)域每個像素點的掩膜值。區(qū)域劃分的準確性對掩膜值有很大的影響,因此,為了使得到的結(jié)果更加精確,本文實驗所需的三分圖都由http://www.alphamatting.com./datasets.php下載得到。

  2.2 初始掩膜值的估計

  由式(1)可知,對于一幅彩色圖像,該式中α、 F和B都是未知的,所以首先通過采樣的方法來采集前景像素樣本點F和背景像素樣本點B。在本文的算法中,采用參考文獻[8]的方法來采樣,即沿著己知前景區(qū)域和己知背景區(qū)域的邊界稀疏地采集樣本點,這樣采集得到的樣本集合能夠較好地捕捉到前景色或背景色的變化,當采集到足夠的樣本點之后,再根據(jù)式(7)來求初始的missing image file,但是僅僅通過采樣得到的missing image file還很粗糙,需要進一步優(yōu)化。

  為了優(yōu)化初始的掩膜值,定義一個顏色空間代價函數(shù)來選擇最終的樣本對:

  8.png

  其中,Y@JYPZ0QY2)G{7EUPX7RBSJ.png表示當前像素I與由顏色線性組合式(1)得到的估計值的顏色距離,如果當前像素I與顏色組合公式估計的值十分接近,那么(Fi, Bj)就可以作為較優(yōu)的樣本對來估計掩膜值。這個式子在參考文獻[8]中首次被提出,在文獻參考[9]和[10]中也采用了相同的顏色代價函數(shù),但是由于采集到的樣本對較多,僅僅通過式(8)來選擇最終的樣本對并不可靠,所以接下來定義空間代價函數(shù)S`E{(VM6RIURJPQMO%D~0SL.png

  910.png

  與參考文獻[9]的空間代價函數(shù)類似,為每個前景和背景樣本點定義一個空間距離函數(shù)missing image file和missing image file,式(9)和(10)中missing image file、missing image file和xI代表前景樣本點、背景樣本點和未知像素的空間坐標,missing image file和missing image file表示已知的前景和背景樣本點的集合。接下來根據(jù)顏色代價函數(shù)定義Pα,它表示當一個未知像素與前景樣本點的顏色較近而與背景樣本點的顏色相差較大時,就認為該未知像素很有可能就是一個完全前景像素,因此定義下式:

  11.png

  其中:

  12.png

  當PF趨近于0時,最小化Pα就相當于最小化α;當PF趨近于1時,最小化Pα就相當于最大化α;當PF=0.5時,則Pα是一個常數(shù)項。式(11)將會在目標函數(shù)中用來求最優(yōu)的樣本對。

  結(jié)合顏色空間代價函數(shù)定義一個選擇最終樣本對的代價函數(shù):

  13.png

  最小化式(13)來求最優(yōu)的樣本對,并且把求得的最優(yōu)的樣本對記為U%N%JEA09(RNS5P7N1$9SRC.png

  14.png

  再利用求得的最優(yōu)樣本對U%N%JEA09(RNS5P7N1$9SRC.png來重新估計未知像素的掩膜值 。

  2.3 掩膜值的優(yōu)化

  在上述算法中已經(jīng)計算得到一個掩膜值,但是這個掩膜值并不夠精確,所以接下來采用閉合式空間中求解的方法對其進行優(yōu)化。首先采用參考文獻[5]的方法構造一個拉普拉斯矩陣,由于摳圖問題是典型的不確定問題,因此需要添加一定的約束條件,把求得的掩膜值missing image file和信度值f作為數(shù)據(jù)項,信度值missing image file,其中σ=0.01,并且結(jié)合拉普拉斯矩陣作為約束項來構造一個代價函數(shù):

  missing image file

  上式中,missing image file和missing image file是權重參數(shù),設為200和0.1,D是一個對角矩陣,已知區(qū)域的像素記為1,未知像素的像素記為0,F(xiàn)是對角線元素為信度值f的對角矩陣;對式(15)關于α求導并令導數(shù)為0即可求得最終的α,圖1所得結(jié)果即為最終得到的掩膜值。

3 實驗及結(jié)果

  本文實驗均在matlab下完成。實驗的系統(tǒng)配置為Inter(R) Core(TM) Quad CPU處理器、2.66 GHz主頻以及3.46 GB內(nèi)存。實驗所需圖片均由http://www.alphamatting.com./datasets.php下載得到,其中包括實驗原圖、trimap圖和ground-truth圖,如圖2所示。本文將5幅圖得到的實驗結(jié)果與Robust Matting[8],Global Sampling[10]、Comprehensive Sampling Sets [9]所得的結(jié)果進行比較。還計算出各個算法得到的掩膜圖與其相應的ground-truth圖的均方誤差作為算法性能評價的量化指標,如表1所示。

004.jpg

003.jpg

  從表1及圖3可以看出,通過對5組圖片進行實驗,本文算法不管是從視覺角度還是均方誤差角度都具有明顯的優(yōu)勢,其他三種算法中,Comprehensive Sampling Sets最好,Global Sampling次之,Robust Matting效果較差。從實驗結(jié)果可以看出,Robust Matting對于前背景顏色較為相近的圖片處理效果較差, Global Sampling對細節(jié)的把握不夠精確。本文算法得到的掩膜圖不僅在細節(jié)部分優(yōu)于其他3種算法,而且與ground-truth相比,誤差最小。

4 結(jié)論

  本文首先通過采集大量的樣本對求出初始的掩膜值,再定義一個顏色空間代價函數(shù)來選擇最優(yōu)的樣本對,與以前的算法比較,本文利用未知像素與其較近的前景或背景樣本點的距離來判斷該未知像素是否為完全前景像素或者完全背景像素,并且在最終掩膜值的優(yōu)化過程中把信度值作為約束項,使得最終得到的結(jié)果在細節(jié)方面更加精確,而且對于前背景顏色較為相近的圖片也能得到較為理想的結(jié)果。

參考文獻

  [1] Chuang Y Y, Curless B, Salesin D H, et al. A bayesian approach to digital matting[C]. Computer Vision and Pattern

  Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. IEEE, 2001, 2(2):

  264-271.

  [2] Ruzon M A, Tomasi C. Alpha estimation in natural images[C]. Computer Vision and Pattern Recognition, 2000: Proceedings of IEEE Conference on. IEEE, 2000: 18-25.

  [3] Hillman P, Hannah J, Renshaw D. Alpha channel estimation in high resolution images and image sequences[C].Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer SocietyConference on. IEEE, 2001, 1(1)::1063-1068.

  [4] Grady L, Schiwietz T, Aharon S, et al. Random walks for interactive alpha-matting[C]. Proceedings of VIIP. 2005,2005: 423-429.

  [5] Levin A, Lischinski D, Weiss Y. A closed-form solution to natural image matting[J]. Pattern Analysis and MachineIntelligence, IEEE Transactions on, 2008, 30(2): 228-242.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉(zhuǎn)載。