摘 要: 為了剔除籃球視頻圖像的觀眾席區(qū)域,保留感興趣的比賽場(chǎng)地區(qū)域,提出了一種自適應(yīng)籃球視頻圖像分割方法。首先采用雙峰法對(duì)源圖像進(jìn)行二值化;再利用分塊像素點(diǎn)密度統(tǒng)計(jì)原理設(shè)計(jì)了自適應(yīng)分割算法,對(duì)源圖像進(jìn)行自適應(yīng)分割。實(shí)驗(yàn)結(jié)果表明,該方法達(dá)到了很好的分割效果。
關(guān)鍵詞: 自適應(yīng)籃球視頻圖像分割;二值化;二值圖;分塊像素點(diǎn)密度統(tǒng)計(jì)
隨著籃球娛樂(lè)事業(yè)的蓬勃發(fā)展,研究籃球視頻圖像的人也越來(lái)越多,而從籃球視頻中獲取到幀圖像之后,首先要做的工作就是對(duì)源圖像進(jìn)行必要的分割。這是因?yàn)?,通常籃球視頻圖像上都有很大一部分的觀眾席,而研究者的感興趣區(qū)域只是比賽場(chǎng)地部分,所以有必要最大限度地將這兩部分切割開來(lái)。對(duì)籃球視頻進(jìn)行分割有兩個(gè)作用:一是大大減少了后續(xù)研究的工作量;二是消除了這部分?jǐn)?shù)據(jù)對(duì)后續(xù)研究的干擾,有利于后續(xù)的圖像分析[1],從而使得籃球賽事視頻的鏡頭分割工作進(jìn)展更加順利。
圖像分割[2]是指把圖像分成互不重疊的區(qū)域,并提取出感興趣目標(biāo)的技術(shù)。它是提取圖像特征之前非常重要的一部分工作,圖像分割的好壞直接影響到圖像的分析結(jié)果。而關(guān)于圖像分割技術(shù)的研究也有著比較悠久的歷史,目前積累了很多經(jīng)典的圖像分割算法,其中有些分割運(yùn)算可以直接應(yīng)用于許多圖像,而另一些分割運(yùn)算只能用于分割特殊類別的圖像。分割圖像時(shí),通常可以根據(jù)圖像的兩種特性進(jìn)行分割,一種是根據(jù)各個(gè)像素點(diǎn)的灰度不連續(xù)性進(jìn)行分割,另一種是根據(jù)同一區(qū)域具有相似的灰度進(jìn)行分割[3]。這兩種方法都有各自的優(yōu)缺點(diǎn),常見的分割算法有閾值分割[4]、邊緣檢測(cè)[5]、邊緣跟蹤[6]、區(qū)域分裂與合并[7]等。除了依照?qǐng)D像自身特點(diǎn)進(jìn)行分割之外,還可以借助于其他學(xué)科的方法來(lái)完成分割,例如基于數(shù)學(xué)形態(tài)學(xué)的圖像分割[8]、基于統(tǒng)計(jì)模式識(shí)別的分割[9]、基于神經(jīng)網(wǎng)絡(luò)的分割[10]、基于信息論的分割[11]等。但是需要指出的是,目前還沒有一種或者幾種完善的分割算法可以按照人們的意愿去準(zhǔn)確分割任何一種圖像。
鑒于已有各種方法都不能很好地對(duì)籃球視頻圖像進(jìn)行分割,本文在研究前人工作成果的基礎(chǔ)之上,提出了一種自適應(yīng)籃球視頻圖像分割算法。首先采用雙峰法對(duì)源圖像進(jìn)行二值化;再利用分塊像素點(diǎn)密度統(tǒng)計(jì)原理設(shè)計(jì)了自適應(yīng)分割算法,對(duì)源圖像進(jìn)行自適應(yīng)分割。實(shí)驗(yàn)表明,該方法具有良好的分割效果。
1 雙峰法圖像二值化
圖像的二值化方法很多,對(duì)于不同類型的圖像,二值化后的效果各異。針對(duì)籃球視頻的特點(diǎn),經(jīng)大量實(shí)驗(yàn)發(fā)現(xiàn),籃球視頻圖像的一維灰度直方圖有很明顯的雙峰結(jié)構(gòu),所以從視頻中獲取源圖像之后,采用雙峰法[12]對(duì)其進(jìn)行二值化效果更佳,其過(guò)程如下。
?。?)圖像灰度化
從視頻中獲取的源圖像是彩色圖像,如圖1所示,首先要得到其相應(yīng)的灰度圖像,如圖2所示。
?。?)計(jì)算一維灰度直方圖
計(jì)算圖2的一維灰度直方圖,如圖3所示。圖3有很明顯的雙峰結(jié)構(gòu),也就是像素點(diǎn)灰度值對(duì)應(yīng)的比較多的兩個(gè)區(qū)域,所以更適合于采用雙峰法進(jìn)行圖像二值化。
?。?)平滑一維灰度直方圖
計(jì)算得到的原始一維灰度直方圖里,各像素值對(duì)應(yīng)的像素點(diǎn)個(gè)數(shù)參差不齊,不能用于檢測(cè)雙峰之間的谷底,所以要對(duì)原始直方圖數(shù)據(jù)進(jìn)行半徑為1(窗口大小為3)的平滑[13],最終的平滑結(jié)果如圖4所示。此時(shí)可以求出雙峰之間的谷底,從而得到其對(duì)應(yīng)的像素值作為閾值。
?。?)檢測(cè)雙峰之間的谷底
這一步是一個(gè)迭代的過(guò)程,每次處理前需要對(duì)直方圖數(shù)據(jù)進(jìn)行判斷,看其是否已經(jīng)是一個(gè)雙峰的直方圖,如果不是,則對(duì)直方圖數(shù)據(jù)進(jìn)行平滑。若迭代了一定的次數(shù)后仍未獲得一個(gè)雙峰的直方圖,則迭代失敗;如果成功獲得,則取雙峰之間的谷底點(diǎn)對(duì)應(yīng)的像素值作為閾值。
(5)二值化
掃描圖2中的像素點(diǎn),將其每點(diǎn)的灰度值和閾值作比較,大于閾值的重新賦值為255,小于閾值的重新賦值為0,即:I(i,j)=255,I(i,j)>閾值0 ,I(i,j)<閾值,其中I(i,j)表示圖2中點(diǎn)(i,j)的灰度值。遍歷完圖2就達(dá)到了二值化[14]的目的,實(shí)驗(yàn)結(jié)果如圖5所示。
本文使用大津法[15]和雙峰法分別對(duì)籃球視頻圖像進(jìn)行二值化對(duì)比實(shí)驗(yàn),結(jié)果如圖5和圖6所示。雖然整體上沒有明顯區(qū)別,但局部點(diǎn)集還是有明顯區(qū)別的,如圖6的黑色區(qū)域里常常摻有白色的小花塊或者花點(diǎn),但是圖5就在這方面有了很大的改進(jìn),原來(lái)的白色小花塊變得更小或者沒有了,而原來(lái)的白色花點(diǎn)幾乎都沒有了。圖5、圖6兩者之間的差值如圖7所示。實(shí)現(xiàn)表明,雙峰法二值化取得了更好的效果。
2 基于分塊像素點(diǎn)密度統(tǒng)計(jì)的自適應(yīng)分割
通過(guò)雙峰法獲取到源圖像的二值圖后,實(shí)驗(yàn)表明已有方法都不能很好地完成籃球視頻圖像的分割操作,所以本文提出了一種基于分塊像素點(diǎn)密度統(tǒng)計(jì)的自適應(yīng)分割算法,其過(guò)程如下。
(1)分塊
對(duì)二值圖進(jìn)行h×w的分塊操作[16],其中h表示分塊的行數(shù),w表示分塊的列數(shù),但是要保證h、w能分別被圖像的高度和寬度整除。
(2)計(jì)算子塊像素點(diǎn)密度
分塊完成后,原二值圖就被分割成若干個(gè)子塊,再分別統(tǒng)計(jì)每個(gè)子塊區(qū)域內(nèi)灰度值為0的像素點(diǎn)個(gè)數(shù)n0,并計(jì)算其點(diǎn)密度ρ=■,其中N總是子塊區(qū)域內(nèi)的像素點(diǎn)個(gè)數(shù)。
?。?)子塊灰度化處理
計(jì)算得到每個(gè)子塊的點(diǎn)密度ρ之后,將其與給定的點(diǎn)密度閾值ρ0作比較,若ρ≥ρ0,則將相應(yīng)的子塊區(qū)域內(nèi)所有像素點(diǎn)的灰度值都重新賦為一個(gè)適中的灰度值value;若ρ<ρ0,則不作任何處理。即:H(i,j)=value,ρ≥ρ0原值,ρ<ρ0,其中H(i,j)為相應(yīng)的子塊區(qū)域內(nèi)像素點(diǎn)(i,j)的灰度值。每行子塊處理完之后,統(tǒng)計(jì)該行被灰度化處理了的子塊個(gè)數(shù)N子塊,如果N子塊不小于灰度化子塊個(gè)數(shù)閾值N閾值,則繼續(xù)處理下一行子塊,否則回滾最后一行的灰度化操作,返回該行子塊的高度下邊界作為圖像分割線。實(shí)驗(yàn)結(jié)果如圖8所示,可以看出比較精確地定位到了分割線的位置,區(qū)分了觀眾席區(qū)域和后續(xù)研究的感興趣區(qū)域。
圖9是對(duì)圖2的一個(gè)全局灰度化處理,凡是二值圖上點(diǎn)密度大于閾值的子塊都被灰度化處理了。從圖9可以發(fā)現(xiàn),感興趣區(qū)域被灰度化處理的子塊個(gè)數(shù)較少,而觀眾席區(qū)域的子塊基本都被灰度化處理了,所以可以通過(guò)統(tǒng)計(jì)每行被灰度化處理的子塊個(gè)數(shù)來(lái)定位分割線的位置,實(shí)驗(yàn)結(jié)果也表明這是一種很簡(jiǎn)便有效的方法。
?。?)切割源圖像
前面3步已經(jīng)精確定位到了分割線的位置,根據(jù)這個(gè)位置信息對(duì)源圖像進(jìn)行相應(yīng)的切割操作,實(shí)驗(yàn)結(jié)果如圖10所示。很明顯,切割的效果還是很令人滿意的,最大限度地剪去了觀眾席區(qū)域,保留了感興趣區(qū)域。
3 實(shí)驗(yàn)結(jié)果分析
基于以上算法,本文以Microsoft Visual Studio 2010與OpenCV 2.3為實(shí)驗(yàn)平臺(tái),以2013年NBA總決賽“熱火vs馬刺”第7場(chǎng)第1節(jié)錄像和2013年CBA總決賽“山東vs廣東”第4場(chǎng)第1節(jié)錄像作為實(shí)驗(yàn)素材,視頻分辨率為1 280×720,實(shí)驗(yàn)結(jié)果如表1所示。NBA視頻右半場(chǎng)的實(shí)驗(yàn)結(jié)果圖在前文展示出來(lái)了,而第1列是NBA視頻左半場(chǎng)的實(shí)驗(yàn)結(jié)果圖,第2列與第3列分別是CBA視頻左、右半場(chǎng)的實(shí)驗(yàn)結(jié)果圖。
從表1可以很明顯地看出:(1)雙峰法圖像二值化在籃球視頻圖像的處理上比大津法圖像二值化有明顯優(yōu)勢(shì);(2)從分割結(jié)果可以看出,都在理想的分割位置上對(duì)源圖像進(jìn)行了切割,最大限度地剔除了觀眾席,保留了感興趣區(qū)域,說(shuō)明本文提出的自適應(yīng)籃球視頻圖像分割方法確實(shí)簡(jiǎn)便有效,取得了良好的分割效果。
本文在研究前人有關(guān)圖像分割技術(shù)的基礎(chǔ)上,結(jié)合籃球視頻圖像本身的特點(diǎn),提出了一種自適應(yīng)籃球視頻圖像分割算法,實(shí)驗(yàn)表明該方法簡(jiǎn)便實(shí)用,取得了很好的分割效果,從而為后續(xù)籃球視頻鏡頭分割工作做一些鋪墊,讓更多的籃球視頻圖像研究工作者從中受益。雖然實(shí)驗(yàn)結(jié)果表明該方法取得了一定的成功,但同時(shí)也存在一些問(wèn)題有待改進(jìn):(1)該方法在實(shí)現(xiàn)過(guò)程中依賴了4個(gè)閾值:圖像分割的尺寸h與w、點(diǎn)密度閾值ρ0和灰度化子塊個(gè)數(shù)閾值N閾值,閾值的選取對(duì)實(shí)驗(yàn)結(jié)果影響較大;(2)該方法沒有引用到一些經(jīng)典的高深算法,可能略顯工程性太強(qiáng),理論支撐與理論創(chuàng)新不足。
參考文獻(xiàn)
[1] Jiang Xiaoyi. Performance evaluation of image segmentation algorithms. Handbook of Pattern Recognition and Computer Vision(3rd Edition),2005:525-542.
[2] 宋寅卯,劉磊.圖像分割研究方法及進(jìn)展[J].電腦學(xué)習(xí),2010(2):1-3.
[3] 許勇剛.復(fù)雜光照條件下人臉識(shí)別關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2013.
[4] 張冬生.基于閾值的圖像分割算法研究[D].大慶:東北石油大學(xué),2011.
[5] 尹平,王潤(rùn)生.自適應(yīng)多尺度邊緣檢測(cè)[J].軟件學(xué)報(bào),2000,17(7):990-994.
[6] KUO H C, WU L J. An image tracking system for welded seams using fuzzy logic[J]. Journal of Materials Processing Technology, 2002,120(5):169-185.
[7] 程帥.區(qū)域分裂合并法在圖像分割中的應(yīng)用[J].福建電腦,2013(6):105-106.
[8] LEE C K, WONG S P. A mathematical morphological approach for segmenting heavily noise corrupted images[J].Pattern Recognition,1996,29(8):1347-1358.
[9] 崔冰,王衛(wèi)星.基于統(tǒng)計(jì)模式識(shí)別的巖石節(jié)理圖像分割方法[J].計(jì)算機(jī)工程與應(yīng)用,2006(10):213-215.
[10] 馬兆敏,黃玲,胡波,等.基于神經(jīng)網(wǎng)絡(luò)的雜草圖像分割算法[J].計(jì)算機(jī)工程與應(yīng)用,2009(24):216-218.
[11] KIM J, FISHER J W, YEZZI A, et al. A nonparametric statistical method for image segmentation using information theory and curve evolution[C]. IEEE Transactions on Image Processing,2005,14(10):1486-1502.
[12] 楊修國(guó).關(guān)于直方圖雙峰法的研究與改進(jìn)[J].電子設(shè)計(jì)工程,2012(12):176-179.
[13] KO S J, LEE Y H. Center weighted median filters and their applications to image enhancement[C]. IEEE Transac-tions on Circuits and Systems,1991,38(9):984-993.
[14] BERNSEN J. Dynamic thresholding of gray-level images[C]. Proceedings of the 8th International Conference on Pattern Recognition,1986:1251-1255.
[15] 胡斌,宮寧生.一種改進(jìn)的Otsu閾值分割算法[J].微電子學(xué)與計(jì)算機(jī),2009(12):153-155.
[16] 李了了,鄧善熙,丁興號(hào).基于大津法的圖像分塊二值化算法[J].微計(jì)算機(jī)信息,2005,21(8-3):76-77.