摘 要: 提出了一種利用雙閾值自適應(yīng)變化逼近視頻鏡頭分割最佳閾值的算法,在雙閾值各區(qū)間漏檢或誤檢的判別通過(guò)相似度差異來(lái)完成。實(shí)驗(yàn)結(jié)果表明,該算法能夠得到較為理想的錯(cuò)檢率,并能得到比固定閾值算法更低的漏檢率。
關(guān)鍵詞: 足球視頻; OpenCV; 自適應(yīng)雙閾值; 鏡頭邊界檢測(cè)
鏡頭邊界檢測(cè)與分割是進(jìn)行基于內(nèi)容的足球視頻查詢(xún)、檢索與精彩度分析的重要環(huán)節(jié),其目的是將輸入的視頻流分割成基本視頻單元的集合,最終提取出關(guān)鍵幀和運(yùn)動(dòng)信息。相比于模板匹配、邊緣輪廓特征和聚類(lèi)算法[1-2],基于直方圖比較的算法[3]效率較高,應(yīng)用普遍。但利用直方圖進(jìn)行視頻分割的效果與直方圖相似度算法的選取、門(mén)限值的設(shè)置有很大關(guān)系。
Bhattacharyya距離完全匹配是0,完全不匹配是1,為了進(jìn)行比較,圖1中的B相似度定義為1-Bhattacharyya距離。從圖1可以看出:(1)隨著閾值的提高,鏡頭檢測(cè)的誤檢數(shù)增多;隨著閾值的降低,鏡頭檢測(cè)的漏檢數(shù)增多。雖然選取一個(gè)適當(dāng)?shù)拈撝的苁圭R頭檢測(cè)的誤檢數(shù)與漏檢數(shù)之和達(dá)到最低點(diǎn),但對(duì)于固定閾值的檢測(cè)算法,很難得到誤檢數(shù)與漏檢數(shù)都很低的結(jié)果;(2)在采用固定閾值檢測(cè)時(shí),不同的直方圖相似度檢測(cè)算法閾值選取的最佳點(diǎn)也不同。因此,為了同時(shí)獲得較低的誤檢率與漏檢率[4],在鏡頭檢測(cè)與分割過(guò)程中自適應(yīng)改變閾值具有非常重要的意義[5-7]。本文提出了利用雙閾值自適應(yīng)變化來(lái)動(dòng)態(tài)跟蹤最佳閾值的鏡頭檢測(cè)與分割算法,對(duì)于降低漏檢取得了較好的檢測(cè)效果。
2 基于雙閾值的視頻分割算法
2.1 基于直方圖鏡頭檢測(cè)與分割的足球視頻的特點(diǎn)
利用直方圖進(jìn)行足球視頻鏡頭檢測(cè)與分割,可能造成過(guò)高的誤檢率,這主要有以下幾方面原因:(1)足球視頻近景鏡頭中人物離鏡頭過(guò)近,人物的運(yùn)動(dòng)造成視頻幀直方圖突變而形成誤檢;(2)中遠(yuǎn)景中,為了跟蹤比賽節(jié)奏,鏡頭運(yùn)動(dòng)速度過(guò)快,造成視頻幀直方圖突變而形成誤檢;(3)視頻中大量回放鏡頭的開(kāi)始與結(jié)束是以漸變而不是切變發(fā)生的,在漸變的過(guò)程中如果檢測(cè)閾值較低,就會(huì)造成單幀鏡頭分割的現(xiàn)象。另外,由于足球視頻一般是在某一個(gè)時(shí)間段內(nèi)(比如下午)連續(xù)錄制的,亮度和飽和度的影響可以忽略,直方圖距離的計(jì)算應(yīng)以色度直方圖為主,但在球場(chǎng)局部區(qū)域形成大面積陰影時(shí),要適當(dāng)提高亮度直方圖相似度的影響因子。
2.2 基于雙閾值的分割算法
基于雙閾值的分割算法的基本思想是:設(shè)置一個(gè)較大的閾值Tb和一個(gè)較小的閾值Ts,當(dāng)直方圖的相似度小于Ts時(shí),分割鏡頭出現(xiàn);當(dāng)相似度大于Tb時(shí),沒(méi)有分割鏡頭出現(xiàn);當(dāng)相似度介于Tb與Ts之間時(shí),表明閾值設(shè)置不合理,若是漏檢,則應(yīng)降低Tb,若是誤檢,則應(yīng)加大Ts。算法的關(guān)鍵是判斷漏檢還是誤檢以及動(dòng)態(tài)調(diào)整閾值的策略。為了消除上述原因形成的誤檢鏡頭,分割算法引入了鏡頭長(zhǎng)度(shotlength,即鏡頭內(nèi)幀數(shù))sl,當(dāng)檢測(cè)到鏡頭變換時(shí),首先判斷sl是否小于某一臨界值,如果小于則認(rèn)為是誤檢,不進(jìn)行鏡頭分割。具體的算法步驟如圖2所示。
閾值常量TU與TD的設(shè)置應(yīng)滿(mǎn)足如下條件:當(dāng)stt>TU時(shí),不應(yīng)發(fā)生誤檢;當(dāng)stt<TD時(shí),不應(yīng)發(fā)生漏檢。因此,應(yīng)設(shè)置極大的TU與極小的TD。當(dāng)stt>(Tb+Ts)/2 時(shí),說(shuō)明Ts不合理,應(yīng)提高Ts,從圖2可以看出,stt越大,Ts提高得越快;當(dāng)stt<(Tb+Ts)/2時(shí),說(shuō)明Tb不合理,應(yīng)降低Tb,從圖2可以看出,stt越小,Tb下降得越快。當(dāng)stt在[TU,Tb]、[Tb,Ts]和[Ts,TD]各區(qū)間時(shí),算法通過(guò)前后兩個(gè)相似度差值的絕對(duì)值來(lái)判斷是否發(fā)生漏檢或誤檢,當(dāng)漏檢發(fā)生時(shí),適當(dāng)提高Tb,當(dāng)誤檢發(fā)生時(shí),適當(dāng)降低Ts;sl的最小值選取50,即當(dāng)幀頻為25幀/s時(shí),忽略時(shí)長(zhǎng)小于2 s的鏡頭。
3 實(shí)驗(yàn)結(jié)果與分析
本文在Visual C++開(kāi)發(fā)平臺(tái)上利用OpenCV視覺(jué)庫(kù)實(shí)現(xiàn)了上述算法。選取2010南非世界杯足球比賽的兩個(gè)視頻片斷進(jìn)行分析,實(shí)驗(yàn)視頻中包括近景、中景、遠(yuǎn)景以及切變與漸變等鏡頭變換。鏡頭中,人、球和攝像機(jī)自身運(yùn)動(dòng)較大。首先將視頻從RGB空間轉(zhuǎn)換到HSV空間,再對(duì)H通道的直方圖單獨(dú)進(jìn)行分析,直方圖相似度采用相交算法和B算法。閾值常量TU、TD分別取1和0。實(shí)驗(yàn)結(jié)果如表1、表2所示。
從表1和表2的檢測(cè)結(jié)果可以看出,采用雙閾值的檢測(cè)方法對(duì)B算法和相交算法均適用,檢測(cè)的誤檢數(shù)與漏檢數(shù)之和均小于(視頻片段1)或逼近(視頻片段2)采用固定閾值的檢測(cè)方案得出的最佳結(jié)果。比較可知,采用雙閾值檢測(cè)能夠得到較少的漏檢數(shù)。由于視頻2片段在開(kāi)始時(shí)并沒(méi)有太大的相似度波動(dòng),閾值收斂速度降低,在開(kāi)始時(shí)易造成誤檢和漏檢,因此采用雙閾值B算法得到的誤檢數(shù)與漏檢數(shù)之和略高于固定閾值方案。采用固定閾值B檢測(cè)算法在閾值為0.9時(shí)檢測(cè)的漏檢偏高,主要是因?yàn)殓R頭長(zhǎng)度略大于50的誤檢太多,導(dǎo)致后續(xù)視頻漏檢的產(chǎn)生。該雙閾值檢測(cè)算法可用于在檢測(cè)算法的最佳閾值未知的情況下,要求盡量降低漏檢時(shí)的情況。各種算法所需的時(shí)間如表3所示。
表3的數(shù)據(jù)是在各算法運(yùn)行在相同的系統(tǒng)環(huán)境下得到的,計(jì)算所需時(shí)間時(shí)不考慮分割后的單鏡頭視頻的存儲(chǔ)時(shí)間,只考慮分割算法的計(jì)算時(shí)間。從表3可看出,各個(gè)算法所需的計(jì)算時(shí)間大體相當(dāng)。這主要是由于雙閾值算法只是引入了一些簡(jiǎn)單的比較和算術(shù)運(yùn)算,并沒(méi)有增加算法的復(fù)雜度,算法計(jì)算簡(jiǎn)單。
本文提出了利用雙閾值自適應(yīng)變化動(dòng)態(tài)跟蹤視頻分割中最佳閾值的方法。從實(shí)驗(yàn)結(jié)果可以看出,本算法能夠得到較低的檢測(cè)誤差,同固定閾值相比,算法的漏檢數(shù)少。但算法在判斷漏檢和誤檢時(shí),根據(jù)相似度差值分別采用了固定的參數(shù)0.08、0.12和0.2,針對(duì)足球視頻的特點(diǎn)自適應(yīng)改變上述參數(shù),對(duì)于算法結(jié)果有很大改善。因此,下一步的工作是對(duì)上述參數(shù)的設(shè)置展開(kāi)研究。
參考文獻(xiàn)
[1] Zhu Ce, Lin Xiao, Chau L P. Hexagon-based search pattern for fast block motion estimation[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2002, 12(5): 349-355.
[2] CHENG W G, XU D, JIANG Y W, et al. Information theoreticmetrics in shot boundary detection[C]. Proeedings of IIH-MSP, LNCS 3683, Melbourne, Australia, Sept. 2005. 388-394.
[3] RINSKA I K, CARRATO S. Temporal video segmentation: a survey[J]. Signal Processing: Image Communication, 2001, 16(5): 477-500.
[4] Jiang Xinghao, Sun Tanfeng, Fang Zhixin, et al. A video shot boundary detection method based on variable-size window [J]. Journal of Shanghai Jiaotong University, 2009, 43(11):1681-1684.
[5] QI Y, HAUPTMANN A, LIU T. Supervised classification for video shot segmentation[C]. Proceedings of the International Conference on Multimedia and EXPO, Washington: IEEE Computer Society, 2003.
[6] MATSUMOTO K, NAITO M, HOASHI K, et al. SVM-based boundary detection with a novel feature[C]. Proceedings of the International Conference on Multimedia and EXPO. Washington: IEEE Computer Society,2006.
[7] Cao Jiaorong, Cai Anni. Algorithm for shot boundary detection based on support vector machine in compressed domain [J]. Acta Electronica Sinica, 2008, 36(1):203-208.