《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于車輛特征的關(guān)鍵幀提取方法研究
基于車輛特征的關(guān)鍵幀提取方法研究
來源:微型機與應(yīng)用2011年第22期
王正玉, 李 勃, 張明輝, 歐玉榮
(昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明650051)
摘要: 對目前存在的幾類提取關(guān)鍵幀的方法進行了分析,并基于車輛自身特征提出一種新的關(guān)鍵幀提取方法。該算法具有良好的通用性和適應(yīng)性,計算簡單,正確率高,有效避免了冗余,并可以控制關(guān)鍵幀的數(shù)量。實驗結(jié)果表明,該算法在提取關(guān)鍵幀方面具有良好的有效性。
Abstract:
Key words :

摘   要: 對目前存在的幾類提取關(guān)鍵幀的方法進行了分析,并基于車輛自身特征提出一種新的關(guān)鍵幀提取方法。該算法具有良好的通用性和適應(yīng)性,計算簡單,正確率高,有效避免了冗余,并可以控制關(guān)鍵幀的數(shù)量。實驗結(jié)果表明,該算法在提取關(guān)鍵幀方面具有良好的有效性。
關(guān)鍵詞: 視頻檢索;車輛特征;關(guān)鍵幀;圓檢測

    隨著網(wǎng)絡(luò)和多媒體技術(shù)的飛速發(fā)展,視頻得到了廣泛應(yīng)用,其數(shù)量迅速增加。為了方便對這些數(shù)據(jù)進行有效的索引和管理,視頻檢索技術(shù)得到廣泛的研究,其中,就需采用有效的鏡頭分割和關(guān)鍵幀技術(shù)。利用關(guān)鍵幀技術(shù)對視頻數(shù)據(jù)庫進行有效的快速查詢、檢索和瀏覽,可以大大減輕工作量。
    關(guān)鍵幀是鏡頭中最重要、最具代表性的圖像幀,它反映了一個鏡頭的主要內(nèi)容。針對關(guān)鍵幀這些特點,關(guān)鍵幀的提取有兩個基本要求[1]:一方面必須反映鏡頭中的主要事件,即描述要盡可能準(zhǔn)確和完整;另一方面要求數(shù)據(jù)量小,即計算不能太復(fù)雜。當(dāng)前一般采用的關(guān)鍵幀選取原則較為保守,即“寧錯勿少”,這樣在保證完整地描述一個鏡頭內(nèi)容的同時造成了大量的冗余。為解決這一問題,本文針對交通監(jiān)控視頻中相關(guān)車輛的檢索,提出一種基于車輛自身特征的關(guān)鍵幀提取方法,此算法有效地避免了冗余。
1 常用的主流關(guān)鍵幀提取方法
    目前的關(guān)鍵幀提取方法依據(jù)是否基于壓縮域可分為非壓縮域和壓縮域方法,依關(guān)鍵幀來源可分為關(guān)鍵幀重組和關(guān)鍵幀提取,其中,關(guān)鍵幀提取是目前主流方法。典型的關(guān)鍵幀提取算法主要分為四類: (1)基于鏡頭邊界提取關(guān)鍵幀[1],該方法將鏡頭的首幀和尾幀作為鏡頭的關(guān)鍵幀,簡單易行,關(guān)鍵幀數(shù)目確定,但是效果不穩(wěn)定。(2)根據(jù)相鄰幀間的距離提取關(guān)鍵幀。若距離大于某個預(yù)先設(shè)定的閾值,則產(chǎn)生一個新關(guān)鍵幀。該方法較為靈活,但只對相鄰幀進行距離計算。容易漏檢,且對于重復(fù)畫面多的鏡頭容易產(chǎn)生冗余。(3)基于運動分析的方法,例如WOLF[2]的光流法,分析計算鏡頭中的運動量,在其局部最小值處選取關(guān)鍵幀,反映了視頻數(shù)據(jù)的靜止,該方法所需計算量較大,時間效率降低,WOLF方法中的局部最小值也不一定準(zhǔn)確。(4)基于聚類法提取關(guān)鍵幀,其基本思想是首先從一個初始化的聚類出發(fā),將樣本集中的每個元素分配給某個聚類,以達到系統(tǒng)或用戶的要求,這種方法效果較好,但是比較復(fù)雜,實現(xiàn)起來有一定的困難,而且計算量較大。
2 改進的針對于車輛檢索的關(guān)鍵幀提取方法
    改進的針對于車輛檢索的關(guān)鍵幀提取方法的主要思想如下。
    (1) 在鏡頭分割完畢的基礎(chǔ)上,選取鏡頭的第一幀、中間幀和最后一幀作為候選關(guān)鍵幀。
    (2) 對選取的關(guān)鍵幀進行簡單的預(yù)處理操作,如圖像平滑等。由于通過CCD攝像頭采集視頻圖像的過程中容易受到攝像頭、視頻采集卡、 天氣、人為干擾、車輛的顛簸抖動等因素的影響,圖像中往往會出現(xiàn)一些不規(guī)則的隨機噪聲。采用適當(dāng)?shù)姆椒ń翟?,可以明顯提高對運動車輛的檢測率和識別率。例如,本文采用中值濾波[3]處理圖像后,可以有效地去除不規(guī)則的噪聲點,如圖1所示。

 

 

    (3) 物體的形狀特征對物體的識別有重要作用[4],本算法采用對校正后的圖像進行圓檢測[5]方式,識別帶有車輛的圖像。
    對于圓檢測,本算法首先想到的是利用圓的幾何性質(zhì):圓周上任意兩條不平行弦的中垂線相交點即為圓心,每次同時選取不在同一條直線上的3個點(x1,y1)、(x2,y2)和 (x3,y3)來確定一個圓,圓心坐標(biāo)可由這3個點的坐標(biāo)獲得。原理如下:
    ①用S代表所截取的待檢測的圖像中的所有邊緣點的集合。從S中隨機選取不在同一條直線上的3個像素點確定一個圓。本文通過減少隨機采樣點數(shù)來解決這個問題??紤]到一個邊緣點的八鄰域像素,如果邊緣點數(shù)目少于3個,認為這個點就是無效采樣點。設(shè)隨機采樣的前兩個點為s1(x1,y1)、s2(x2,y2),且使s1s2≥T,其中T為一個設(shè)定的閾值。s3(x3,y3)則從s1s2中垂線的一端去搜索,這樣做是為了減少待檢測圓的搜索次數(shù)。

   為了減少計算量,考慮到圓必定在其外接正方形之內(nèi),所以不必對外接正方形之外的那些像素進行計算,可以減少大量的計算時間。取邊緣厚度為一個較小數(shù)t,對于邊緣點s中的點si(xi,yi),若滿足xi>a1+r+t、xi<a1-r-t、yi>a2+r+t或yi<a2-r-t中任意一個,則不必計算該點到圓心的距離di,而是繼續(xù)對下一個邊緣點進行計算判定。假設(shè)初始化計數(shù)器為M,集合中最少點數(shù)為m,S中的點數(shù)為n,真實圓的閾值為Mmin,邊緣厚度為t。檢測到的真實圓的個數(shù)為j,并初始j=0。該算法的具體描述如圖2所示,實現(xiàn)的結(jié)果如圖3所示。

    (4) 對于符合圓檢測的圖像留作關(guān)鍵幀,其余不符合圓檢測的關(guān)鍵幀刪除。
3 實驗結(jié)果與分析
    為了檢測本算法的效果,分別設(shè)計了4組測試實驗,每組所涉及的含有車輛關(guān)鍵幀與不含有車輛關(guān)鍵幀數(shù)量各不相同,呈遞增狀。其中,每組實驗中所用的含有車輛關(guān)鍵幀里,盡量選用具有不同車型車輛的關(guān)鍵幀作為測試用例,以達到涵蓋各種情況的目的。實驗結(jié)果如表1所示。

    實驗結(jié)果表明,將本算法應(yīng)用在交通視頻中有關(guān)車輛的關(guān)鍵幀提取方面錯誤率低、冗余度小且遺漏程度很低。本算法針對車輛自身特征對帶有車輛幀的提取達到了令人較滿意的效果。本算法中還可以靈活地加入車輛的其他特征(如車牌等),以取得更好的效果。
    為了解決交通視頻中有關(guān)車輛的關(guān)鍵幀提取問題,本文提出了一種基于車輛自身特征的關(guān)鍵幀提取方法,即基于圓檢測的車輛關(guān)鍵幀提取法。實驗結(jié)果表明該方法切實可行。由于實驗中選用的車輛圖片以正側(cè)面為主,與現(xiàn)實中任意方位角的車輛相比,還只是較特殊的一類,若要實現(xiàn)任意方位角的車輛幀提取,還要添加一些其他車輛特征,或者實現(xiàn)對圖片中車輛傾斜角的矯正等,以達到顯示圖中車輛正側(cè)面的效果。要使此算法具有普遍性,還需要繼續(xù)深入研究。
參考文獻
[1] 季春. 視頻檢索中關(guān)鍵幀抽取方法的研究[D]. 南京: 南京理工大學(xué),2005.
[2] WOLF W. Key frame selection by motion analysis[C].IEEE  Proceedings of International Confenence Acoust,Speech,and Sigal Proc,1996.
[3] 王耀南,李樹濤,毛建旭,等. 計算機圖像處理與識別技術(shù)[M].北京:高等教育出版社,2003.
[4] 王立國.支持向量機多類目標(biāo)分類器的結(jié)構(gòu)簡化研究[J].中國圖象圖形學(xué)報,2005,10(5):571-
574.
[5] XU L,OJA E, KULTANEN P. A new curve detection method:randomized Hough transform(RHT)[J]. Pattem Recognition Letters,1990,II(5):33l-338.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。