《電子技術(shù)應用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設計應用 > 跟蹤目標的快速橢圓擬合方法
跟蹤目標的快速橢圓擬合方法
2015年微型機與應用第21期
陶 城,劉軍清,雷邦軍,陳 鵬
(三峽大學 計算機與信息學院,湖北 宜昌 443002)
摘要: 提出一種基于最小外包矩形的快速橢圓擬合方法,該方法利用最小二乘法獲得目標的最小外包矩形框,再求取外包矩形框的內(nèi)切橢圓,該橢圓能有效反映目標的大部分運動信息。本文對該方法進行了目標擬合的有效性和實效性實驗分析。分析表明,本算法得到的擬合橢圓內(nèi)背景像素比例(Background Pixel Raito,BPR)相比于傳統(tǒng)的矩形框和經(jīng)典的Khachiyan橢圓擬合方法有了顯著的下降,且擬合方法無需迭代運算,擬合速度僅次于傳統(tǒng)的矩形框,比經(jīng)典的Khachiyan橢圓擬合方法快3倍。本算法對于實時目標跟蹤應用具有很好的應用價值。
Abstract:
Key words :

  摘  要: 提出一種基于最小外包矩形的快速橢圓擬合方法,該方法利用最小二乘法獲得目標的最小外包矩形框,再求取外包矩形框的內(nèi)切橢圓,該橢圓能有效反映目標的大部分運動信息。本文對該方法進行了目標擬合的有效性和實效性實驗分析。分析表明,本算法得到的擬合橢圓內(nèi)背景像素比例(Background Pixel Raito,BPR)相比于傳統(tǒng)的矩形框和經(jīng)典的Khachiyan橢圓擬合方法有了顯著的下降,且擬合方法無需迭代運算,擬合速度僅次于傳統(tǒng)的矩形框,比經(jīng)典的Khachiyan橢圓擬合方法快3倍。本算法對于實時目標跟蹤應用具有很好的應用價值。

  關鍵詞: 目標跟蹤;橢圓擬合;最小二乘法;Khachiyan算法;矩形擬合框

0 引言

  幾何形狀是一種常見的目標表示方法,如橢圓、矩形等[1-2]。在跟蹤過程中,擬合的幾何框面積越接近真實的運動目標,就越能真實地反應運動目標的各項參數(shù)。因此,目標的擬合率是目標檢測與跟蹤的一個重要指標[3]。特別是在多目標跟蹤應用中,若運動目標的擬合幾何框偏大,可能會導致兩個運動目標的擬合框有一定程度的重合,兩個擬合框之間相互影響,造成獲取的目標特征不夠準確。反之,若擬合幾何框偏小,計算出的目標特征不夠完整,也會影響跟蹤效果[4]。

  在目前的視頻跟蹤算法及應用中,矩形框是一種使用最多的目標表示方法,該方法利用目標四個方向最遠邊界點得到的矩形框來表示跟蹤目標。這種矩形框雖然能夠包含所有的目標信息點,但是往往包含較多的背景信息,因此可能造成遮擋、多目標重疊等問題[5]。針對此問題,國內(nèi)外一些學者開始關注其他幾何形狀目標表示方法。其中,用最小面積的閉包橢圓來表示運動目標的方法受到了最多關注[6]。其原因是橢圓在很多目標表示方面(如人體、小汽車等)有著形狀上的優(yōu)勢,不僅可以用更少的面積表示目標,而且橢圓的方向角度變化還能反映目標的一些行為動作[7]。

  最小體積的閉合橢球模型(Minimum Volume Enclosing Ellipsoids,MVEE)是求解散點的最小閉包球的一種經(jīng)典模型,許多學者提出了相關的求解方法,如Khachiyan算法[8]、KY算法[9],Todd M.J.等人提出了相關的改進方法[10],用于降低算法的復雜度和迭代次數(shù)。

  Chaudhuri.D提出了一種閉合區(qū)域的最小邊界框擬合方法,實現(xiàn)了對閉合區(qū)域的目標擬合最小的邊界矩形框[11]。通過這種方法擬合出的矩形框可認為是目標的最小邊界矩形框,不管從實際圖像還是仿真圖像的處理結(jié)果來看,該方法既精準又高效。

  基于以上分析,本文根據(jù)最小二乘法求得目標的最佳外接矩形框,提出了一種基于外接矩形的橢圓擬合方法,該方法針對連續(xù)的前景目標擬合不需要迭代,速度快,效率高,擬合的橢圓面積與目標本身的面積接近,且橢圓中背景像素也相對較少。因此,該方法可以很好地近似表達視頻中的運動目標,并解決多目標的重合問題,對噪聲點有較好的魯棒性。

1 最小外接矩形模型

001.jpg


  最小外接矩形不同于常見的垂直矩形擬合框,最小外接矩形擬合過程如圖1所示。具體步驟是:提取目標邊界,計算目標中心,計算長短軸,尋找四個方向的最遠邊界點,計算出經(jīng)過最遠點的矩形框。

  1.1 獲取目標的邊界

  Sobel邊緣檢測器是一種常見的邊緣提取工具,Sobel邊緣檢測器是利用特定的數(shù)字掩模圖像進行濾波運算,Sobel邊緣檢測具有提取速度快的特點,本文利用Sobel算子提取目標的邊界信息。

  1.2 計算邊界的中心

  對于二維圖像A,提取目標邊界(xi,yi)(i=1,2…n)的中心坐標,通過以下公式計算得到:

  1.png

  1.3 利用最小二乘法計算長短軸

  根據(jù)1.1,設經(jīng)過目標中心的直線的傾斜角度為0}{W0~`KSYY$6~X~(B8UJ7O.jpg,則該直線的方程為:

  2.png

  目標邊界點(xi,yi)(i=1,2…n)到該直線的距離為:

  3.png

  所有邊界點到直線的距離平方和為:

  4.png

  為了計算傾斜角度0}{W0~`KSYY$6~X~(B8UJ7O.jpg,令距離平方和P最小情況下的0}{W0~`KSYY$6~X~(B8UJ7O.jpg即為所求,此時對方程(4)求偏導數(shù),當FJRD95Y[N{4RE~$TL0MI(IS.png時可以取得最優(yōu)解,有:

  5.png

  先計算出最優(yōu)解下的直線傾斜角度0}{W0~`KSYY$6~X~(B8UJ7O.jpg,將0}{W0~`KSYY$6~X~(B8UJ7O.jpg代入式(2),所得的直線就是經(jīng)過目標A中心的最佳擬合直線,且代表目標A的長軸傾斜方向,而目標的短軸,則是經(jīng)過目標A的中心且垂直于長軸的直線。

  1.4 分別找出上下左右四個方向距離長、短軸的最遠點

  由式(3)、(5),令函數(shù)f(x,y)=0,將目標A的邊界點(xi,yi)(i=1,2…n)分別代入到長軸、短軸直線方程,有:

  RYONUD_T)68FKXQRZ6%70A8.png

  當f(a,b)>0時,該點位于長軸的上方;當f(a,b)<0時,該點位于長軸的下方;當f(a,b)=0時,該點剛好經(jīng)過長軸直線。通過比較f(a,b)的值,可以區(qū)分開長短軸上面、下面的邊界點,并找出f(a,b)的最大值和最小值,對應的點分別是pt(x1,y1),pb(x2,y2),pl(x3,y3),   pr(x4,y4)。

  1.5 計算經(jīng)過最遠點且平行于矩陣軸線的直線方程

  經(jīng)過最上面的點的直線方程可以表示為:

 ?。▂-y1)-tan0}{W0~`KSYY$6~X~(B8UJ7O.jpg(x-x1)=0(6)

  此直線即為目標的上邊界外接矩形框直線,同理可以計算另外三條邊的外界矩形框直線方程:

  (y-y2)-tan0}{W0~`KSYY$6~X~(B8UJ7O.jpg(x-x2)=0(7)

 ?。▂-y3)+cot0}{W0~`KSYY$6~X~(B8UJ7O.jpg(x-x3)=0(8)

 ?。▂-y4)+cot0}{W0~`KSYY$6~X~(B8UJ7O.jpg(x-x4)=0(9)

  1.6 計算直線交點,所得的矩形框即為最佳外接矩形

  通過聯(lián)立兩條直線的方程,可以求出外接矩形框的頂點,聯(lián)立式(6)、(8),可以求得矩形的左上交點坐標:

  )5`MR_`$V3SHJKNXTV4)Y45.jpg

  連接外接矩形四個頂點,即可得到目標的最佳外接矩形。

  1.7 最小外接橢圓

  求取最佳外接矩形時,可以求取目標的外接矩形的最大內(nèi)切橢圓,該橢圓圓心即為外接矩形中心,長軸剛好等于外接矩形的長,短軸則等于外接矩形的寬,引入坐標旋轉(zhuǎn)公式:

  G)OB0QPEX$KH$%PFGCHO4S8.jpg

  則矩形的內(nèi)切橢圓即可通過參數(shù)方程表示為:

  VA_~U]J(O2PJ)EJUDR_~SGX.png

  其中,a為橢圓的長軸,b為橢圓的短軸,J46OF6@5U48CUH%R1K9ASP7.jpg為橢圓長軸的傾斜角度。

2 實驗結(jié)果及分析

  本實驗運行平臺:Intel酷睿(i5 3470)四核處理器、8 GB內(nèi)存的個人PC,計算仿真環(huán)境是MATLAB 2011a。在實驗中,通過模擬多目標及實際視頻序列兩種輸入分別比較了傳統(tǒng)的矩形擬合框、質(zhì)心法、VMEE模型中的Khachiyan算法與本文算法的擬合結(jié)果,選取橢圓大小及背景像素比例作為參考指標,分別計算了四種方法的執(zhí)行效率。

002.jpg

  圖2(a)是一幅模擬二值圖像,圖像中包含了部分常見的幾何形狀,分別統(tǒng)計各個目標的像素個數(shù),并計算擬合時間以及背景像素比例。

  從圖2中可以看出,(d)圖中只有很少的點在橢圓外部,而橢圓內(nèi)部的背景成分相比圖(b)減少了很多。以目標3為例,通過計算可知,目標3的實際面積為  7 323個像素點,圖2(b)中目標3橢圓的面積為9 583個像素點,背景像素的比例為0.26,擬合時間為2.25 s;圖2(c)中橢圓的面積為10 261,背景的比例為0.32,擬合時間為0.33 s,圖2(d)中橢圓面積為8 913,背景比例則降為0.19,擬合時間為0.07 s。

  對視頻序列進行目標擬合時,首先采用高斯混合模型對監(jiān)控視頻做前景檢測,檢測出運動目標后,對運動目標的擬合方法進行了對比分析:(1)傳統(tǒng)矩形框擬合方法;(2)Khachiyan目標擬合方法;(3)基于質(zhì)心的快速橢圓擬合方法;(4)本文算法。如圖3所示。

004.jpg

  圖3是選取停車場監(jiān)控畫面的某一幀,對已經(jīng)檢測出的運動目標運用以上算法分別進行擬合運算。畫面運動目標有兩個,由于兩個運動目標的距離較近,圖3(a)中的矩形框幾乎要重疊,且包含了大量的背景像素;圖3(b)中的兩個橢圓已經(jīng)相交,多個運動目標的擬合框若相互交疊,在跟蹤過程中,兩個框內(nèi)的特征會相互影響,導致跟蹤時不能很好地區(qū)分當前像素屬于哪一個目標;而圖3(c)橢圓主軸方向與目標主軸方向不一致,而且兩個擬合橢圓也已經(jīng)相切,并沒有有效地把兩個目標區(qū)分開來;圖3(d)中,目標信息全部包含在橢圓之內(nèi),而且擬合橢圓相互獨立,能夠更有效地還原真實目標運動情況。

003.jpg

  表1給出了圖3中運動目標的面積、各個擬合框的面積、運算時間以及本文算法中橢圓內(nèi)特征點的比例。由于運動目標是不規(guī)則的,因此把運動目標的像素點數(shù)作為它的面積。其中,s0為運動目標的面積;s為擬合框的面積;r為框內(nèi)運動目標點的個數(shù)占總像素數(shù)的比例;t為程序運行時間。

  從表1中可以看出,在停車場的監(jiān)控畫面中,無論從面積還是時間的角度考慮,傳統(tǒng)矩形擬合方法都要優(yōu)于Khachiyan算法,但是,這兩種擬合框的面積也都遠大于運動目標的面積。質(zhì)心法雖然能獲得最小的擬合橢圓,但是,其擬合率較低,損失了一部分重要信息。因此,本文提出的跟蹤目標表示法在擬合框面積、運行時間以及框內(nèi)目標點的比例三方面做到了較好的折中,擬合時間僅次于傳統(tǒng)矩形擬合框,橢圓傾斜方向與目標方向一致,該方法還能解決多個運動目標因距離太近造成邊界框交疊的問題。

3 結(jié)論

  本文提出了一種基于最小外包矩形的快速橢圓擬合方法,該方法可以用于視頻跟蹤中運動目標的擬合。本算法利用最小二乘法求取運動目標的長、短軸及傾斜方向,并求取目標的最小外包矩形,截取矩形的內(nèi)切橢圓即為目標的擬合橢圓。這種橢圓表示方法應用簡單,不需要迭代,橢圓面積接近運動目標的實際面積,減少了擬合框中背景像素點的比例,能夠避免多個運動目標在距離較近時發(fā)生的重疊問題?;谧钚⊥獍匦蔚目焖贆E圓擬合方法能夠快速擬合存在于二維圖像里的運動目標,在以后的研究中,還可以探索在3D空間的目標擬合,以及存在于3D空間的散點集的擬合橢球模型。三維空間的目標擬合在三維重建領域具有十分積極的研究意義。

  參考文獻

  [1] FIEGUTH P, TERZOPOULOS D. Color-based tracking of heads and other mobile objects at video frame rates[C]. In  IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 1997:21-27.

  [2] COMANICIU D, RAMESH V, MEER P. Kernel-based object tracking[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003,25(4):564-575.

  [3] YILMAZ A, JAVED O, SHAH M. Object tracking: a survey[J]. ACM Computing Surveys, 2006,38(4):13-18.

  [4] GLINEUR F. Pattern separation via ellipsoids and conic programming[M]. Belgium: Msthesis, Faculte Polythechnique de Mons, 1998.

  [5] OLIVIER BARNICH, MARC VAN DROOGENBROECK. ViBe: a universal background substraction algorithm for video sequences[C], IEEE Transaction on Image Processing, 2011:1709-1724.

  [6] ZIVKOVIC Z, KROSE B. An EM-like algorithm for color-histogram-based object tracking[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2004:798-803.

  [7] JEPSON A, FLEET D,  ELMARAGHI T. Robust online appearance models for visual tracking[C]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2003, 25(10): 1296-1311.

  [8] KHACHIYAN L G. Rounding of polytopes in the real number model of computation[C], Mathematics of Operations Research, 1996:307-320,

  [9] KUMAR P, YILDIRIM, E A. Minimum volume enclosing ellipsoids and core sets[J]. Optimization Theory and Application, 2005,126(1):1-21.

  [10] TODD M J, YILDIRIM E A. On Khachiyan′s algorithm for the computation of minimum volume enclosing ellipsoids[J]. Discrete Application, 2007,155(13):1731-1744.

  [11] CHAUDHURI, D, SAMAL, A. A simple method for fitting of bounding rectangle to closed regions[C]. Pattern Recognit, 2007:1981-1989.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。