一.行人檢測
基于Stixel模型的行人檢測
2012年,比利時研究人員RodrigoBenenson和MarkusMatias在如何快速、有效地進行行人檢測方面,提出了兩種加速方法。一種是如何在單幀圖像上更好地處理尺度信息,另一種是如何利用立體圖像的深度信息來加速。在不降低檢測質量的前提下,可以獲得20倍的加速效果。該方法的檢測速度達到100fps。
該方法利用Stixel模型進行目標檢測。Stixd為柱狀物之類的;特征描述,主要對地平面之上的目標進行建模。對于圖片中的每一列而言,可以估算出底部像素、頂部像素以及目標之間的距離。利用深度信息對目標進行檢測。Stixel模型在立體圖像中能更好地發(fā)揮作用,無須計算所有的深度信息,而只需直接快速地利用立體圖像來計算。借助于Slixel模型,檢測空間縮小了,使實際應用過程中的速度性能變得更好。
2.基于激光雷達與視頻數據融合的行人檢測
就目前技術來說,視覺雖然可以提供豐富的圖像信息,但是室外場景中的光照變化、遮擋、陰影等影響,導致視覺算法在復雜交通環(huán)境中魯棒性較低。由于激光雷達可以獲得移動目標在二維平面內的位置、形狀等狀態(tài)估計,因此可以有效地實現移動目標的狀態(tài)跟蹤。通過融合激光雷達與視頻圖像數據,可以對目標進行較為準確的檢測。利用激光雷達數據抽取出感興趣區(qū)域,再利用視頻圖像識別該目標的屬性,可以有效地實現不同模態(tài)傳感器間的互補,提高檢測性能。采用激光雷達與視頻數據融合的方法檢測車輛周邊環(huán)境中的行人,一般包括3個步驟:(1) 處理激光雷達數據,得到感興趣區(qū)域;(2) 準備圖像數據,進行基于圖像的行人檢測算法的訓練;(3) 利用訓練好的分類器,在感興趣區(qū)域內進行行人檢測。具體來說,首先是對激光雷達數據進行聚類、分類處理,將處于激光有效范圍外的激光點以及可以認為是建筑物、車輛、灌木叢等反射的激光點排除,得到疑似行人反射的激光點。一般將給定激光點所處位置[〇,2.2]m的高度范圍看作感興趣區(qū)域;同時,將聚類、分類過程中屬于同一物體的激光點用一個方框代替。用訓練好的分類器,基于感興趣區(qū)域進行行人檢測?;诩す饫走_數據提供的感興趣區(qū)域進行行人檢測,能夠極大地提高檢測速度,并大大減少誤檢率。
二.車輛檢測
基于視覺的車輛檢測
(1)概述。基于單目視覺的車輛檢測方法可分為基于外觀(Appearance)的方法和基于運動(Motion)的方法。前者直接從單幀圖像中檢測車輛,而后者則使用連續(xù)幀圖像進行檢測。單目圖像缺乏直接的深度測量,大多使用基于外觀的方法。早期的單目視覺車輛檢測使用圖像中的對稱性和邊緣特征來進行檢測。近年來研究人員采用更通用并具魯棒性的特征,如HOG特征、Haar-like特征來對車輛進行檢測。這些特征可被用來直接對圖像中的目標進行分類和檢測。
HOG特征是一種解釋型(descriptive)的圖像特征,可用來確定車輛的姿態(tài)。其主要缺點是計算速度慢。近年來,隨著GPU的使用,HOG特征的計算瓶頸問題已得到解決,而Haar-lilce特征不僅非常適合于檢測水平、垂直、對稱的結構,還通過使用積分圖可使特征提取加快,因而可用CPU進行實時計算。也有人利用SIFT特征來檢測車的尾部,包括有遮擋時的情況。還有研究人員用加速魯棒特征(Speeded-UpRobustFeatures,SURF)和邊緣特征的方法來檢測盲區(qū)中的車輛。在立體視覺方法中,更常使用基于運動的方法,且多視幾何可以測量深度信息。利用立體視覺獲取3D坐標,可以區(qū)分靜態(tài)物體和運動物體。與單目方法依賴外觀特征和機器學習不同,立體方法更依賴于運動特征、跟蹤和濾波。