摘 要: 針對當前流行的汽車行人避碰系統(tǒng)中行人輪廓檢測效果不夠理想的情況,改進行了人輪廓的檢測。利用數(shù)學形態(tài)學操作方法先對視頻圖像進行處理,然后利用優(yōu)選出的Canny算子對行人圖像進行邊緣檢測,再使用曲線擬合技術(shù)對行人輪廓進行加工,獲取完整的行人輪廓曲線,為行人識別與跟蹤奠定堅實的基礎。試驗結(jié)果表明,該方法能有效地去除行人輪廓的干擾因子和孤島,獲得較為完整的行人輪廓曲線。
關(guān)鍵詞: Canny算子; 閉運算; 曲線擬合; 干擾因子; 行人輪廓檢測
在圖像中可靠地進行行人檢測和識別具有廣泛的應用前景,如智能視頻監(jiān)控、車輛輔助安全駕駛系統(tǒng)和多媒體檢索。同時,行人檢測是物體檢測領(lǐng)域里最具挑戰(zhàn)性的一種,因為行人具有非常大的差異,如服裝顏色和款式的差異、身材的差異、姿態(tài)的差異、光照的差異、視角的差異、陰影的差異、背景的差異、遮擋的差異,另外,行人還有可能拎著各式各樣不同的包,如背包、手提包、皮夾子、購物袋等,這些差異都會給行人邊緣檢測帶來困難。
當前的行人檢測方法有近千種之多,但主要分為二類。第一類算法[1]根據(jù)人體各個組成部分的局部特征分別進行檢測,然后利用一定的投票規(guī)則將各個組成部分的檢測結(jié)果進行合并,輸出最終檢測結(jié)果。Mohan等[2]對人體每個部分進行獨立訓練以獲得多個人體部位檢測算子,然后將這些算子合并成一個二級分類器;或者是在整個人體中選擇一些稀疏特征點作為檢測依據(jù)。由于頭部、軀干、四肢幾個人體主要組成部分形態(tài)相對固定,特征也比較穩(wěn)定,因此該類算法能夠較好地處理遮擋和姿態(tài)變化情況。第二類是基于統(tǒng)計學習的算法,通過特定的特征提取算子,如層級形狀模板[3]、Haar小波變換[4]、矩形特征[5]以及梯度方向直方圖HOG(Histogram of Oriented Gradient)[6]。這些方法雖然都有成功的應用,但普適性比較差。本文采用圖像形態(tài)學處理技術(shù),研究行人邊緣檢測技術(shù),致力于消除行人邊緣檢測的干擾因子,進而提高行人邊緣檢測的健壯性和魯棒性。
1 數(shù)學形態(tài)學
近年來,數(shù)學形態(tài)學處理(Mathematic Morphology)已經(jīng)發(fā)展為數(shù)字圖像處理的一個重要研究領(lǐng)域。數(shù)學形態(tài)學的基本思路是利用具有一定形態(tài)的結(jié)構(gòu)元素去度量和提取圖像中的對應形狀,以達到對圖像進行分析和識別的目的。數(shù)學形態(tài)學是由一組形態(tài)學的代數(shù)運算算子組成的,它的基本運算有擴張、侵蝕、開啟和閉合[7]4個。
灰度圖像形態(tài)學是數(shù)學形態(tài)學的一個重要分支,是二值形態(tài)學對灰度圖像的自然擴展,其運算對象不再是集合,而是圖像函數(shù)。對灰度形態(tài)學而言,二值形態(tài)學中用到的交、并運算分別用最大值和最小值運算代替。設T為輸入圖像,r為結(jié)構(gòu)元素,灰度形態(tài)學擴張、侵蝕、開啟和閉合運算分別定義如下。
與背景、目標與目標、區(qū)域與區(qū)域之間。邊緣檢測是根據(jù)數(shù)字圖像中的突變信息檢測圖像的邊緣。圖像邊緣信息在圖像分析和人的視覺中都是十分重要的,是圖像識別中提取圖像特征的一個重要屬性。邊緣信息便于量化和比較,更適合于檢測和定位圖像中的物體位置,因此邊緣檢測技術(shù)在數(shù)字圖像檢測和識別中有著極其重要的地位。邊緣檢測的實質(zhì)是采用某種算法來提取出圖像中對象與背景間的交界線,其目的就是要突出圖像的邊緣以便提取圖像的特征。
圖像邊緣檢測的功能是根據(jù)數(shù)字圖像中的突變信息檢測圖像中物體的邊緣,識別圖像的形狀,提取圖像的特征,確定數(shù)字圖像中物體的位置。
圖像的邊緣既有方向性又有幅度性。一般來說,沿水平邊緣變化平緩,而垂直邊緣走向的像素變化劇烈,這種變化可能呈現(xiàn)階躍型和屋頂型。這些變化分別對應景物中不同的物理狀態(tài)。例如階躍型變化通常對應目標的深度和反射邊界,而屋頂型變化通常反映表面法線方向的不連續(xù)。如果一個像素落在圖像中某一個物體的邊界上,那么它的鄰域?qū)⒊蔀橐粋€灰度級的變化帶。對這種變化最有用的兩個特征是灰度的變化率和方向,它們分別以梯度向量的幅度和方向來表示。
大部分邊緣檢測算子是在不同尺度上用光滑函數(shù)對信號進行平滑,然后從其一階或二階導數(shù)中檢測出突變點,其一階導數(shù)的極值點對應于二階導數(shù)的零交叉點和平滑信號的拐點,如拉普拉斯(Laplacian) 算子、Canny算子和拉普拉斯高斯(LOG)算子等[8]。本文采用Canny算子對行人邊緣進行檢測研究。
Canny的主要工作是推導最優(yōu)邊緣檢測算子。它考核邊緣檢測算子的指標是:(1)低誤判率,即盡可能少地把非邊緣點誤認為是非邊緣點;(2)高定位精度,即準確地把邊緣點定位在灰度變化最大的像素上;(3)抑制虛假邊界[9]。
Canny算子先用高斯平滑濾波器來平滑圖像以除去噪聲,即用高斯平滑濾波器與圖像作卷積,然后采用一階偏導的有限差分來計算梯度的幅值和方向。 再經(jīng)過一個非極大值抑制的過程,最后采用兩個閾值來連接邊緣。
4 行人檢測建模試驗
本文采用MATLAB作為試驗分析工具。利用MATLAB/Simulink建立如圖2所示的試驗模型。行人檢測分3個步驟進行,首先對圖像進行圖像形態(tài)學的閉合運算,實現(xiàn)圖像的平滑并去除噪聲,然后采用Canny算子進行行人邊緣檢測,最后采用參考文獻[11]所提出的曲線擬合算法對行人輪廓進行處理。
本文采用車載攝像機所采集的大量視頻進行試驗,圖3是其中兩組測試結(jié)果。圖3(b)和圖3(d)是沒有采用形態(tài)學處理方法和曲線擬合的行人檢測結(jié)果,圖3(a)和 圖3(c)是采用了閉合形態(tài)學處理算法的和曲線擬合技術(shù)所獲得的行人檢測結(jié)果。
比較圖3(a)和圖3(b)、圖3(c)和圖3(d)可以發(fā)現(xiàn),圖3(b)圖和圖3(d)中的行人輪廓線存在噪聲和孤島, 而圖3(a)和圖3(c)則不存在噪聲,行人的輪廓曲線明顯平滑了許多。這說明圖像形態(tài)學的閉合運算起到了消除噪聲和孤島的作用。
試驗結(jié)果表明,圖像形態(tài)學算法能有效消除一些干擾噪聲,并去除圖像中的一些孤島,采用曲線擬合技術(shù)能把斷線連接起來,使行人輪廓曲線更為平滑和真實。
同時也發(fā)現(xiàn),由于增加了形態(tài)學處理和曲線擬合環(huán)節(jié),使得計算量大大增加,使系統(tǒng)的實時性受到了一定程度的影響,所以實時性和檢測效果在這里是一對矛盾。這個問題需要進一步研究和解決。
參考文獻
[1] CORVEE E, BREMOND F. Body Parts detection for people tracking using trees of histogram of oriented gradient descriptors [C]. Proceedings of the 7th IEEE International Conference on Advanced Video and Signal Based Surveillance, 2010:469-475.
[2] MOHAN A, PAPAGEORGIOUS C, POGGIO T. Exanoke-based object detection in images by components[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001,23(4):349-361.
[3] GAVRILA D M, PHILOMIN V. Real-time object detection for “smart” vehicles[C].Proceedings of the 7th International Conference on Computer Vision, 1999(1):87-93.
[4] PAPAGEORGIOU C, EVGENIOU T, POGGIO T. A trainable pedestrian detection system[C]. Proceedings of Intelligent Vehicles, 1998:241-246.
[5] VIOLA P, JONES M. Rapid object detection using a boostedcascade of simple features[C]. Proceedings of Conference on Computer Vision and Pattern Recognition, 2001(1):511-518.
[6] DALAL N, TRIGGS B. Histograms of oriented gradients forhuman detection[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2005(1):886-893.
[7] 楊高坡,杜青松. Matlab圖像/視頻處理應用及實例[M].北京:電子工業(yè)出版社, 2010.
[8] 張秀蘭. 基于MATLAB的數(shù)字圖像的邊緣檢測[J].吉林化工學院學報, 2010,27(2):59-61.
[9] 賈永紅.數(shù)字圖像處理[M].武漢:武漢大學出版社,2003.
[10] 張強,王正林.精通MATLAB圖像處理[M]. 北京:電子工業(yè)出版社,2009.
[11] NALWA V S, BINFORD T O. On detecting edges[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986,PAMI-6(11):699-714.