孫瑩瑩1,宋寅卯1,王蓬2
(1.鄭州輕工業(yè)學院 建筑環(huán)境工程學院,河南 鄭州 450002;2. 鄭州輕工業(yè)學院 電氣信息工程學院,河南 鄭州450002)
摘要:機器視覺技術(shù)由于其非破壞性、精度高、速度快等特點,在現(xiàn)在科技發(fā)展中已經(jīng)被廣泛地研究和應(yīng)用,更多地被用到視頻監(jiān)控中。文章對機器視覺人數(shù)識別近幾年的發(fā)展做了詳細的論述,主要從個體識別法和群體識別法兩大方面進行分析,具體可分為四方面:特征識別法、形狀識別法、模型學習識別法和人群密度識別法。根據(jù)各種不同識別算法思想的研究,對當前研究方向上亟待解決的問題做出了分析,并對未來人數(shù)識別的研究做出展望。
關(guān)鍵詞:機器視覺;人數(shù)識別;人群密度;人員跟蹤;人員檢測
中圖分類號:TP391文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.07.003
引用格式:孫瑩瑩,宋寅卯,王蓬.基于機器視覺的人數(shù)識別研究綜述[J].微型機與應(yīng)用,2017,36(7):9-11,18.
0引言
機器視覺是用計算機模擬人的視覺功能,從客觀事物的圖像中提取信息,進行處理并加以理解,最終用于實際檢測、測量和控制[1]。目前,機器視覺技術(shù)向著智能化、目的化方向發(fā)展。
人數(shù)識別涉及數(shù)字視頻處理、模式識別、計算機視覺以及人工智能多個領(lǐng)域,是一個跨學科、跨領(lǐng)域的前沿課題,也是當今智能視覺系統(tǒng)研究中一個十分活躍的新領(lǐng)域。國際上的高級視頻和錄像(Advanced Video and SignalBased Surveillance)論壇每年都會舉辦PETS的會議專門針對于人群行為分析[23]。國內(nèi)外有不少對于人數(shù)識別的解決方案,其中絕大部分是基于機器視覺的?;跈C器視覺的人數(shù)識別不僅具有很強的科學研究價值,還具有很強的實用價值,其成本低,使用周期長,統(tǒng)計準確率高。
本文根據(jù)近幾年人數(shù)識別研究成果,做出總結(jié),將其分為4種識別方法,分別為特征識別、形狀識別、模型學習識別和人群密度識別。前三種旨在檢測和跟蹤個體,多用于中低人群密度的場合;第4種主要是跳過單個行人的檢測和跟蹤過程,將人群整體作為研究對象。
1特征識別法
特征識別法是指根據(jù)已選取的目標特征,在圖像序列中匹配搜索目標,從而實現(xiàn)運動目標的跟蹤識別。在識別算法中,選取有效的特征集,會提高檢測效率,減少錯誤率。
顏色特征對平面旋轉(zhuǎn)、非剛性變形具有很強的魯棒性,同時能夠容忍部分遮擋。在文獻[4]中,Comaniciu提出了基于顏色直方圖(Color Histogram)非剛性目標的跟蹤識別方法。但是由于顏色特征對光照變化的敏感性,為了提高識別效果,可采用多特征結(jié)合[5]的方式。王強[6]等人提出了一種人頭的顏色與形狀特征相結(jié)合的人數(shù)識別方法,此方法對圖像進行二值化,以降低陰影和光照變化造成的影響;然后根據(jù)形狀特征對人頭進行檢測與跟蹤,最后對目標的運動軌跡進行跟蹤分析,估計出當前場景中的人數(shù)。在光照變化頻繁的地方也可采用邊緣特征,文獻[7]提出了基于邊緣方向直方圖特征的跟蹤方法,該方法對光照變化不敏感,并且比單一輪廓邊緣特征具有更豐富的信息。單一的邊緣特征[8-9]往往存在計算復雜度高、無法適應(yīng)目標形變的問題。而顏色與邊緣特征具有互補特性,將兩種信息融合能夠建立更可靠的目標特征模型。光流特征通過計算像素點光流的幅值和方向構(gòu)建動態(tài)圖像的幾何變化和輻射度變化,Decarlo[10]利用光流特征實現(xiàn)了對人臉目標的跟蹤。由于光流法運算量較大,很難滿足實時性要求,并且光流法對遮擋、光照變化以及運動噪聲比較敏感,因此光流法的實際應(yīng)用并不常見。
2形狀識別法
形狀識別法的思想是建立一個表示目標形狀的模板,然后計算目標模板和候選目標形狀的相似度,從而確定當前幀運動目標最可能的位置。常用人體的形狀特征作為模板,如人體的軀干特征、人頭輪廓[11]特征。
文獻[12]中提到了一種根據(jù)雙橢圓模型檢測人頭作為人數(shù)統(tǒng)計依據(jù)的方法,得到運動目標的輪廓特征后檢測出頭部橢圓,這種方法提高了檢測精度,減了少誤判,然而如果是畫面比較模糊的情況下,就不能準確地確定目標。為了解決模糊場景下的人員識別,常慶龍、夏洪山[13]在視頻檢測過程中引入了一個自適應(yīng)的人物檢測窗口,對監(jiān)控視頻中的行人進行檢測和計數(shù)。該算法對場景圖像質(zhì)量要求低,不需要繁瑣的訓練過程,只需要一定的參數(shù)配置步驟即可實現(xiàn)感興趣區(qū)域的行人快速檢測,但此算法仍然有不足之處,即對于復雜場合的人群誤檢率較高。而趙軍偉[14]等人在這方面做得較好,用數(shù)學形態(tài)學與HSI顏色空間相結(jié)合的方法有效地去除圖像中非人頭區(qū)域的干擾和噪聲,通過邊緣檢測得到人頭候選區(qū)域,最后利用人頭輪廓信息進行判定識別目標。為了提高視頻監(jiān)控中人數(shù)統(tǒng)計的實時性,文獻[15]中也使用了數(shù)學形態(tài)學與顏色空間相結(jié)合的方法,用輪廓的幾何特征檢測人頭,相比之下,此方法更具體、詳細,可適用多種不同復雜的場合,也能保證檢測的實時性,在動態(tài)場景下的行人檢測取得了較好的效果。
3學習識別法
模型學習識別法是對要跟蹤的目標特征建立模型并學習,進而對學習得到的模型用于檢測,最后統(tǒng)計出人數(shù)。模型學習的算法需要具備快速、連續(xù)的學習能力,通過增量學習更新目標的特征描述來處理表征的變化。
2009年,賈慧星[16]提出智能監(jiān)控中基于機器學習的自動人數(shù)統(tǒng)計系統(tǒng),通過機器學習對視頻序列中的人肩部位進行準確地檢測。該方法克服了連通域分析和簡單模板匹配的不足,魯棒性增強,但是只適用于場景中的初步測試,而且計算量較大,效率不高。在此基礎(chǔ)上,劉子源、蔣承志[17]使用人肩部建立Harr特征分類器,過濾背景,排除干擾,提高了檢測精度,減少了檢測時間。除人肩外,較多算法用人臉作為學習模型,江偉堅[18]等人提出兩組Harrlike特征擴展集(正臉和側(cè)臉),通過Adaboost算法訓練出雙通道級聯(lián)分類器(用于側(cè)臉和正臉的識別),此方法使用較少的弱分類器,檢測效率高,計算速度快,對多角度人臉檢測有較好的魯棒性。以上算法采樣的視覺角度建立在行人平視圖上,而垂直攝像頭可以降低遮擋程度,文獻[19]中,用俯視的方式采樣,建立基于Adaboost的人頭檢測分類器,實現(xiàn)人數(shù)統(tǒng)計,但是仍然存在誤檢和漏檢的情況。為了對此進行改善,唐春暉[20]提出了一種基于梯度方向直方圖的俯視行人的檢測方法。它將俯視人頭的梯度方向直方圖作為檢測目標的特征,通過訓練樣本提取的特征向量在支持向量機(SVM)中訓練。此方法對目標尺度變化相對不敏感且效率更高,處理速度也明顯提升。
4人群密度識別法
人群密度識別法是將人群作為一個整體的研究對象,分析人群的圖像特征,然后建立人群特征與人數(shù)之間的映射關(guān)系從而實現(xiàn)人群計數(shù)。其圖像特征又分為基于像素特征和基于紋理特征兩大類。
王明吉、肖桂丹[21]等利用運動目標標記的方法實現(xiàn)計數(shù),標記圖像中的像素,形成標簽圖像,根據(jù)標簽圖像初步確定目標數(shù)量。此方法穩(wěn)定性強、準確率較高,但由于基于像素特征的識別法計算簡單,因此在高密度場合往往使用基于紋理的分析法。Chan[22]采用混合紋理模型來提取分割運動人群,利用訓練回歸函數(shù)的方法得出人數(shù)與特征量關(guān)系函數(shù),進而對檢測區(qū)域人數(shù)實現(xiàn)估計。由于訓練集不夠強大,很容易出現(xiàn)誤差,準確率就不能保證,而且計算量較大。之后,李虎[23]等人提出一種基于 PCA 和多元統(tǒng)計回歸的人數(shù)統(tǒng)計方法,使用 PCA 方法提取信息,得到特征量與行人密度間的函數(shù)關(guān)系后對高斯回歸模型進行修正,以提高回歸模型的精度,統(tǒng)計出行人密度,有較高的準確率。紋理分析法中,比較經(jīng)典的方法是使用灰度共生矩陣紋理特征。文獻[24]中采用一種基于線性內(nèi)插透視矯正的SURF算法,對獲得的前景圖像提取多特征,將傳統(tǒng)的灰度共生矩陣紋理特征與SURF算法特征相結(jié)合,克服遮擋和攝像機透視畸形的影響,有效地提高了統(tǒng)計精度,有較強的適應(yīng)性,準確率也可以得到保證。
5人數(shù)識別算法難點
人數(shù)識別算法包括人員檢測算法、人員跟蹤算法和人群密度算法。研究算法一直追求魯棒性好、準確率高、快速性好的特點。雖然關(guān)于人數(shù)識別算法的研究已經(jīng)持續(xù)了很多年,研究者們提出了各種各樣的識別方法,但是還沒有形成一個適用于所用應(yīng)用場合的統(tǒng)一理論框架或體系,而且算法在實際應(yīng)用中遇到的很多問題仍然沒有得到很好的解決,這些問題即是難點,又是以后的研究重點,表1是對各算法中遇到的難點問題的總結(jié)。
6展望和結(jié)束語
隨著智能視頻跟蹤系統(tǒng)的發(fā)展,對目標跟蹤技術(shù)的要求也成為一個研究熱點。實現(xiàn)一個速度快、精度高、實時性好的識別系統(tǒng)是研究的重要方向之一。但是通常情況下,各特點之間相互矛盾。提高復雜環(huán)境下的多目標識別亟待解決。針對目標識別技術(shù)中出現(xiàn)的目標遮擋、背景干擾等問題,可引入超像素概念[25],能夠捕獲圖像冗余信息,降低后續(xù)處理任務(wù)復雜度。不同的機器學習方法對模型的自適應(yīng)有嚴重的影響,針對在識別工程中出現(xiàn)的運動和變化不確定性,已有的子空間學習、度量空間學習、稀疏字典學習和深度學習都有很好的效果。如何結(jié)合學習機制更好地實現(xiàn)算法自適應(yīng)性有待深入研究。
隨著物聯(lián)網(wǎng)的發(fā)展,智能視頻監(jiān)控系統(tǒng)已成為熱點之一,使人數(shù)識別算法也成為熱點。本文介紹了基于機器視覺的人數(shù)統(tǒng)計的研究;通過對近年來具有代表性的人數(shù)識別算法研究分析,總結(jié)出人數(shù)識別算法主要有基于個人的識別和基于群體的識別;相比傳統(tǒng)的人數(shù)識別算法,增加了對高密度人群的詳細分析??偨Y(jié)了近年來人數(shù)識別算法中亟待解決的問題,并對其提出展望。
參考文獻
?。?] 章煒.機器視覺技術(shù)發(fā)展及其工業(yè)應(yīng)用[J].紅外,2005,27(2):11-17.
?。?] KRAHNSTOEVER N, TU P, SEBASTIAN T, et al. Multiview detection and tracking of travelers and luggage in mass transit environments[C]. In: IEEE International Workshop on Performance Evaluation of Trackling and Surveillance and CVPR, 2006.
?。?] KRAHNSTOEVER N, YU T, PATWARDHAN K A, et al. Multicamera person tracking in crowded environments[C].Twelfth IEEE International Workshop on PERFORMANCE Evaluation of Tracking and Surveillance, 2010:1-7.
?。?] COMANICIU D, RAMESH V, MEER P. Kernelbased object rracking[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2003, 25(5):564-575.
[5] 林景亮,唐杰.一種融合膚色和Haar特征的人臉檢測方法[J]. 微型機與應(yīng)用,2013, 32(8):35-37.
?。?] 王強,馮燕.基于顏色和形狀信息的快速人數(shù)統(tǒng)計方法[J].計算機測量與控制,2010(9):101-105.
?。?] SHEN C, HENGEL A V, DICK A. Probabilistic multiple cue integration for particle filter based tracking[C]. Proceedings of the International Conference on Digital Image Computing: Techniques and Applications, Sydney, 2003, 1: 399-408.
?。?] BIRCHFIELD S T, RANGARAJAN S. Spatioframs versus histograms for regionbased tracking[C].Proceedings of the IEEE Computer Society Conference on Computer Vision and Recognition, San Diego, CA, United States,2005,2:1158-1163.
?。?] LI P H, ZHANG T W, PECE A E C. Visual contour tracking based on particle filters[J]. Image and Vision Computing, 2003, 21(1): 111-123.
?。?0] DE CARLO D, METAXAS D. Optical flow constraints on deformable models with applications to face tracking[J]. International Journal of Computer Vision, 2000, 38(2): 99-127.
?。?1] 周先春,唐娟, 汪美玲.曲率與小波輪廓增強的人臉識別算法[J].電子技術(shù)應(yīng)用, 2015, 41(10):161-164.
?。?2] 張繼法,梅雪,許松松.一種基于雙橢圓模型的視頻人數(shù)統(tǒng)計方法[J].計算機科學,2012,39(26):499-502.
?。?3] 常慶龍,夏洪山.基于自適應(yīng)滑動窗的模糊場景行人快速檢測[J].電視技術(shù),2012,36(19):177-182.
?。?4] 趙軍偉,侯清濤,李金屏,等.基于數(shù)學形態(tài)學和 HSI 顏色空間的人頭檢測[J].山東大學學報(工學版),2013,43(2):6-10.
?。?5] 高春霞,董寶田,王愛麗.基于人頭顏色空間和輪廓信息的行人檢測方法研究[J].交通運輸系統(tǒng)工程與信息,2015,15(4):70-78.
?。?6] 賈慧星,章毓晉.智能視頻監(jiān)控中基于機器學習的自動人數(shù)統(tǒng)計[J].視頻應(yīng)用與工程,2009,34(4):78-81.
?。?7] 劉子源,蔣承志.基于OpenCV和Haar特征分類器的圖像人數(shù)檢測[J].遼寧科技大學學報,2011,34(4):384-388.
?。?8] 江偉堅,郭躬德,賴智銘.基于新Harrlike特征的Adaboost人臉檢測算法[J].山東大學學報(工學版),2014,44(2):43-48.
?。?9] 張志勛,張磊,楊凡.一種改進的Adaboost人臉檢測方法[J].自動化與儀器儀表,2013(6):143145.
?。?0] 唐春暉.一種基于梯度方向直方圖的俯視行人的檢測方法[J].模式識別與人工智能,2015,28(1):1926.
[21] 王明吉,肖桂丹,胡曉曦.一種實用的多運動目標標記與計數(shù)新方法[J].計算機仿真,2009,26(8):199-203.
?。?2] CHAN A B, LIANG Z S J, VASCONCELOS N. Privacy preserving crowd monitoring: counting people without people models or tracking[C]. Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recoynition (CVPR08). Washington, DC, USA: IEEE Computer Society,2008:1-7.
?。?3] 李虎,張二虎,段敬紅.基于PCA 和多元統(tǒng)計回歸的人群人數(shù)統(tǒng)計方法[J].計算機工程與應(yīng)用,2014,50(11):206-209.