引用格式: 趙國順,方建安,瞿斌杰,等. 基于頻域注意力時空卷積網(wǎng)絡的步態(tài)識別方法[J].信息技術與網(wǎng)絡安全,2020,39(6):13-18.
步態(tài)特征,通俗來說就是人行走時的姿態(tài)外觀,具體包括手臂、大腿、小腿等身體輪廓的變化,由于步態(tài)的采集不需要與被識別者有物理上的接觸,也不需要近距離的接觸,因此應用場景比較完善。醫(yī)學研究表明,每一個人的步態(tài)都有自己的形態(tài),具有唯一性,使用步態(tài)識別具有一定的安全性,不會導致信息的錯誤。將步態(tài)識別技術應用于當今智能監(jiān)控領域,可以在多場景下對人員進行監(jiān)控,防止意外情況發(fā)生,也有利于鎖定犯罪嫌疑人,節(jié)省人力物力。
目前,關于步態(tài)識別的方法主要有兩種。一種是基于步態(tài)模板的方法,主要是通過構建步態(tài)特征,比如關節(jié)點的位置變化、重心的起伏周期等幾何數(shù)字特征,將一個人的行走視頻序列壓縮成一個模板,然后通過匹配待預測行人的步態(tài)與模板的相似度進行識別。另一種方法是通過深度學習直接抽取原始圖像序列的步態(tài)信息,通過深度神經網(wǎng)絡學習高維時空信息來匹配行人的步態(tài),這種方法不需要大量精細的特征構建,是一種端到端的識別方法。
雖然基于步態(tài)模板的方法取得了一定的準確率,但是這種特征構造方法復雜,而且受角度、環(huán)境、穿著變化影響較大,同時這種特征缺失了時空信息的抽取,在精度上具有一定的限制性。深度學習方法是一種端到端的學習方法,魯棒性強,易于操作,但是由于模型參數(shù)巨大,如何保證準確性與實時性成了關鍵。
本文基于深度學習的方法,改良了三維卷積網(wǎng)絡(C3D)的網(wǎng)絡結構,提出頻域注意力卷積操作,主要通過劃分頻域空間,引進頻域卷積。同時另一個創(chuàng)新主要是注意力機制的引入,這使得網(wǎng)絡更加關注不同步態(tài)之間的不同,調整步態(tài)分布的重要性,提升網(wǎng)絡學習效果。經由中科大數(shù)據(jù)集CASIA dataset B檢測,本文方法在跨視角實驗和方法對比實驗中具有提升。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000003146
作者信息:
趙國順1,2,方建安1,2,瞿斌杰1,2,Samah A.F.Manssor1,2,孫韶媛1,2
(1.東華大學 信息科學與技術學院,上海201620;
2.數(shù)字化紡織服裝技術教育部工程研究中心,上海201620)