引用格式: 趙國順,方建安,瞿斌杰,等. 基于頻域注意力時空卷積網(wǎng)絡(luò)的步態(tài)識別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(6):13-18.
步態(tài)特征,通俗來說就是人行走時的姿態(tài)外觀,具體包括手臂、大腿、小腿等身體輪廓的變化,由于步態(tài)的采集不需要與被識別者有物理上的接觸,也不需要近距離的接觸,因此應(yīng)用場景比較完善。醫(yī)學(xué)研究表明,每一個人的步態(tài)都有自己的形態(tài),具有唯一性,使用步態(tài)識別具有一定的安全性,不會導(dǎo)致信息的錯誤。將步態(tài)識別技術(shù)應(yīng)用于當(dāng)今智能監(jiān)控領(lǐng)域,可以在多場景下對人員進(jìn)行監(jiān)控,防止意外情況發(fā)生,也有利于鎖定犯罪嫌疑人,節(jié)省人力物力。
目前,關(guān)于步態(tài)識別的方法主要有兩種。一種是基于步態(tài)模板的方法,主要是通過構(gòu)建步態(tài)特征,比如關(guān)節(jié)點(diǎn)的位置變化、重心的起伏周期等幾何數(shù)字特征,將一個人的行走視頻序列壓縮成一個模板,然后通過匹配待預(yù)測行人的步態(tài)與模板的相似度進(jìn)行識別。另一種方法是通過深度學(xué)習(xí)直接抽取原始圖像序列的步態(tài)信息,通過深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)高維時空信息來匹配行人的步態(tài),這種方法不需要大量精細(xì)的特征構(gòu)建,是一種端到端的識別方法。
雖然基于步態(tài)模板的方法取得了一定的準(zhǔn)確率,但是這種特征構(gòu)造方法復(fù)雜,而且受角度、環(huán)境、穿著變化影響較大,同時這種特征缺失了時空信息的抽取,在精度上具有一定的限制性。深度學(xué)習(xí)方法是一種端到端的學(xué)習(xí)方法,魯棒性強(qiáng),易于操作,但是由于模型參數(shù)巨大,如何保證準(zhǔn)確性與實(shí)時性成了關(guān)鍵。
本文基于深度學(xué)習(xí)的方法,改良了三維卷積網(wǎng)絡(luò)(C3D)的網(wǎng)絡(luò)結(jié)構(gòu),提出頻域注意力卷積操作,主要通過劃分頻域空間,引進(jìn)頻域卷積。同時另一個創(chuàng)新主要是注意力機(jī)制的引入,這使得網(wǎng)絡(luò)更加關(guān)注不同步態(tài)之間的不同,調(diào)整步態(tài)分布的重要性,提升網(wǎng)絡(luò)學(xué)習(xí)效果。經(jīng)由中科大數(shù)據(jù)集CASIA dataset B檢測,本文方法在跨視角實(shí)驗(yàn)和方法對比實(shí)驗(yàn)中具有提升。
本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000003146
作者信息:
趙國順1,2,方建安1,2,瞿斌杰1,2,Samah A.F.Manssor1,2,孫韶媛1,2
(1.東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海201620;
2.數(shù)字化紡織服裝技術(shù)教育部工程研究中心,上海201620)