基于時(shí)空注意力金字塔卷積的動(dòng)作識(shí)別
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:834 K
標(biāo)簽: 時(shí)空注意力 動(dòng)作識(shí)別 自適應(yīng)采樣
所需積分:0分積分不夠怎么辦?
文檔介紹:動(dòng)作識(shí)別算法需要從視頻中提取空間和時(shí)域特征,對(duì)計(jì)算存儲(chǔ)資源要求較高?;?D CNN的網(wǎng)絡(luò)更為輕量,但從視頻中提取時(shí)域特征的能力較弱,動(dòng)作識(shí)別性能通常受到限制。S-TPNet提出時(shí)空金字塔模塊以獲取圖像序列的時(shí)間粒度特征,有效提升了基于2D CNN的動(dòng)作識(shí)別網(wǎng)絡(luò)的性能。基于S-TPNet,設(shè)計(jì)了時(shí)空注意力模型以凸顯空間和時(shí)間上的重要特征。為降低輸入數(shù)據(jù)量,通常抽取局部視頻幀作為輸入,為降低采樣幀與整體視頻之間的不穩(wěn)定差異,設(shè)計(jì)了自適應(yīng)等間隔采樣策略。實(shí)驗(yàn)表明,在未預(yù)訓(xùn)練的情況下,本網(wǎng)絡(luò)在UCF-101和HMDB-51數(shù)據(jù)集上分別將Top-1精度提高了5.1%和3.3%,并且不會(huì)大幅增加所需參數(shù)。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。