《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 結(jié)合不確定性估計的輕量級人體關(guān)鍵點檢測算法
結(jié)合不確定性估計的輕量級人體關(guān)鍵點檢測算法
電子技術(shù)應(yīng)用
王亞東,秦會斌
(杭州電子科技大學(xué) 新型電子器件與應(yīng)用研究所,浙江 杭州 310018)
摘要: 人體關(guān)鍵點檢測在智能視頻監(jiān)控、人機交互等領(lǐng)域有重要應(yīng)用。針對基于熱圖的人體關(guān)鍵點檢測算法依賴高分辨率熱圖、計算資源消耗大的問題,提出一種結(jié)合不確定性估計的輕量級算法。使用低分辨率熱圖,結(jié)合不確定性估計預(yù)測誤差分布的尺度參數(shù),提高了預(yù)測結(jié)果的可信度;利用尺度參數(shù)監(jiān)督和約束熱圖,緩解梯度消失,增強了網(wǎng)絡(luò)的魯棒性。COCO數(shù)據(jù)集上實驗結(jié)果表明,與積分姿態(tài)回歸算法相比,改進后算法的平均精度提高了3.3%,降低了資源占用。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.233938
中文引用格式: 王亞東,秦會斌. 結(jié)合不確定性估計的輕量級人體關(guān)鍵點檢測算法[J]. 電子技術(shù)應(yīng)用,2023,49(10):40-45.
英文引用格式: Wang Yadong,Qin Huibin. Lightweight human key point detection algorithm with uncertainty[J]. Application of Electronic Technique,2023,49(10):40-45.
Lightweight human key point detection algorithm with uncertainty
Wang Yadong,Qin Huibin
(Institute of New Electron Device and Application, Hangzhou Dianzi University, Hangzhou 310018, China)
Abstract: Human key point detection has important applications in intelligent video surveillance, human-computer interaction and other fields. Aiming at the problem that the human key point detection algorithm based on heatmap depends on high-resolution heatmap and consumes large computational resources, a lightweight algorithm combined with uncertainty estimation is proposed. The reliability of prediction results is improved by using low resolution heatmap and combining uncertainty to estimate the scale parameters of prediction error distribution. The scale parameter is used to monitor and constrain the heatmap to alleviate the gradient disappearance and enhance the robustness of the network. The experiments on COCO dataset show that the average accuracy of the improved algorithm is improved by 3.3% and the resource occupation is reduced compared with integral pose regression.
Key words : human key point detection;uncertainty estimation;lightweight;integral pose regression(IPR)

0 引言

隨著社會發(fā)展,監(jiān)控視頻分析正從人工走向智能,從傳統(tǒng)走向現(xiàn)代。人體關(guān)鍵點檢測是以人為中心的視頻分析中的重要環(huán)節(jié),又稱為人體姿態(tài)估計[1]。人體關(guān)鍵點是具有明確語義的關(guān)節(jié)點和部位,是行為識別[2]、人機交互[3]和動作捕捉[4]等應(yīng)用的重要基礎(chǔ)。

隨著卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的發(fā)展,人體關(guān)鍵點檢測取得顯著進步,精度逐漸提升。基于深度卷積神經(jīng)網(wǎng)絡(luò)的人體關(guān)鍵點檢測算法分為兩類:基于熱圖表示的檢測方法和基于坐標表示的回歸方法。

自從Tompson等人[5]首次提出用熱圖表示關(guān)節(jié)點,檢測方法成為二維姿態(tài)估計的主流。孫科等人[6]針對關(guān)鍵點檢測任務(wù)提出HRNet,整個網(wǎng)絡(luò)中保持高分辨率的特征圖,通過并行連接多個不同分辨率的子網(wǎng)絡(luò),并在它們之間進行信息交互和融合,避免了信息的丟失和模糊。檢測方法具有精度高、訓(xùn)練效率高和空間泛化性好等優(yōu)點。但是熱圖分辨率低于原圖分辨率導(dǎo)致的量化誤差和解碼過程中argmax操作不可微分,使得檢測方法依賴高分辨率熱圖,限制了在嵌入式設(shè)備中的使用。

回歸方法在人體姿態(tài)估計中研究較早,但相關(guān)工作較少。回歸方法直接端到端產(chǎn)生圖像中關(guān)鍵點的坐標。Toshev等人[7]首次提出利用CNN回歸坐標進行人體姿態(tài)估計。Carreira等人[8]提出了一個迭代誤差反饋框架(Iterative Error Feedback,IEF),引入自上而下的反饋,預(yù)測當(dāng)前估算值的偏移量并進行迭代矯正。Nie等人[9]提出了單階段的多人姿態(tài)估計網(wǎng)絡(luò)(Single-stage Multi-person Pose Machine,SPM),采用根節(jié)點預(yù)測人體位置,然后預(yù)測關(guān)節(jié)點的偏移量?;貧w方法擁有簡單靈活高效等優(yōu)點,但性能仍遜色于檢測方法,尤其在遮擋、截斷和運動模糊等場景中誤差較大。


本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000005711




作者信息:

王亞東,秦會斌

(杭州電子科技大學(xué) 新型電子器件與應(yīng)用研究所,浙江 杭州 310018)


微信圖片_20210517164139.jpg


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。