《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 设计应用 > 结合不确定性估计的轻量级人体关键点检测算法
结合不确定性估计的轻量级人体关键点检测算法
电子技术应用
王亚东,秦会斌
(杭州电子科技大学 新型电子器件与应用研究所,浙江 杭州 310018)
摘要: 人体关键点检测在智能视频监控、人机交互等领域有重要应用。针对基于热图的人体关键点检测算法依赖高分辨率热图、计算资源消耗大的问题,提出一种结合不确定性估计的轻量级算法。使用低分辨率热图,结合不确定性估计预测误差分布的尺度参数,提高了预测结果的可信度;利用尺度参数监督和约束热图,缓解梯度消失,增强了网络的鲁棒性。COCO数据集上实验结果表明,与积分姿态回归算法相比,改进后算法的平均精度提高了3.3%,降低了资源占用。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.233938
中文引用格式: 王亞東,秦會斌. 結(jié)合不確定性估計的輕量級人體關(guān)鍵點檢測算法[J]. 電子技術(shù)應(yīng)用,2023,49(10):40-45.
英文引用格式: Wang Yadong,Qin Huibin. Lightweight human key point detection algorithm with uncertainty[J]. Application of Electronic Technique,2023,49(10):40-45.
Lightweight human key point detection algorithm with uncertainty
Wang Yadong,Qin Huibin
(Institute of New Electron Device and Application, Hangzhou Dianzi University, Hangzhou 310018, China)
Abstract: Human key point detection has important applications in intelligent video surveillance, human-computer interaction and other fields. Aiming at the problem that the human key point detection algorithm based on heatmap depends on high-resolution heatmap and consumes large computational resources, a lightweight algorithm combined with uncertainty estimation is proposed. The reliability of prediction results is improved by using low resolution heatmap and combining uncertainty to estimate the scale parameters of prediction error distribution. The scale parameter is used to monitor and constrain the heatmap to alleviate the gradient disappearance and enhance the robustness of the network. The experiments on COCO dataset show that the average accuracy of the improved algorithm is improved by 3.3% and the resource occupation is reduced compared with integral pose regression.
Key words : human key point detection;uncertainty estimation;lightweight;integral pose regression(IPR)

0 引言

隨著社會發(fā)展,監(jiān)控視頻分析正從人工走向智能,從傳統(tǒng)走向現(xiàn)代。人體關(guān)鍵點檢測是以人為中心的視頻分析中的重要環(huán)節(jié),又稱為人體姿態(tài)估計[1]。人體關(guān)鍵點是具有明確語義的關(guān)節(jié)點和部位,是行為識別[2]、人機交互[3]和動作捕捉[4]等應(yīng)用的重要基礎(chǔ)。

隨著卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的發(fā)展,人體關(guān)鍵點檢測取得顯著進步,精度逐漸提升?;谏疃染矸e神經(jīng)網(wǎng)絡(luò)的人體關(guān)鍵點檢測算法分為兩類:基于熱圖表示的檢測方法和基于坐標表示的回歸方法。

自從Tompson等人[5]首次提出用熱圖表示關(guān)節(jié)點,檢測方法成為二維姿態(tài)估計的主流。孫科等人[6]針對關(guān)鍵點檢測任務(wù)提出HRNet,整個網(wǎng)絡(luò)中保持高分辨率的特征圖,通過并行連接多個不同分辨率的子網(wǎng)絡(luò),并在它們之間進行信息交互和融合,避免了信息的丟失和模糊。檢測方法具有精度高、訓(xùn)練效率高和空間泛化性好等優(yōu)點。但是熱圖分辨率低于原圖分辨率導(dǎo)致的量化誤差和解碼過程中argmax操作不可微分,使得檢測方法依賴高分辨率熱圖,限制了在嵌入式設(shè)備中的使用。

回歸方法在人體姿態(tài)估計中研究較早,但相關(guān)工作較少?;貧w方法直接端到端產(chǎn)生圖像中關(guān)鍵點的坐標。Toshev等人[7]首次提出利用CNN回歸坐標進行人體姿態(tài)估計。Carreira等人[8]提出了一個迭代誤差反饋框架(Iterative Error Feedback,IEF),引入自上而下的反饋,預(yù)測當前估算值的偏移量并進行迭代矯正。Nie等人[9]提出了單階段的多人姿態(tài)估計網(wǎng)絡(luò)(Single-stage Multi-person Pose Machine,SPM),采用根節(jié)點預(yù)測人體位置,然后預(yù)測關(guān)節(jié)點的偏移量?;貧w方法擁有簡單靈活高效等優(yōu)點,但性能仍遜色于檢測方法,尤其在遮擋、截斷和運動模糊等場景中誤差較大。


本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000005711




作者信息:

王亞東,秦會斌

(杭州電子科技大學 新型電子器件與應(yīng)用研究所,浙江 杭州 310018)


微信圖片_20210517164139.jpg


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容