目前对人体姿态骨骼关键点检测存在两个研究难点,一是如何由2D姿态进行3D人体姿态估计,另一个是标准数据库和用户上传的视频动作在时间上不匹配。为此,本文提出基于空洞转置卷积的沙漏结构(Dilated and Transpose Convolutions Hourglas...目前对人体姿态骨骼关键点检测存在两个研究难点,一是如何由2D姿态进行3D人体姿态估计,另一个是标准数据库和用户上传的视频动作在时间上不匹配。为此,本文提出基于空洞转置卷积的沙漏结构(Dilated and Transpose Convolutions Hourglass,DTCH)神经网络;然后应用卡尔曼滤波算法进行数据降噪处理,最后利用动态时间规整(Dynamic Time Warping,DTW)算法提高患者运动时姿态匹配的准确性。在仿真实验中,该模型在Human3.6M数据集上的平均每关节位置误差(MPJPE)与相关研究的最佳结果相比减少了11%,可以精确高效地实现3D人体姿态估计。展开更多
文摘目前对人体姿态骨骼关键点检测存在两个研究难点,一是如何由2D姿态进行3D人体姿态估计,另一个是标准数据库和用户上传的视频动作在时间上不匹配。为此,本文提出基于空洞转置卷积的沙漏结构(Dilated and Transpose Convolutions Hourglass,DTCH)神经网络;然后应用卡尔曼滤波算法进行数据降噪处理,最后利用动态时间规整(Dynamic Time Warping,DTW)算法提高患者运动时姿态匹配的准确性。在仿真实验中,该模型在Human3.6M数据集上的平均每关节位置误差(MPJPE)与相关研究的最佳结果相比减少了11%,可以精确高效地实现3D人体姿态估计。