针对视觉传感器采集到的图像进行三维人体姿态估计,提出一种双循环Transformer网络模型,有效地从二维关键关节点中提取时空维度高相关性特征,增大感受野,从而提高三维姿态估计的精度。通过在视觉传感器采集得到的公开数据集Human3.6M上...针对视觉传感器采集到的图像进行三维人体姿态估计,提出一种双循环Transformer网络模型,有效地从二维关键关节点中提取时空维度高相关性特征,增大感受野,从而提高三维姿态估计的精度。通过在视觉传感器采集得到的公开数据集Human3.6M上的仿真实验,验证了双循环Transformer算法的性能。分析结果表明,最终估计得到的三维人体关节点的平均关节点位置偏差MPJPE(Mean Per Joint Position Error)为41.6 mm,相比于现有方法有一定提升,可以应用到许多下游相关工作中,有着较强的应用价值。展开更多
针对三维人体姿态估计的便捷性与准确性提升需求,提出一种基于TM-Net网络估计算法。该算法以MediaPipe为中心,融合帧率计算、动作检测、动作计数和真实坐标解析等多功能模块,实现对人体运动的精准检测与计数。针对公共数据集LSP(Leeds S...针对三维人体姿态估计的便捷性与准确性提升需求,提出一种基于TM-Net网络估计算法。该算法以MediaPipe为中心,融合帧率计算、动作检测、动作计数和真实坐标解析等多功能模块,实现对人体运动的精准检测与计数。针对公共数据集LSP(Leeds Sports Pose)和自建校园健身房运动数据集使用关键点的正确性概率(Probability of Correct Keypoint,PCK)、关节位置误差平均值(Mean Per Joint Position Error,MPJPE)和普罗克鲁斯对齐后的平均关节位置误差(Procrustes-Aligned Mean Per Joint Position Error,PA-MPJPE)等指标对该算法进行评估,并与目前先进的TP-3D网络估计算法进行对比。结果表明,TM-Net具有更高的准确率。此外,以开合跳为例进行消融实验,结果表明,TM-Net具有更强的泛化能力,能适应不同个体及拍摄角度的变化,满足了运动监测的实际需求。展开更多
文摘针对视觉传感器采集到的图像进行三维人体姿态估计,提出一种双循环Transformer网络模型,有效地从二维关键关节点中提取时空维度高相关性特征,增大感受野,从而提高三维姿态估计的精度。通过在视觉传感器采集得到的公开数据集Human3.6M上的仿真实验,验证了双循环Transformer算法的性能。分析结果表明,最终估计得到的三维人体关节点的平均关节点位置偏差MPJPE(Mean Per Joint Position Error)为41.6 mm,相比于现有方法有一定提升,可以应用到许多下游相关工作中,有着较强的应用价值。
文摘针对三维人体姿态估计的便捷性与准确性提升需求,提出一种基于TM-Net网络估计算法。该算法以MediaPipe为中心,融合帧率计算、动作检测、动作计数和真实坐标解析等多功能模块,实现对人体运动的精准检测与计数。针对公共数据集LSP(Leeds Sports Pose)和自建校园健身房运动数据集使用关键点的正确性概率(Probability of Correct Keypoint,PCK)、关节位置误差平均值(Mean Per Joint Position Error,MPJPE)和普罗克鲁斯对齐后的平均关节位置误差(Procrustes-Aligned Mean Per Joint Position Error,PA-MPJPE)等指标对该算法进行评估,并与目前先进的TP-3D网络估计算法进行对比。结果表明,TM-Net具有更高的准确率。此外,以开合跳为例进行消融实验,结果表明,TM-Net具有更强的泛化能力,能适应不同个体及拍摄角度的变化,满足了运动监测的实际需求。