针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算...针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算子,获取视频图像帧的特征向量,然后使用姿态估计网络和形状估计网络获取人体姿势以及形状参数,最后使用蒙皮多人线性模型(skinned multi-person linear model, SMPL)生成三维人体模型的运动序列。在三维姿态户外数据集(3D pose in the wild, 3DPW)上与视频人体姿态形状估计推理(video inference for body pose and shape estimation, VIBE)方法以及时间一致性网格恢复(temporally consistent mesh recovery, TCMR)方法进行对比实验,平均精度相比于VIBE、TCMR分别提升了3.1%、0.7%,能够为运动捕捉、三维人体动画制作等工作提供更为准确的三维人体模型。展开更多
文摘针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算子,获取视频图像帧的特征向量,然后使用姿态估计网络和形状估计网络获取人体姿势以及形状参数,最后使用蒙皮多人线性模型(skinned multi-person linear model, SMPL)生成三维人体模型的运动序列。在三维姿态户外数据集(3D pose in the wild, 3DPW)上与视频人体姿态形状估计推理(video inference for body pose and shape estimation, VIBE)方法以及时间一致性网格恢复(temporally consistent mesh recovery, TCMR)方法进行对比实验,平均精度相比于VIBE、TCMR分别提升了3.1%、0.7%,能够为运动捕捉、三维人体动画制作等工作提供更为准确的三维人体模型。