基于伪三维卷积神经网络的手势姿态估计被引量：3

Hand pose estimation using pseudo-3D convolutional neural network

下载PDF

导出

摘要大多数现有的基于深度学习的手势姿态估计方法都使用标准三维卷积神经网络提取三维特征,估计手部关节坐标。该方法提取的特征缺乏手部的多尺度信息,限制了手势姿态估计的精度。另外,由于三维卷积神经网络巨大的计算成本和内存需求,这些方法常难以满足实时性要求。为了克服这些缺点,提出以空间滤波器和深度滤波器级联的方式模拟三维卷积,减少网络参数量。同时,在各个尺度上提取手势姿态特征并加以整合,充分利用手势的三维信息。实验表明,该方法能有效提高手势姿态估计精度,减小模型尺寸,且在具有单块GPU的计算机上能以超过119 fps的速度运行。 Most of the existing deep learning-based methods for hand pose estimation use a standard three-dimension convolutional neural network(3D CNN)to extract 3D features and estimate the 3D coordinates of hand joints.The features extracted by these methods lack the multi-scale information of the hand,which limits the accuracy of hand pose estimation.In addition,due to the huge computational cost and memory requirements of the 3D CNN,these methods are often difficult to meet the real-time requirement.To overcome these weaknesses,the proposed method used a spatial filter and a depth filter to simulate 3D convolutions,which reduced the amount of parameters.It extracted and integrates features at various scales,making full use of the 3D information of hand pose.Experiments show that this method can improve estimation accuracy,reduce model size,and run at over 119 fps on a standard computer with a single GPU.

作者张宏源袁家政刘宏哲原春锋王雪峤邓智方 Zhang Hongyuan;Yuan Jiazheng;Liu Hongzhe;Yuan Chunfeng;Wang Xueqiao;Deng Zhifang(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;Beijing Open University,Beijing 100081,China;National Laboratory of Pattern Recognition,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China)

机构地区北京联合大学北京市信息服务工程重点实验室北京开放大学中国科学院自动化研究所模式识别国家重点实验室

出处《计算机应用研究》 CSCD 北大核心 2020年第4期1230-1233,1243,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61571045) 北京成像技术高精尖创新中心项目(BAICIT-2016002) 北京市教委科技计划一般项目(KM201811417002) 北京联合大学研究生资助项目。

关键词手势姿态估计伪三维卷积神经网络三维特征深度图像深度学习 hand pose estimation pseudo-3D convolutional neural network 3D features depth image deep learning

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1徐岳峰,周书仁,王刚,佘凯晟.基于深度图像梯度特征的人体姿态估计[J].计算机工程,2015,41(12):200-205. 被引量：9
2王松,刘复昌,黄骥,许威威,董洪伟.基于卷积神经网络的深度图姿态估计算法研究[J].系统仿真学报,2017,29(11):2618-2623. 被引量：5

二级参考文献18

1Poppe R. Vision-based Human Motion Analysis: An Overview[ J ]. Computer Vision & Image Understanding, 2007,108(1/2) :4-18.
2Fischler M A, Elschlager R A. The Representation and Matching of Pictorial Structures [ J ]. IEEE Transactions on Computers, 1973,22( 1 ) :67-92.
3Sapp B, Toshev A, Taskar B. Cascaded Models for Articulated Pose Estimation [ C ]//Proceedings of ECCV'10. Berlin, Germany: Springer-Verlag, 2010: 1357-1365.
4Belagiannis VoWang X0 Schiele B, et al. Multiple Human Pose Estimation with Temporally Consistent 3D Pictorial Structures[ C ]//Proceedings of European Conference on Computer Vision. Zurich, Switzerland: i s. n. 1, 2(114: 742-754.
5Pishchulin L, Jain A, Andriluka M, et al. Articulated People Detection and Pose Estimation: Reshaping the Future[ C ]//Proceedings of 1EEE Conference on Computer Vision and Pattern Recognition. Washington D. C. , USA: IEEE Press ,2012:3178-3185.
6Sun M, Savarese S. Articulated Part-based Model for Joint Object Detection and Pose Estimation [ C ]// Proceedings of IEEE International Conference on Computer Vision. Washington D. C. ,USA:IEEE Press, 2011:723-730.
7Sharma G ,Jurie F, Schmid C. Expanded Parts Model for Human Attribute and Action Recognition in Still Images[ C ]//Proceedings of IEEE Conference on Com- puter Vision and Pattern Recognition. Washington D. C., USA : IEEE Press ,20 ! 3 : 652-659.
8Ahri O,Chaumette F. Complex Objects Pose Estimation Based on Image Moment Invariants[ C ]//Proceedings of IEEE International Conference on Robotics and Auto- mation. Washington D. C. , USA : IEEE Press, 2005 : 436- 441.
9Girshick R,Shotton J, Kohli P,et al. Efficient Regression of General-activity Human Poses from Depth Images[C]// Proceedings of IEEE International Conference on Computer Vision. Washington D. C. , USA :IEEE Press ,2011:415-422.
10Ye M, Wang X, Yang R, et al. Accurate 3d Pose Estimation from a Single Depth Image [C ]//Pro- ceedings of IEEE International Conference on Computer Vision. Washington D. C., USA: IEEE Press, 2011: 731-738.

共引文献12

1雷宇田,杨嘉琛,满家宝,奚萌.自适应航天器态势分析系统[J].宇航总体技术,2020,0(1):56-62.
2汪剑鸣,张笑,王胜蓓.一种用于物体姿态估计的快速Isomap降维算法[J].天津工业大学学报,2017,36(5):74-78. 被引量：3
3屈雁秋,陈锋.基于随机丛林的人体部件分类方法[J].计算机工程,2018,44(1):247-251.
4刘小彬,王璐,邹远文,李晋川,黄学进.基于BLE技术的可穿戴组合式人体姿态检测系统[J].实验科学与技术,2018,16(2):25-29.
5李晓峰,李东.基于卷积神经网络的多样性关键数据并行推荐算法[J].沈阳大学学报（自然科学版）,2019,31(4):307-312. 被引量：4
6肖贤鹏,刘理想,胡莉,张华.基于深度图像的实时多人体姿态估计[J].传感器与微系统,2020,39(6):26-29. 被引量：4
7方勇,朱志林.基于深度先验知识的堆叠沙漏网络人体姿态检测方法研究[J].科学与信息化,2020(10):197-198.
8朱丙丽,高晓琴,阮玲英.基于多通道卷积神经网络的单幅图像深度估计[J].计算机应用与软件,2020,37(6):230-233. 被引量：2
9蔡轶珩,王雪艳,马杰,孔欣然.基于随机森林误分类处理的3D人体姿态估计[J].自动化学报,2020,46(7):1457-1466. 被引量：2
10陈京钰,肖诗云,冯新.一种供水管网泄漏区域定位的机器学习方法[J].中国给水排水,2021,37(7):58-65. 被引量：3

同被引文献4

1胡弘,晁建刚,杨进,赵再骞,林万洪.Leap Motion关键点模型手姿态估计方法[J].计算机辅助设计与图形学学报,2015,27(7):1211-1216. 被引量：32
2赵中阳,程英蕾,释小松,秦先祥,李鑫.基于多尺度特征和PointNet的LiDAR点云地物分类方法[J].激光与光电子学进展,2019,56(5):243-250. 被引量：38
3周全,甘屹,何伟铭,孙福佳,杨丽红.基于LHPN算法的手势姿态估计方法研究[J].软件,2020,41(7):66-71. 被引量：2
4邹序焱,何汉武,吴悦明,邓景威.基于手势交互的虚实融合实验仿真技术[J].系统仿真学报,2021,33(10):2488-2498. 被引量：4

引证文献3

1马利,金珊杉,牛斌.基于改进PointNet网络的三维手姿估计方法[J].计算机应用研究,2020,37(10):3188-3192. 被引量：5
2王丽萍,汪成,邱飞岳,章国道.深度图像中的3D手势姿态估计方法综述[J].小型微型计算机系统,2021,42(6):1227-1235. 被引量：9
3邹序焱,何汉武,吴悦明.基于三级神经网络的鲁棒3D手姿估计[J].计算机应用研究,2022,39(3):925-930. 被引量：1

二级引证文献14

1张光玺,汤汶,万韬阮,薛涛.基于深度学习的抗噪声点云识别网络设计[J].纺织高校基础科学学报,2020,33(3):113-120. 被引量：3
2许诚,金庆红.基于姿势识别的舞蹈动作检测研究[J].怀化学院学报,2021,40(5):76-82. 被引量：4
3Yan Qian,Qianjin Xu,Yingying Yang,Hu Lu,Hua Li,Xuebin Feng,Wenqing Yin.Classification of rice seed variety using point cloud data combined with deep learning[J].International Journal of Agricultural and Biological Engineering,2021,14(5):206-212. 被引量：2
4王青,贾秀海,叶明露,王启宇,盛晓超.三维视觉下的目标识别与位姿估计方法[J].西安工程大学学报,2022,36(1):85-93. 被引量：6
5童立靖,李嘉伟.一种基于改进PointNet++网络的三维手姿估计方法[J].图学学报,2022,43(5):892-900. 被引量：2
6侯守明,贾超兰,张明敏.用于虚拟现实系统的眼动交互技术综述[J].计算机应用,2022,42(11):3534-3543. 被引量：10
7谢苏,张孙杰,王永雄,颜婷丽.基于多任务学习CNN辅助Transformer的手部mesh重建[J].计算机应用研究,2022,39(12):3830-3836. 被引量：1
8孙瑜,周国辉.基于深度学习的单张彩色图像手部网格重建方法综述[J].电子技术（上海）,2023,52(1):22-25.
9康文慧.虚拟人手语动画自动生成技术研究[J].长春师范大学学报,2023,42(4):77-82. 被引量：1
10胡昊,尹令,张素敏,温志坤,朱纪民,林润恒.基于改进PointNet++的大规模猪体点云部位分割[J].计算机与数字工程,2023,51(5):1130-1137. 被引量：1

1张国山,赵阳,马红悦.基于卷积神经网络的手势识别[J].光电子．激光,2019,30(12):1317-1322. 被引量：9
2王韬,柯余峰,王宁慈,刘文陶,安兴伟,明东.空间滤波方法在脑-机接口中的应用及研究进展[J].中国生物医学工程学报,2019,38(5):599-608. 被引量：3
3洪兹田,张新芹.热重分析法在高考化学试题中的考查[J].教学考试,2020,0(14):46-48.
4殷卓,尚文涛,贺静,孙楠,王淑敬.史陶比尔工业机器人的一种运动学算法[J].机器人技术与应用,2019(6):35-40. 被引量：1
5朱伟波.干直枝曲干弯枝缓——论松树盆景干和枝造型新趋势[J].花木盆景（下半月）,2019,0(9):26-27.
6傅子豪,王振,刘宇鹏,李潇雨,蒋迪,张天良a.基于液晶材料的带宽可重构毫米波滤波器[J].太赫兹科学与电子信息学报,2020,18(1):95-98. 被引量：1
7李宁驰,任诺钰,刘春宇,姚治海,蔡红星.基于三维荧光光谱检测水产品中隐性孔雀石绿残留量[J].光谱学与光谱分析,2020,40(5):1478-1482. 被引量：3
8高干揽云去垂枝入画来——高干垂枝风格作品赏[J].花木盆景（下半月）,2019,0(9):72-77.
9冯琴昌.基于OpenBCI与OpenViBE的脑机接口设计[J].中国医学物理学杂志,2020,37(2):210-219. 被引量：2
10付荣荣,田永胜,鲍甜恬.基于稀疏共空间模式和Fisher判别的单次运动想象脑电信号识别方法[J].生物医学工程学杂志,2019,36(6):911-915. 被引量：8

计算机应用研究

2020年第4期

浏览历史

内容加载中请稍等...

基于伪三维卷积神经网络的手势姿态估计被引量：3

参考文献2

二级参考文献18

共引文献12

同被引文献4

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于伪三维卷积神经网络的手势姿态估计 被引量：3

参考文献2

二级参考文献18

共引文献12

同被引文献4

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于伪三维卷积神经网络的手势姿态估计被引量：3