基于长短时记忆和深度神经网络的视觉手势识别技术被引量：4

Visual gesture recognition technology based on long short term memory and deep neural network

下载PDF

导出

摘要针对基于视觉的动态手势识别易受光照、背景和手势形状变化影响等问题,在分析人体手势空间上下文特征的基础上,首先建立一种基于人体骨架和部件轮廓特征的动态手势模型,并采用卷积姿势机和单发多框检测器技术构造深度神经网络进行人体手势骨架和部件轮廓特征提取。其次,引入长短时记忆网络提取动态人体手势中骨架、左右手和头部轮廓的时序特征,进而分类识别手势。在此基础上,设计了一种空间上下文与时序特征融合的动态手势识别机(GRSCTFF),并通过交警指挥手势视频样本库对其进行网络训练和实验分析。实验证明,该系统可以快速准确识别动态交警指挥手势,准确率达到94.12%,并对光线、背景和手势形状变化具有较强的抗干扰能力。 Aiming at the problem that visual gesture recognition is susceptible to light conditions, background information and changes in gesture shape, this paper analyzed the spatial context features of human gestures. First, this paper established a dynamic gesture model based on the contour features of human skeleton and body parts. The convolutional pose machine(CPM) and the single shot multibox detector(SSD) technology were utilized to build deep neural network, so as to extract the contour features of human gesture skeleton and body parts. Next, the long short term memory(LSTM) network was introduced to extract the temporal features of skeleton, left and right hand, and head contour in dynamic human gestures, so as to further classify and recognize gestures. On this basis, this paper designed a dynamic gesture recognizer based on spatial context and temporal feature fusion(GRSCTFF), and conducted network training and experimental analysis on GRSCTFF through the video sample database of traffic police command gestures. The experimental results show that GRSCTFF can quickly and accurately recognize the dynamic traffic police command gestures with an accuracy of 94.12%, and it has strong anti-interference ability to light, background and gesture shape changes.

作者何坚廖俊杰张丞魏鑫白佳豪王伟东 HE Jian;LIAO Jun-jie;ZHANG Cheng;WEI Xin;BAI Jia-hao;WANG Wei-dong(Software and System Engineering Technology Center,Beijing 100124,China;Faculty of Information,Beijing University of Technology,Beijing 100124,China)

机构地区北京市物联网软件与系统工程技术研究中心北京工业大学信息学部

出处《图学学报》 CSCD 北大核心 2020年第3期372-381,共10页 Journal of Graphics

基金国家自然科学基金项目(61602016) 北京市科技计划项目(D171100004017003)。

关键词手势识别空间上下文长短时记忆特征提取 gesture recognition spatial context long short term memory feature extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1武汇岳,张凤军,刘玉进,戴国忠.基于视觉的手势界面关键技术研究[J].计算机学报,2009,32(10):2030-2041. 被引量：18
2王西颖,戴国忠,张习文,张凤军.基于HMM-FNN模型的复杂动态手势识别[J].软件学报,2008,19(9):2302-2312. 被引量：40
3刘杰,黄进,田丰,胡伟平,戴国忠,王宏安.连续交互空间下的混合手势交互模型[J].软件学报,2017,28(8):2080-2095. 被引量：6
4刘江华,程君实,陈佳品.基于视觉的动态手势识别及其在仿人机器人交互中的应用[J].机器人,2002,24(3):197-200. 被引量：14
5王西颖,张习文,戴国忠.一种面向实时交互的变形手势跟踪方法[J].软件学报,2007,18(10):2423-2433. 被引量：29

二级参考文献22

1朱继玉,王西颖,王威信,戴国忠.基于结构分析的手势识别[J].计算机学报,2006,29(12):2130-2137. 被引量：26
2克初田斌.语音信号处理[M].北京:国防工业出版社,2000..
3Jacob R J K. Eye-movement-based human computer interaction techniques:Toward non command interfaces//Proceedings of the Advances in Human-Computer Interaction, Ablex Publishing Corporation. Norwood, New Jersey, 1993: 151- 190.
4Kato H, Billinghurst M, Poupyrev I. Virtual object manipulation on a table top AR environment//Proceedings of the ISAR2000. Munich, 2000: 111-119.
5Kjeldsen R, Levas A, Pinhanez C. Dynamically reconfigutable vision based user interfaces. Machine Vision and Applications, 2004, 16(1): 6-12.
6Wu Y, Huang T S. Vision-based gesture recognition: A review//Proceedings of the Gesture Workshop. Gifsur Yvette, France, 1999:103-115.
7Kolsch M. Vision based hand gesture interfaces for wearable computing and virtual environments[Ph. D. dissertation]. University of California, Santa Barbara, 2004.
8Wichens C D, Hollands J. Engineering Psychology and Human Performance. New Jersey: Prentice Hall, Inc. , 2003: 82-133.
9Buxton W. A three-state model of graphical input//Proceedings of the Human Computer Interaction-INTERACT ' 90. Amsterdam, North-Holland, 1990:449- 456.
10Ashbrook A P, Thacker N A, Rockett P I. Pairwise geometric histograms: A scaleable solution for the recognition of 2D rigid shape//Proceedings of the 9th Scandinavian Conference on Image Analysis. Uppsala, Sweden, 1995, (1):271-278.

共引文献95

1娄会东,肖强.基于HDC提取关键点的手势识别算法[J].安阳工学院学报,2007,6(4):69-72.
2尚爱丽,冯志全.三维人手跟踪中微观结构的应用[J].济南大学学报（自然科学版）,2013,27(4):342-346.
3胡新宇,赵明富,邢德周.图像传感器不均匀性的实时补偿方法研究[J].仪表技术与传感器,2004(8):47-48. 被引量：1
4王西颖,戴国忠,张习文,张凤军.基于HMM-FNN模型的复杂动态手势识别[J].软件学报,2008,19(9):2302-2312. 被引量：40
5黄莹,王志良,涂序彦,戚颖.一种可适应自然头动的视线追踪系统的研制及应用[J].电子学报,2009,37(4):764-770. 被引量：7
6韩磊,梁玮,贾云得.层级潜变量空间中的三维人手跟踪方法[J].计算机辅助设计与图形学学报,2009,21(5):650-656. 被引量：2
7刘佳,刘毅.虚拟维修技术发展综述[J].计算机辅助设计与图形学学报,2009,21(11):1519-1534. 被引量：68
8刘玉进,蔡勇,武汇岳,张凤军,戴国忠.一种肤色干扰下的变形手势跟踪方法[J].计算机工程与应用,2009,45(35):164-167. 被引量：5
9王跃灵,金振林.3-DOF混联拟人臂动力学建模与迭代学习控制(英文)[J].系统仿真学报,2010,22(1):148-151. 被引量：1
10李雨浪,于瀛洁.基于视觉的手指空间位置检测技术[J].计算机工程与设计,2010,31(3):555-558. 被引量：4

同被引文献27

1YUAN Tao WANG Ben.Accelerometer-based Chinese Traffic Police Gesture Recognition System[J].Chinese Journal of Electronics,2010,19(2):270-274. 被引量：14
2马正文,蔡坚勇,刘磊,欧阳乐峰,李楠.基于RGB-D视频的多模态手势识别[J].计算机系统应用,2018,27(12):234-239. 被引量：3
3陈国良,葛凯凯,李聪浩.基于多特征HMM融合的复杂动态手势识别[J].华中科技大学学报（自然科学版）,2018,46(12):42-47. 被引量：12
4刘江华,程君实,陈佳品.基于光流的动态手势识别[J].计算机工程,2002,28(4):104-105. 被引量：4
5刘嘉莹,张孙杰.融合视频时空域运动信息的3D CNN人体行为识别[J].电子测量技术,2018,41(7):43-49. 被引量：11
6王俊,郑彤,雷鹏,张原,樵明朗.基于卷积神经网络的手势动作雷达识别方法[J].北京航空航天大学学报,2018,44(6):1117-1123. 被引量：22
7张荣,李伟平,莫同.深度学习研究综述[J].信息与控制,2018,47(4):385-397. 被引量：140
8郑潇,彭晓东,王嘉璇.基于姿态时空特征的人体行为识别方法[J].计算机辅助设计与图形学学报,2018,30(9):1615-1624. 被引量：14
9王勇,吴金君,田增山,周牧,王沙沙.基于FMCW雷达的多维参数手势识别算法[J].电子与信息学报,2019,41(4):822-829. 被引量：32
10王莉,马钟,唐雪寒,王竹平,周革强,何双亮.一种面向舱外活动的视觉感知启发的手势识别方法[J].载人航天,2017,23(6):805-810. 被引量：2

引证文献4

1董尧尧,曲卫,邱磊.毫米波雷达手势识别综述[J].兵器装备工程学报,2021,42(8):119-125. 被引量：6
2张丞,侯义斌,何坚.高度分层分区的图卷积交警手势识别技术[J].计算机辅助设计与图形学学报,2022,34(7):1037-1046. 被引量：2
3侯莹莹,李建军.基于时空特征融合的动态手势识别[J].内蒙古科技大学学报,2022,41(2):187-193. 被引量：1
4李占利,刘博宇,靳红梅,徐建军.Gabor-C3D手势识别算法[J].计算机工程与设计,2023,44(5):1405-1411.

二级引证文献9

1林云,张祥,黄跃,陈国平.基于Zynq-7000的毫米波雷达数据采集系统设计[J].电子测量技术,2021,44(19):134-138. 被引量：8
2夏燕超,王彦,郭灵.用于人体姿态检测的微波雷达研制[J].南华大学学报（自然科学版）,2022,36(2):49-56. 被引量：1
3刘涛,许可,宋晓骥,李德鑫,万建伟.基于毫米波雷达的“数字信号处理”综合实验[J].电气电子教学学报,2022,44(4):133-136. 被引量：1
4王硕,孙梦轩,杨志晓,王辉,郑戍华.基于涡旋电磁波雷达回波时频图像的动态手势识别[J].火力与指挥控制,2022,47(8):109-115. 被引量：1
5李月琴,张红莉,张维,米雅洁,修丽梅.基于改进CNN的HRRP目标识别方法[J].兵器装备工程学报,2022,43(8):265-274. 被引量：2
6程贝芝,伍鹏,寇静雯,何一鸣,谢凯,盛冠群.结合全局上下文信息的交警手势识别方法[J].中南民族大学学报（自然科学版）,2023,42(3):349-356. 被引量：2
7许云岚,李翔宇.动与静目标双重检测的手势检测方案及硬件设计[J].电讯技术,2023,63(8):1192-1198. 被引量：1
8杜兵,赵骥.基于时空特征融合的交通警察手势识别[J].计算机工程与应用,2024,60(8):250-257. 被引量：1
9方吴逸,陈章进,唐英杰.基于改进YOLOX-tiny算法的交警手势识别[J].电子测量技术,2024,47(8):100-109.

1宋宇颀,牟书江.局部动态模糊图像还原[J].下一代,2020,0(3):0143-0144.
2袁宇丽.基于机器学习和方向模板的遥感图像边缘检测方法[J].内江师范学院学报,2020,35(8):51-55. 被引量：3
3Q.C.Wu,X.S.Wang,B.Chen,H.T.Wu,Z.Y.Shao,张孟怡(译),王萍(译),李悦(译),李万金(校).柔性救援机器人的开发和混合力/位置控制[J].世界地震译丛,2020,51(3):297-314.
4孟光磊,张慧敏,朴海音,梁宵,周铭哲.自动化飞行训练评估中的战机机动动作识别[J].北京航空航天大学学报,2020,46(7):1267-1274. 被引量：12

图学学报

2020年第3期

浏览历史

内容加载中请稍等...

基于长短时记忆和深度神经网络的视觉手势识别技术被引量：4

参考文献5

二级参考文献22

共引文献95

同被引文献27

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于长短时记忆和深度神经网络的视觉手势识别技术 被引量：4

参考文献5

二级参考文献22

共引文献95

同被引文献27

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于长短时记忆和深度神经网络的视觉手势识别技术被引量：4