多模态数据融合的加工作业动态手势识别方法

Dynamic Gesture Recognition Method for Machining Operations Based on Multi-modal Data Fusion

下载PDF

导出

摘要为了解决单模态数据所提供的特征信息缺乏而导致的识别准确率难以提高、模型鲁棒性较低等问题,提出了面向人机交互的加工作业多模态数据融合动态手势识别策略。首先,采用C3D网络模型并在视频的空间维度和时间维度对深度图像和彩色图像两种模态数据进行特征提取;其次,将两种模态数据识别结果在决策层按最大值规则进行融合,同时,将原模型使用的Relu激活函数替换为Mish激活函数优化梯度特性;最后,通过3组对比实验得到6种动态手势的平均识别准确率为96.8%。结果表明:所提方法实现了加工作业中动态手势识别的高准确率和高鲁棒性的目标,对人机交互技术在实际生产场景中的应用起到推动作用。 In order to solve the problem of difficulty in improving the recognition accuray and the low robustness of the model caused by the lack of feature information provided by single mode data,a dynamic gesture recognition strategy based on multi-modal data fusion of machining operations for human-computer interaction was proposed.Firstly,the C3D network model was used to extract features from the depth image and color image modal data based on the spatial and temporal dimensions of videos.Secondly,the recognition results of the two modal data were fused according to the maximum principle at the decision-making level.Meanwhile,the Relu activation function used in the original model was replaced by Mish activation function to optimize the gradient update effect.Finally,through three sets of comparative experiments,it was found that the average recognition accuracy of six dynamic gestures reached 96.8%.The results showed that the proposed method achieved the goal of high accuracy and high robustness of dynamic gesture recognition in machining operation,which would play a role in promoting the application of human-computer interaction technology in actual production scenes.

作者张富强曾夏白筠妍丁凯 ZHANG Fuqiang;ZENG Xia;BAI Junyan;DING Kai(Key Laboratory of Road Construction Technology and Equipment of MOE,Chang'an University,Xi'an 710064,China;Institute of Smart Manufacturing Systems,Chang'an University,Xi'an 710064,China)

机构地区长安大学道路施工技术与装备教育部重点实验室长安大学智能制造系统研究所

出处《郑州大学学报（工学版）》 CAS 北大核心 2024年第5期30-36,共7页 Journal of Zhengzhou University（Engineering Science）

基金国家重点研发计划项目(2021YFB3301702) 陕西省科技重大专项(2018zdzx01-01-01)。

关键词多模态数据融合加工作业动态手势识别 C3D Mish激活函数人机交互 multi-modal data fusion machining operation dynamic gesture recognition C3D Mish activation function human-computer interaction

分类号 TH166 [机械工程—机械制造及自动化]

引文网络
相关文献

参考文献6

1李浩,刘根,文笑雨,王昊琪,张玉彦,李客,马文锋,孙春亚,罗国富,黄荣杰.面向人机交互的数字孪生系统工业安全控制体系与关键技术[J].计算机集成制造系统,2021,27(2):374-389. 被引量：34
2彭金柱,董梦超,杨扬.基于视觉和肌电信息融合的手势识别方法[J].郑州大学学报（工学版）,2021,42(2):67-73. 被引量：4
3李浩,杨森林,张晓丽.基于机器视觉的火车驾驶员动态手势识别方法[J].传感器与微系统,2021,40(2):34-37. 被引量：11
4Muneeb Ur Rehman,Fawad Ahmed,Muhammad Attique Khan,Usman Tariq,Faisal Abdulaziz Alfouzan,Nouf M.Alzahrani,Jawad Ahmad.Dynamic Hand Gesture Recognition Using 3D-CNN and LSTM Networks[J].Computers, Materials & Continua,2022(3):4675-4690. 被引量：3
5谷学静,周自朋,郭宇承,李晓刚.基于CNN-LSTM混合模型的动态手势识别方法[J].计算机应用与软件,2021,38(11):205-209. 被引量：12
6刘杰,王月,田明.多尺度时空特征融合的动态手势识别网络[J].电子与信息学报,2023,45(7):2614-2622. 被引量：1

二级参考文献60

1任彧,顾成成.基于HOG特征和SVM的手势识别[J].科技通报,2011,27(2):211-214. 被引量：49
2张启忠,席旭刚,罗志增.基于非线性特征的表面肌电信号模式识别方法[J].电子与信息学报,2013,35(9):2054-2058. 被引量：14
3陈国良,葛凯凯,李聪浩.基于多特征HMM融合的复杂动态手势识别[J].华中科技大学学报（自然科学版）,2018,46(12):42-47. 被引量：12
4李东洁,李君祥,张越,曾禛.基于PSO改进的BP神经网络数据手套手势识别[J].电机与控制学报,2014,18(8):87-93. 被引量：22
5战荫伟,张昊.基于Kinect传感器的人体行为分析算法[J].传感器与微系统,2015,34(1):142-144. 被引量：12
6Qi-rong MAO,Xin-yu PAN,Yong-zhao ZHAN,Xiang-jun SHEN.Using Kinect for real-time emotion recognition via facial expressions[J].Frontiers of Information Technology & Electronic Engineering,2015,16(4):272-282. 被引量：4
7刘淑萍,刘羽,於俊,汪增福.结合手指检测和HOG特征的分层静态手势识别[J].中国图象图形学报,2015,20(6):781-788. 被引量：27
8吕蕾,张金玲,朱英杰,刘弘.一种基于数据手套的静态手势识别方法[J].计算机辅助设计与图形学学报,2015,27(12):2410-2418. 被引量：48
9薛俊韬,纵蕴瑞,杨正瓴.基于改进的YCbCr空间及多特征融合的手势识别[J].计算机应用与软件,2016,33(1):151-155. 被引量：14
10李彬,罗彪.机器视觉在物体位姿检测中的应用[J].传感器与微系统,2016,35(2):150-153. 被引量：23

共引文献59

1田宝雄.煤炭列车车况智能监测研究应用[J].洁净煤技术,2023,29(S01):159-163.
2Zhang Qinglei,Yang Zhiwei,Duan Jianguo,Liu Zhen,Qin Jiyun.Three-dimensional visualization interactive system for digital twin workshop[J].Journal of Southeast University(English Edition),2021,37(2):137-152. 被引量：6
3孙冬.基于无人机控制和最优视图视选择的动作捕捉方法[J].传感器与微系统,2021,40(10):51-55. 被引量：3
4刘畅.态势感知技术在智慧电厂工控安全方面的应用研究[J].网络安全技术与应用,2021(10):141-143.
5王超,鲁效平,孙明,景大智,于晓义,江民圣.数字孪生在洗衣机内筒生产线中的应用与探索[J].工业控制计算机,2021,34(12):20-22.
6李浩,王昊琪,刘根,王军令,Steve Evans,李琳利,王晓丛,Shuai Zhang,文笑雨,聂福全,王新昌,郝兵,姜伟,刘永光.工业数字孪生系统的概念、系统结构与运行模式[J].计算机集成制造系统,2021,27(12):3373-3390. 被引量：38
7陈艺海,黎莲花,谢昊璋,卢思琪,董晋瑜.基于机器视觉的垃圾分拣机器人[J].仪器仪表与分析监测,2022(1):30-35. 被引量：4
8李琳利,顾复,李浩,顾新建,罗国富,武志强,刚轶金.仿生视角的数字孪生系统信息安全框架及技术[J].浙江大学学报（工学版）,2022,56(3):419-435. 被引量：12
9李志金.智慧电厂数字孪生体系架构研究及应用[J].电力大数据,2022,25(1):35-42. 被引量：6
10吴雨川,钮雨欢,李唯.Kinect体感技术在人体下肢康复训练系统的应用研究[J].现代电子技术,2022,45(12):165-172. 被引量：1

1顾亮,于莲芝.基于DSConvBiGRU网络和热电堆阵列的动态手势识别方法[J].计量学报,2024,45(6):795-805.
2李得娟.企业财务风险防控及其策略的研究[J].当代会计,2024(11):31-33.
3王世坤,辛雷,杨晨,顾雪宋.基于因子回归分析研究影响棒球击球机械能的下肢生物力学因素[J].医用生物力学,2024,39(4):593-599.
4张达鑫,赵克斌,周焕明,张鹏飞.钢铁生产安全数字化管控方法及系统设计[J].数字技术与应用,2024,42(5):166-168.
5查曙光,王士龙,裴文杰,黄志来.分级梯度蜂窝结构的面内压溃行为[J].塑性工程学报,2024,31(8):240-253.
6陈奕希.仔猪黄白痢常见防控方案及注意事项[J].养猪,2024(4):54-56.
7张倩倩,唐卓思,何潇潇,张晓玫.“蹭热点”式转型路:企业热点信息披露与高质量创新[J].财贸经济,2024,45(8):137-153.
8周丽,陈蓓蓓,王秀娣,陈洁.基于SOC模式健康管理联合生物电刺激对初产妇产后自我效能和盆底肌康复的影响[J].中国妇幼保健,2024,39(15):2944-2948.

郑州大学学报（工学版）

2024年第5期

浏览历史

内容加载中请稍等...

多模态数据融合的加工作业动态手势识别方法

参考文献6

二级参考文献60

共引文献59

相关作者

相关机构

相关主题

浏览历史