多尺度卷积特征融合的SSD手势识别算法被引量：7

SSD Gesture Recognition Algorithm with Multi-scale Convolution Feature Fusion

下载PDF

导出

摘要为了提高对中小占比手势识别的准确性与稳定性,提出了一种多尺度卷积特征融合的SSD(single shot multibox detector)手势识别方法。该方法突出表现在两大方面,其一,在原始的SSD算法的多尺度卷积检测方法基础上,引入了不同卷积层的特征融合思想,经过空洞卷积下采样操作与反卷积上采样操作,实现网络结构中的浅层视觉卷积层与深层语义卷积层的融合,代替原有的卷积层用于手势识别,以提高模型对中小目标手势的识别精度;其二,为了解决正负样本不均衡导致分类性能差的问题,提出一种改进的损失函数,以提升模型对目标手势的分类能力。在手势识别公开的数据集上的实验结果表明,与SSD和Faster R-CNN等识别方法相比,能够在保持较高的手势检测精度的同时,又具有较好的鲁棒性与检测速度。 To improve the accuracy and stability of small-medium proportion gesture recognition,SSD(single shot multibox detector)gesture recognition algorithm with multi-scale convolution feature fusion is proposed.Two aspects are highlighted in this method.On the one hand,based on the multi-scale convolution detection method of the original SSD algorithm,the feature fusion mechanism of different classification layers is introduced.Through the dilated convolution down sampling operation and the deconvolution up sampling operation,the shallow visual feature layer and the deep semantic feature layer in the network structure are organically combined to replace the original convolution layer for gesture recognition to improve the semantic representation ability of the model.On the other hand,to solve the problem of poor classification performance caused by imbalance of positive and negative samples,an improved loss function is proposed.Experiments on the open data set of gesture recognition show that compared with SSD,Faster R-CNN and other recognition methods,the proposed method has better robustness and detection speed while maintaining higher gesture detection accuracy.

作者谢淋东仲志丹乔栋豪高辛洪 XIE Lin-dong;ZHONG Zhi-dan;QIAO Dong-hao;GAO Xin-hong(School of Mechanical and Electrical Engineering,Henan University of Science&Technology,Luoyang 471003,China)

机构地区河南科技大学机电工程学院

出处《计算机技术与发展》 2021年第3期100-105,共6页 Computer Technology and Development

基金国家重点研发计划(2018YFB1701205) 国家级大学生创新创业训练项目(201910464002)。

关键词多尺度卷积特征中小占比手势空洞卷积反卷积特征融合改进的损失函数 multi-scale convolution features small-medium proportion gesture dilated convolution deconvolution feature fusion improved loss function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1易靖国,程江华,库锡树.视觉手势识别综述[J].计算机科学,2016,43(S1):103-108. 被引量：62
2方路平,何杭江,周国民.目标检测算法研究综述[J].计算机工程与应用,2018,54(13):11-18. 被引量：108
3王丽光,张根源,刘子龙.基于单目视觉的实时手语识别系统设计与实现[J].电子科技,2017,30(3):130-133. 被引量：6
4卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：531
5温捷文,战荫伟,李楚宏,卢剑彪.一种加强SSD小目标检测能力的Atrous滤波器设计[J].计算机应用研究,2019,36(3):861-865. 被引量：16
6唐聪,凌永顺,郑科栋,杨星,郑超,杨华,金伟.基于深度学习的多视窗SSD目标检测方法[J].红外与激光工程,2018,47(1):290-298. 被引量：82
7陈卓,任久春,朱谦.基于梯度下降的自适应姿态融合算法[J].传感器与微系统,2019,38(3):124-126. 被引量：9
8朱汇龙,刘晓燕,刘瑶.基于贝叶斯新型深度学习超参数优化的研究[J].数据通信,2019(2):35-38. 被引量：6
9王振,师韵,李玉彬.基于改进全卷积神经网络的玉米叶片病斑分割[J].计算机工程与应用,2019,55(22):127-132. 被引量：14

二级参考文献91

1李连仲,王小虎,蔡述江.捷联惯性导航、制导系统中方向余弦矩阵的递推算法[J].宇航学报,2006,27(3):349-353. 被引量：17
2陈文.基于加速度传感器的智能终端手势识别关键技术研究[D].国防科学技术大学2011
3Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60 (2) 91 110.
4Dalai N, Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition (CVPR), IEEE Computer Society Conference on. San Diego, USA: IEEE, 2005, 1 886-893.
5Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786) : 504-507.
6Hubel D H, Wiesel T N. Receptive fields, binocular interaction and functional architecture in the catrs visual cortex[J]. The Journal of Physiology, 1962, 160(1): 106-154.
7Fukushima K, Miyake S. Neocognitron: A new algorithm for pattern recognition tolerant of deformations and shifts in posi- tion[J]. Pattern Recognition, 1982, 15(6): 455-469.
8Ruck D W, Rogers S K, Kabrisky M. Feature selection using a multilayer perceptron[J]. Journal of Neural Network Com- puting, 1990, 2(2): 40-48.
9Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[J]. Nature, 1986,3231 533 538.
10LeCun Y, Denker J S, Henderson D, et al. Handwritten digit recognition with a back-propagation network[C]//Advances in Neural Information Processing Systems. Colorado, USA Is. n. ], 1990: 396-404.

共引文献816

1周晓,焦晨,朱开瑄.基于卷积神经网络的废旧塑料瓶颜色分拣系统[J].数字制造科学,2021(3):227-232. 被引量：3
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3程淑红,程彦龙,杨镇豪.基于手势多特征融合及优化Multiclass-SVC的手势识别[J].仪器仪表学报,2020(6):225-232. 被引量：13
4吴丽娟,任海清,关贵明,梁岱立,黄尧.基于人脸姿态识别的课堂学习状态反馈系统的设计与实现[J].沈阳师范大学学报（自然科学版）,2022,40(2):127-132. 被引量：2
5杨全.关于高校计算机视觉课程教学的思考[J].计算机产品与流通,2020,9(9):172-172.
6王君至,张忠山,沈大勇,黄静波,王沛,闫俊刚.基于YOLOv3的人员照片标识识别算法研究[J].网络安全与数据治理,2023,42(S01):221-225.
7傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：51
8夏敏,赵旭东,费琦琪,孙鹏,杨琳琳.基于计算机视觉技术的天麻分选装置设计[J].农机化研究,2020,42(9):104-108.
9范慧鹏,闪恒杰,房哲续,郭江川.用于故障诊断的深度学习分类模型及方法[J].河南电力,2023(S01):51-55. 被引量：1
10杨耿,张业明,侯金利,刘咏炫,鲁骏,周靖.高速公路图像识别技术应用探析[J].中国交通信息化,2022(S01):294-298. 被引量：1

同被引文献73

1陈思佳,罗志增.基于长短时记忆和卷积神经网络的手势肌电识别研究[J].仪器仪表学报,2021,42(2):162-170. 被引量：25
2程淑红,程彦龙,杨镇豪.基于手势多特征融合及优化Multiclass-SVC的手势识别[J].仪器仪表学报,2020(6):225-232. 被引量：13
3陈兆凡,赵春阳,李博.一种改进IoU损失的边框回归损失函数[J].计算机应用研究,2020,37(S02):293-296. 被引量：17
4冯志全,蒋彦.手势识别研究综述[J].济南大学学报（自然科学版）,2013,27(4):336-341. 被引量：29
5李振龙,彭亚雄.基于3D反向动力学IK算法的研究[J].微型机与应用,2013,32(24):34-36. 被引量：4
6蔡昭权.C#和C++数据传递的研究与实现[J].计算机应用与软件,2009,26(3):145-146. 被引量：5
7武汇岳,张凤军,刘玉进,戴国忠.基于视觉的手势界面关键技术研究[J].计算机学报,2009,32(10):2030-2041. 被引量：18
8谭昶,肖南峰.基于改进RCE和RBF神经网络的静态手势识别[J].计算机工程与应用,2011,47(7):172-176. 被引量：16
9胡章芳,杨麟,罗元,张毅.一种基于改进的SURF算法的静态手语字母识别方法[J].重庆邮电大学学报（自然科学版）,2013,25(4):544-548. 被引量：5
10俞博,陈永强,王双一,张文龙,黄颖姝.基于手指角度特征的静态手势识别算法[J].西华大学学报（自然科学版）,2014,33(1):69-71. 被引量：10

引证文献7

1洪期望,李捍东.基于支持向量机的手势识别研究[J].微处理机,2022,43(2):47-50. 被引量：7
2张娜,罗源,包晓安,金瑜婷,涂小妹.基于改进Cascade RCNN网络的X光安检违禁品检测[J].计算机系统应用,2022,31(7):224-230. 被引量：1
3牛雅睿,武一,孙昆,卢昊,赵普.基于轻量级卷积神经网络的手势识别检测[J].电子测量技术,2022,45(4):91-98. 被引量：7
4楚康波,牛芳琳.基于注意力机制和MobileNet的手势识别算法研究[J].电脑知识与技术,2022,18(29):4-7.
5潘格,许有熊,刘晓锋.基于改进YOLO v5的手语字母语的识别方法[J].南京工程学院学报（自然科学版）,2023,21(1):27-32.
6武胜,徐臻,秦浩东.增强现实手势交互设计与实现[J].智能物联技术,2023,55(1):5-13.
7边宝丽.基于手势识别的幼儿游戏机器系统设计[J].自动化与仪器仪表,2024(3):171-174.

二级引证文献14

1赵鸿图,李豪,梁梦华.复杂背景下多特征结合的深度学习手势识别[J].电子测量技术,2023,46(23):77-84.
2王雪婷,张烨菲,张显飞,赵治栋.基于单导联的心电信号身份识别技术[J].通信技术,2022,55(5):625-633. 被引量：1
3王思霖.一种基于图像处理的手部轮廓提取方法[J].信息记录材料,2022,23(7):40-42.
4崔悦,张德育,王国杰.基于F-Faster-RCNN算法的摔倒检测研究[J].沈阳理工大学学报,2023,42(1):1-6.
5杨诒斌,王俊强,柴世豪.基于CNN的智慧农场图像分类方法[J].电子技术应用,2023,49(4):33-38.
6张银,佟乐.基于改进Cascade R-CNN的织物瑕疵检测方法[J].上海师范大学学报（自然科学版）,2023,52(2):231-237. 被引量：1
7韩团军,马晨,王战备,尹继武.基于视觉的手指语识别系统设计[J].实验技术与管理,2023,40(4):119-124. 被引量：1
8卞雨玮,华立涛,周媛.基于对比学习的信息缺失手势识别新方法[J].电子测量技术,2023,46(7):180-186. 被引量：1
9梁堃,胡昀.基于改进卷积网络的葡萄剪枝关键算法研究[J].自动化与仪器仪表,2023(6):58-62.
10刘晓光,张明进,王嘉威,梁铁,李俊,刘秀玲.Grael脑电放大器与深度学习的手势实时识别研究[J].电子测量技术,2023,46(8):7-13.

1吴秀菊,吴垠莎.从“谓+名主”结构探讨湘西苗语词法与句法的关系[J].凯里学院学报,2020,38(5):53-59.

计算机技术与发展

2021年第3期

浏览历史

内容加载中请稍等...

多尺度卷积特征融合的SSD手势识别算法被引量：7

参考文献9

二级参考文献91

共引文献816

同被引文献73

引证文献7

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

多尺度卷积特征融合的SSD手势识别算法 被引量：7

参考文献9

二级参考文献91

共引文献816

同被引文献73

引证文献7

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

多尺度卷积特征融合的SSD手势识别算法被引量：7