基于改进YOLOv3的手势实时识别方法被引量：8

Real-time Hand Gesture Recognition Method Based on Improved YOLOv3

下载PDF

导出

摘要针对基于人工建模方式的手势识别方法准确率低、速度慢的问题,提出一种基于改进YOLOv3的静态手势实时识别方法。采用卷积神经网络YOLOv3模型,将通过Kinect设备采集的IR、Registration of RGB、RGB和Depth图像代替常用的RGB图像作为数据集,并融合四类图像的识别结果以提高识别准确率。采用k-means聚类算法对YOLOv3中的初始候选框参数进行优化,从而加快识别速度。在此基础上,利用迁移学习的方法对基础特征提取器进行改进,以缩短模型的训练时间。实验结果表明,该方法对流式视频静态手势的平均识别准确率为99.8%,识别速度高达52 FPS,模型训练时间为12 h,与Faster R-CNN、SSD、YOLOv2等深度学习方法相比,其识别精度更高,识别速度更快。 The hand gesture recognition method based on artificial modeling has many problems such as low accuracy and slow speed.Therefore,this paper proposes a static hand gesture recognition method based on improved YOLOv3.By using the convolutional neural network YOLOv3 model,the commonly used RGB images are replaced by the IR,Registration of RGB,RGB and Depth images collected by Kinect equipment as dataset.The recognition results of these 4 types of images are fused to improve the recognition accuracy.The k-means clustering algorithm is used to optimize the initial candidate frame parameters in YOLOv3,so as to improve the recognition speed.On this basis,the transfer learning is used to improve the basic feature extractor to shorten the training time of the model.Experimental results show that for the recognition of static hand gestures in stream videos,the mean Average Precision(mAP)of the proposed method is 99.8% and the recognition speed is up to 52 FPS.The training time of the proposed model is 12 hours,and its recognition accuracy and speed is better than other deep learning methods such as Faster R-CNN,SSD and YOLOv2.

作者张强张勇刘芝国周文军刘佳慧 ZHANG Qiang;ZHANG Yong;LIU Zhiguo;ZHOU Wenjun;LIU Jiahui(School of Computer Science and Information Engineering,Hefei University of Technology,Hefei 230601,China)

机构地区合肥工业大学计算机与信息学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第3期237-245,253,共10页 Computer Engineering

基金国家自然科学基金(61801162) 国家大学生创新训练项目(201710359020)。

关键词手势识别 YOLOv3模型 Kinect设备聚类算法迁移学习 hand gesture recognition YOLOv3 model Kinect equipment clustering algorithm transfer learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1高喆.多重空间特征融合的手势识别[J].小型微型计算机系统,2016,37(7):1577-1582. 被引量：4
2陈立福,武鸿,崔先亮,郭正华,贾智伟.基于迁移学习的卷积神经网络SAR图像目标识别[J].中国空间科学技术,2018,38(6):45-51. 被引量：17
3董莹莹,邓万宇,刘光达.基于score样本选择的同构域适应迁移学习[J].计算机与数字工程,2019,47(12):2989-2992. 被引量：2
4张勋,陈亮,胡诚,孙韶媛.一种基于深度学习的静态手势实时识别方法[J].现代计算机,2017,23(23):6-11. 被引量：13
5曹洁,赵修龙,王进花.基于RGB-D信息的动态手势识别方法[J].计算机应用研究,2018,35(7):2228-2232. 被引量：9
6王红霞,王坤.基于加锁机制的静态手势识别方法[J].计算机应用,2016,36(7):1959-1964. 被引量：4
7杨纪争,冯筠,卜起荣,王红玉,张晓.一种基于空间角度序列递归模型的动态手势识别算法[J].小型微型计算机系统,2017,38(11):2547-2552. 被引量：3

二级参考文献52

1刘寅,滕晓龙,刘重庆.复杂背景下基于傅立叶描述子的手势识别[J].计算机仿真,2005,22(12):158-161. 被引量：30
2Leap motion [ EB/OL ]. http ://www. leapmotion, com/,2013.
3Stamer T, Pentland A. Real-time American sign language recogni- tion from video using hidden markov models [ M ]. Motion-based Recognition. Springer Netherlands, 1997 : 227-243.
4Corradini A. Dynamic time warping for off-line recognition of small gesture vocabulary[ C]. Proceedings of ICCV Workshop on ,Re.cog- nition,Analysis, and Tracking of Faces and Gestures in Real-time Systems, IEEE,2001 : 82 -89.
5Belongie S,Malik J,Puzicha J. Shape context:a new descriptor for shape matching and object recognition [ C ]. Neural Information Pro- cessing Systems ,2000:2-3.
6Ding Y ,Pang H ,Wu X. Static hand-gesture recognition using HOG and improved LBP features [ J ]. International Journal of Digital Content Technology & its Applications,2011,5 ( 11 ) :236-243.
7Liu L, Xing J, Ai H, et al. Hand posture recognition using finger ge- ometric feature [ C ]. Proceeding of 21st International Conference on. Pattern Recognition ( ICPR ), IEEE,2012:565 -568.
8Dalal N, Triggs B. Histograms of oriented gradients for human de- tection [ C ]. IEEE Computer Society Conference on, Computer Vi- sion and Pattern Recognition, IEEE, 2005,1 : 886-893.
9Rahrnani H,Mahmood A, Huynh D Q, et al. HOPC :histogram of o- riented principal components of 3D pointclouds for action recogni- tion [ M ]. Computer Vision-ECCV 2014, Springer International Publishing, 2014 : 742 -757.
10Kinect [ EB/OL ]. http ://www. xbox. com/en-US/kinect/,2011.

共引文献45

1万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：62
2王民,石新源,王稚慧,李泽洋.基于Vibe和时空上下文的运动手势跟踪算法[J].液晶与显示,2018,33(1):92-98. 被引量：7
3肖瑜.多媒体视觉图像运动轨迹标识仿真研究[J].计算机仿真,2018,35(10):242-245. 被引量：1
4陈甜甜,姚璜,左明章,田元,杨梦婷.基于深度信息的动态手势识别综述[J].计算机科学,2018,45(12):42-51. 被引量：12
5王月娇,马钟,杨一岱,王竹平,唐磊.基于深度增强学习的卫星姿态控制方法[J].中国空间科学技术,2019,39(4):36-42. 被引量：4
6周晓华.基于深度学习BCCM模型的网上用户画像识别分析[J].计算机与数字工程,2019,47(9):2176-2179. 被引量：2
7杨鲁义.基于大数据的虚拟实验室手势交互感知仿真[J].计算机仿真,2019,36(10):169-172. 被引量：4
8张骞.浅析深度学习算法在服装推荐系统中的应用[J].数码世界,2019,0(8):125-125. 被引量：2
9沈雅婷.基于深度学习的手势识别研究[J].软件导刊,2019,18(11):25-29. 被引量：4
10梁智杰,廖盛斌.融合宽残差和长短时记忆网络的动态手势识别研究[J].计算机应用研究,2019,36(12):3846-3852. 被引量：4

同被引文献65

1谢晓燕,赵欢,蒋林.基于视频数据特性的动态手势识别[J].北京邮电大学学报,2020(5):91-97. 被引量：3
2王千,王成,冯振元,叶金凤.K-means聚类算法研究综述[J].电子设计工程,2012,20(7):21-24. 被引量：306
3胡章芳,杨麟,罗元,张毅.一种基于改进的SURF算法的静态手语字母识别方法[J].重庆邮电大学学报（自然科学版）,2013,25(4):544-548. 被引量：5
4许宏科,秦严严,陈会茹.一种基于改进Canny的边缘检测算法[J].红外技术,2014,36(3):210-214. 被引量：161
5吕蕾,张金玲,朱英杰,刘弘.一种基于数据手套的静态手势识别方法[J].计算机辅助设计与图形学学报,2015,27(12):2410-2418. 被引量：48
6林海波,王圣彬,张毅.基于改进深度信息的手势分割与定位[J].计算机应用,2017,37(1):251-254. 被引量：9
7桑农,倪子涵.复杂场景下基于R-FCN的手势识别[J].华中科技大学学报（自然科学版）,2017,45(10):54-58. 被引量：11
8魏湧明,全吉成,侯宇青阳.基于YOLOv2的无人机航拍图像定位研究[J].激光与光电子学进展,2017,54(11):95-104. 被引量：58
9杨红玲,宣士斌,梁竣程,赵洪,莫愿斌.基于肤色检测与卷积神经网络的手势识别[J].微型机与应用,2017,36(22):58-61. 被引量：9
10文芳,康彩琴,陈立文,丁汇,徐琨,王宁宁.基于RGBD数据的静态手势识别[J].计算机与现代化,2018(1):74-77. 被引量：7

引证文献8

1徐点点.基于无人机的水上辅助救援系统研究[J].技术与市场,2020,27(11):87-88. 被引量：2
2柏丽银,彭亚雄,陆安江,余圣新,张旭.复杂背景下基于卷积神经网络的手势识别[J].计算机工程与设计,2020,41(11):3199-3203. 被引量：7
3周思昀,施水才.面向网页交互场景下的手势识别改进算法研究[J].通信技术,2021,54(4):1028-1034.
4刘朔,谷玉海,饶文军,王菊远.基于优化YOLOv3算法的违章车辆检测方法[J].重庆理工大学学报（自然科学）,2021,35(4):135-141. 被引量：4
5苏静,刘兆峰,王嫄,冯柯翔,王晓薇.基于改进的YOLOv3实现手势识别的人机交互方法[J].天津科技大学学报,2021,36(6):49-54. 被引量：2
6胡宗承,周亚同,史宝军,何昊.结合注意力机制与特征融合的静态手势识别算法[J].计算机工程,2022,48(4):240-246. 被引量：8
7李泰国,张英志,张天策,陈小强.基于改进YOLOv5s算法的列车驾驶员手势识别[J].铁道学报,2023,45(1):75-83. 被引量：8
8陈帅,袁宇浩.改进Yolov5的手语字母识别算法研究[J].小型微型计算机系统,2023,44(4):838-844. 被引量：6

二级引证文献36

1赵鸿图,李豪,梁梦华.复杂背景下多特征结合的深度学习手势识别[J].电子测量技术,2023,46(23):77-84.
2谢金龙,胡勇.基于深度学习的车辆检测与跟踪系统[J].工业控制计算机,2020,33(7):99-101. 被引量：4
3周思昀,施水才.面向网页交互场景下的手势识别改进算法研究[J].通信技术,2021,54(4):1028-1034.
4王学慧,赵跃鹏,王嘉炜,李振,田秋红.小波变换低频信息与Xception网络的静态手势识别[J].软件导刊,2021,20(8):12-19. 被引量：1
5杨艳红,钟宝江,徐云龙.改进的SSD算法在智慧交通中的应用[J].电讯技术,2022,62(2):259-265. 被引量：6
6陈耀祖,谷玉海,成霞,徐小力.基于优化YOLOv4算法的行驶车辆要素检测方法[J].应用光学,2022,43(2):248-256. 被引量：9
7颜超,穆平安.复杂背景下的静态手势识别研究[J].软件导刊,2022,21(8):171-176.
8刘继兴,周昕,张帅峰,曾令辉,段珍灵,沈顺权.基于人工智能的手语翻译系统实现[J].科技创新与应用,2022,12(23):41-43. 被引量：3
9吴晓军.基于时空图卷积神经网络的网球底线正手击球动作识别方法[J].河北北方学院学报（自然科学版）,2022,38(9):14-20. 被引量：2
10武东辉,许静,陈继斌,孙彦玺,仇森.基于融合注意力机制与CNN-LSTM的人体行为识别算法[J].科学技术与工程,2023,23(2):681-689. 被引量：10

1上海电气——全力做好疫情防控物资保障[J].电器工业,2020(2):27-27.
2梁志剑,谢红宇,安卫钢.基于BiGRU和贝叶斯分类器的文本分类[J].计算机工程与设计,2020,41(2):381-385. 被引量：14
3严竞新,殷小庆,陈骏,马聪丽.自然资源调查与监测标准现状分析[J].测绘标准化,2019,35(4):1-4. 被引量：12
4肖静华,李文韬.智能制造对企业战略变革与创新的影响——资源基础变革视角的探析[J].财经问题研究,2020,0(2):38-46. 被引量：36
5吴慧诗,程良伦,陈仿雄.基于显著性融合的细粒度图像分类方法研究[J].计算机科学与应用,2019,9(12):2218-2230.
6陈家璘,孙俊,贺易,张锦华,杨硕,赵世文.基于数据挖掘算法的通信领域故障信号识别性能分析[J].电子测量技术,2019,42(23):179-183. 被引量：3
7李曾婷.电取暖产品挥发物释放情况研讨会召开[J].电器,2020,0(1):35-35.
8林琳.浅谈CT扫描技术扫描方法与适用症[J].医学研究,2019,1(4):213-213.
9吴冬梅,卢静,蒋瑜.基于双通道C3D的基建现场人体异常行为识别[J].信息技术与信息化,2020(1):28-31. 被引量：2
10李冰,刘俊.基于改进YOLO的发电厂巡检图像识别[J].新一代信息技术,2019,2(20):7-13. 被引量：1

计算机工程

2020年第3期

浏览历史

内容加载中请稍等...

基于改进YOLOv3的手势实时识别方法被引量：8

参考文献7

二级参考文献52

共引文献45

同被引文献65

引证文献8

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于改进YOLOv3的手势实时识别方法 被引量：8

参考文献7

二级参考文献52

共引文献45

同被引文献65

引证文献8

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于改进YOLOv3的手势实时识别方法被引量：8