基于改进的YOLOv3实现手势识别的人机交互方法被引量：2

Human-Computer Interaction Method for Gesture Recognition Based on Improved YOLOv3

下载PDF

导出

摘要随着人工智能技术的飞速发展,人机交互方法也发生了巨大的变化.鉴于目前主要的人机交互方式仍是使用键盘、鼠标和触控板组合的传统交互方式,本文提出一种基于改进的YOLOv3实现手势识别的人机交互方法,通过Kmeans对标签的边界框进行聚类,然后运用Mosaic数据增强丰富小目标,最后采用自定义最小化边界框中心点距离的GCDIoU损失函数优化模型参数.在自建数据集上进行实验验证,该模型针对手势小目标的检测准确率达到98.87%,召回率达到99.98%.结果表明,Mosaic数据增强应用于小目标检测具有很好的效果,而GCDIoU损失函数则加快了模型的收敛. With the rapid development of artificial intelligence technology,human-computer interaction has also undergone tremendous changes.In view of the fact that most people are still using the traditional interaction method of keyboard,mouse and touchpad,in this article we propose a method of real-time gesture recognition and human-computer interaction based on the improved YOLOv3.Specifically,the bounding box of the label was first clustered through K-means.Then the small targets were enriched by Mosaic data enhancement,and finally the GCDIoU loss function that minimizes the distance between the center points of the bounding box was used.Through the above methods,the final model's detection accuracy for small gesture targets reached 98.87%,and the recall rate reached 99.98%.Therefore,Mosaic data enhancement has a good effect when applied to small target detection,while GCDIoU loss function speeds up the convergence of the model,and the effect is better.

作者苏静刘兆峰王嫄冯柯翔王晓薇 SU Jing;LIU Zhaofeng;WANG Yuan;FENG Kexiang;WANG Xiaowei(College of Artificial Intelligence,Tianjin University of Science&Technology,Tianjin 300457,China)

机构地区天津科技大学人工智能学院

出处《天津科技大学学报》 CAS 2021年第6期49-54,共6页 Journal of Tianjin University of Science & Technology

基金天津科技大学创新创业训练计划项目(202010057204)。

关键词人工智能人机交互手势识别 YOLOv3 artificial intelligence human-computer interaction gesture recognition YOLOv3

分类号 TP391.7 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张强,张勇,刘芝国,周文军,刘佳慧.基于改进YOLOv3的手势实时识别方法[J].计算机工程,2020,46(3):237-245. 被引量：8
2王千,王成,冯振元,叶金凤.K-means聚类算法研究综述[J].电子设计工程,2012,20(7):21-24. 被引量：306

二级参考文献19

1Anil K J. Data clustering:50 years beyond K-Means[J].Pattern Recognition Letters,2010,(08):651-666.
2Likas A,Vlassis M,Verbeek J. The global K-means clustering algorithm[J].Pattern Recognition,2003,(02):451-461.doi:10.1016/S0031-3203(02)00060-2.
3Selim S Z,Al-Sultan K S. Analysis of global K-means,an incremental heuristic for minimum sum-of-squares clustering[J].Journal of Classification,2005,(22):287-310.
4Bellman R,Dreyfus S. Applied dynamic programming[M].Princeton,New Jersey:Princeton University Press,1962.
5Aloise D,Deshpande A,Hansen P. NP-hardness of euclidean sum-of-squares clustering[J].Machine Learning,2009,(02):245-248.
6Mahajan M,Nimbor P,Varadarajan K. The planar K-means problem is NP-hard[J].Lecture Notes in Computer Science,2009,(5431):274-285.
7Ball G,Hall D. ISODATA,a novel method of data analysis and pattern classification[Technical rept. NTIS AD 699616. ][M].California:Stanford Research Institute,1965.
8WANG Cheng,LI Jiao-jiao,BAI Jun-qing. Max-Min K- means Clustering Algorithm and Application in Post-processing of Scientific Computing[A].Napoli,2011.7-9.
9Pena J M,Lozano J A,Larranaga P. An empirical comparison of four initialization methods for the K-means algorithm[J].Pattern Recognition Letters,1999,(20):1027-1040.doi:10.1016/S0167-8655(99)00069-0.
10Lai J Z C,Tsung-Jen H. Fast global K-means clustering using cluster membership and inequality[J].Pattern Recogni- tion,2010,(43):1954-1963.

共引文献312

1马燕,余海军,钟发生,刘丰林.基于残差编解码网络的CT图像金属伪影校正[J].仪器仪表学报,2020,41(8):160-169. 被引量：17
2谢皓,孙小东,何海熙.基于K-means聚类的高炉操作炉型研究[J].冶金自动化,2023,47(S01):88-91.
3高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
4赵源,王越,胡华.基于POI-K-means地铁车站聚类方法研究[J].智能计算机与应用,2022,12(5):114-118. 被引量：5
5Kui Luo,Wenhui Shi,Weisheng Wang.Extreme scenario extraction of a grid with large scale wind power integration by combined entropy-weighted clustering method[J].Global Energy Interconnection,2020,3(2):140-148. 被引量：8
6郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
7单冬红,李玮瑶.基于约束性过滤的改进K均值挖掘算法研究[J].科技通报,2013,29(4):171-173. 被引量：4
8刘寒梅,张鹏.基于模拟退火算法对K-means聚类算法的优化[J].中国西部科技,2013,12(6):23-24. 被引量：2
9李欢,廖利.基于模糊能量自学习的汽车发动机传感器节点故障诊断方法研究[J].科技通报,2013,29(6):86-88. 被引量：1
10余文礼.基于聚类分析和贪心算法的文件碎片拼接复原[J].电子世界,2014(11):183-183.

同被引文献21

1刘寒.VR高维度数据可视化前导认知教学平台的构建[J].山西财经大学学报,2022,44(S02):134-136. 被引量：2
2刘力夫,李玮.新工科背景下工业设计专业实验教学研究[J].机械设计,2020,37(S02):296-298. 被引量：4
3娄泽华,殷继彬.人机交互中的手势设计原则分析[J].软件导刊,2018,17(4):19-24. 被引量：6
4任重庚,沈捷,王莉,蔡鑫.基于Kinect骨骼数据的手势识别[J].计算机工程与设计,2019,40(5):1440-1444. 被引量：11
5刘瑜兴,王淑侠,徐光耀,兰望桂,何卫平.基于Leap Motion的三维手势交互系统研究[J].图学学报,2019,40(3):556-564. 被引量：14
6宋一凡,张鹏,刘立波.基于视觉手势识别的人机交互系统[J].计算机科学,2019,46(S11):570-574. 被引量：38
7高宇,何小海,吴晓红,王正勇,张豫堃.基于Leap Motion的动态手势识别方法[J].计算机系统应用,2019,28(11):208-212. 被引量：6
8马超民,赵丹华,辛灏.基于用户体验的智能装备人机交互界面设计[J].计算机集成制造系统,2020,26(10):2650-2660. 被引量：47
9刘璇恒,邓宝松,裴育,范博辉,谢良,闫野,印二威.穿戴式手势交互系统与识别算法研究[J].小型微型计算机系统,2020,41(11):2241-2248. 被引量：11
10张弼,姚杰,赵新刚,谈晓伟.一种基于肌电信号的自适应人机交互控制方法[J].控制理论与应用,2020,37(12):2560-2570. 被引量：7

引证文献2

1柯健,张量.用于虚拟现实/增强现实人机交互的实时手势识别方法的研究[J].现代计算机,2023,29(1):59-62. 被引量：3
2程鹏飞.基于Web的电工实训仿真教学平台构建[J].物联网技术,2023,13(11):133-135. 被引量：3

二级引证文献6

1丁盛,姜华.基于电容传感器的手势识别装置设计与开发[J].科技创新与应用,2023,13(36):107-110.
2祝智颖,周伟辉.虚拟现实中的人机自然交互技术[J].移动信息,2023,45(12):162-164.
3姚园.基于物联网技术的中职会计混合教学仿真实训平台设计及应用[J].信息与电脑,2024,36(6):227-229.
4汤云雄,汤浩然,何小英.不同情景下高效手势识别系统设计[J].云南师范大学学报（自然科学版）,2024,44(3):45-47.
5尉哲铭,李智威,郭佩灿,李羽佳,李艳龙,林星全.基于教学导向的数控机床数字孪生模型设计[J].Design（汉斯）,2024,9(3):1045-1053.
6李灿丽.LABVIEW在电工实训教学中的应用[J].电子技术（上海）,2024,53(6):398-400.

1刘怡帆,王旭飞,周鹏,谭飞,焦登宁.基于YOLOv4神经网络的红外图像道路行人检测[J].数字技术与应用,2021,39(10):19-22. 被引量：3
2程瑞洲,黄攀峰,刘正雄,鹿振宇.一种面向在轨服务的空间遥操作人机交互方法[J].宇航学报,2021,42(9):1187-1196. 被引量：6

天津科技大学学报

2021年第6期

浏览历史

内容加载中请稍等...

基于改进的YOLOv3实现手势识别的人机交互方法被引量：2

参考文献2

二级参考文献19

共引文献312

同被引文献21

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于改进的YOLOv3实现手势识别的人机交互方法 被引量：2

参考文献2

二级参考文献19

共引文献312

同被引文献21

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于改进的YOLOv3实现手势识别的人机交互方法被引量：2