基于RGB-D视频的多模态手势识别被引量：3

Multimodal Gesture Recognition Based on RGB-D Video

下载PDF

导出

摘要本文是对SKIG RGB-D多模态的孤立手势视频进行手势识别研究.首先将RGB和Depth两种单模态视频提取成图片的形式保存,然后采样成长度为32帧的手势序列分别输入到本文提出的稠密连接的3DCNN组件学习短期的时空域特征,然后将提取的时空域特征输入到卷积GRU网络进行长期的时空域特征学习,最终对单模态训练好的网络进行多模态融合,提升网络识别准确率.本文在SKIG数据集上取得了99.07%的识别准确率,达到了极高的准确率,证明了本文提出的网络模型的有效性. In this study,the gesture recognition based on SKIG RGB-D multimodal isolated gesture video is studied.The RGB and depth videos are extracted into the form of images.Then the sampled 32frames from images are input to the densely connected 3DCNN component to learn short-term spatiotemporal features,after that the features input to the convolutional GRU to learn long-term spatiotemporal features.Finally,the trained networks for single modal are used to multimodal fusion to improve the recognition accuracy.99.07%recognition accuracy is obtained on the SKIG dataset, which achieves high accuracy and proves the validity of the network model proposed in this study.

作者马正文蔡坚勇刘磊欧阳乐峰李楠 MA Zheng-Wen;CAI Jian-Yong;LIU Lei;OUYANG Le-Feng;LI Nan(College of Photonic and Electronic Engineering,Fujian Normal University,Fuzhou 350007,China;Key Laboratory of Optoelectronie Science and Technology for Medicine of Ministry of Education,Fujian Normal University,Fuzhou 350007,China;Fujian Provincial Key Laboratory of Photonics Technology,Fujian Normal University,Fuzhou 350007,China;Fujian Provincial Engineering Technology Research Center of Photoelectric Sensing Application,Fujian Normal University,Fuzhou 350007,China;Intelligent Optoelectronic Systems Research Center,Fujian Normal University,Fuzhou 350007,China)

机构地区福建师范大学光电与信息工程学院福建师范大学医学光电科学与技术教育部重点实验室福建师范大学福建省光子技术重点实验室福建师范大学福建省光电传感应用工程技术研究中心福建师范大学智能光电系统工程研究中心

出处《计算机系统应用》 2018年第12期234-239,共6页 Computer Systems & Applications

基金福建省自然科学基金(2017J01744)~~

关键词手势识别稠密连接的3DCNN 卷积GRU 时空域特征 gesture recognition densely connected 3DCNN convolutional GRU spatiotemporal features

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献29

1杨磊,隋云衡,姚立虎.结合肤色分割与手形匹配算法的静态手势检测[J].信息通信,2013,26(4):4-6. 被引量：5
2余思泉,曹江涛,李平,姬晓飞.基于空间金字塔特征包的手势识别算法[J].智能系统学报,2015,10(3):429-435. 被引量：4
3张义群,林培杰,程树英.基于FPGA的人脸实时检测与跟踪[J].有线电视技术,2016,23(2):33-36. 被引量：1
4陈义,马云林.基于视觉的手势识别技术在车载主机上的应用[J].电子设计工程,2016,24(8):141-144. 被引量：7
5梅明亮,王翠凤,何炳蔚.基于视觉的手势识别技术及在小车控制中的应用[J].长春大学学报,2016,26(8):24-31. 被引量：6
6李擎,唐欢,迟健男,邢永跃,李华通.基于改进最大类间方差法的手势分割方法研究[J].自动化学报,2017,43(4):528-537. 被引量：26
7文芳,康彩琴,陈立文,丁汇,徐琨,王宁宁.基于RGBD数据的静态手势识别[J].计算机与现代化,2018(1):74-77. 被引量：7
8刘嘉莹,张孙杰.融合视频时空域运动信息的3D CNN人体行为识别[J].电子测量技术,2018,41(7):43-49. 被引量：11
9焦家祥.手势识别技术前沿概述[J].电子世界,2018,0(15):29-30. 被引量：5
10王轩,张林,高磊,蒋昊坤.基于代表的留一法集成学习分类[J].计算机应用,2018,38(10):2772-2777. 被引量：1

引证文献3

1吴轶凡,郭剑辉.一种基于肤色模型的改进型手势分割算法的实现[J].电子设计工程,2020,28(18):185-188. 被引量：2
2崔虎,黄仁婧,陈青梅,黄初华.基于异步多时域特征的动态手势识别方法[J].计算机工程与应用,2022,58(21):163-171. 被引量：3
3李占利,刘博宇,靳红梅,徐建军.Gabor-C3D手势识别算法[J].计算机工程与设计,2023,44(5):1405-1411.

二级引证文献5

1杨晨奕,何玉青,赵俊媛,李国荣.面向嵌入式平台的轻量化神经网络手势识别方法[J].强激光与粒子束,2022,34(3):138-146. 被引量：8
2朱颖,吴钰鑫,梁舒杰,朱珍妮.基于FPGA停车场巡视机器人的设计[J].电子设计工程,2022,30(16):107-111. 被引量：1
3李妍,杨硕.基于改进双流网络的周期性挥手识别[J].物联网技术,2023,13(2):35-39.
4梁钊铭,段旭洋,王皓.视觉导引装配场景动态手势识别方法[J].机械设计与研究,2023,39(2):12-18.
5杜兵,赵骥.基于时空特征融合的交通警察手势识别[J].计算机工程与应用,2024,60(8):250-257.

1张素,安博文,潘胜达.基于时空非局部相似性的海上红外弱小目标检测[J].光子学报,2018,47(11):247-257. 被引量：14
2常峰铭,易灵芝.基于深度学习的智能楼宇微网负荷预测方法研究[J].测控技术,2018,37(12):42-45. 被引量：3
3方程,邢座程,陈顼颢,张洋.一种基于GPU的高性能稀疏卷积神经网络优化[J].计算机工程与科学,2018,40(12):2103-2111. 被引量：2
4袁非牛,章琳,史劲亭,夏雪,李钢.自编码神经网络理论及应用综述[J].计算机学报,2019,42(1):203-230. 被引量：139
5高继银,李纪元,游慕贤.茶花新品种登录[J].中国花卉园艺,2018,0(24):50-50.
6杨军,史纪东.由粗到精的三维等距模型对应关系计算[J].重庆邮电大学学报（自然科学版）,2018,30(6):803-811. 被引量：2
7尹秋怡,甄峰,罗桑扎西,阎欣,郭素萍.新城公共自行车出行空间影响因素及布局建议[J].现代城市研究,2018,0(12):9-15. 被引量：8
8王佳林,刘吉强,赵迪,王盈地,相迎宵,陈彤,童恩栋,牛温佳.基于非对称卷积自编码器和支持向量机的入侵检测模型[J].网络与信息安全学报,2018,4(11):58-68. 被引量：3
9黄健航,雷迎科.通信辐射源个体识别的自编码器构造方法[J].火力与指挥控制,2018,43(11):108-112. 被引量：5
10钟石玉,熊意林,李志刚,黄景孟,杜翌超,吴恩政,鲁显松,周晓宁,李忠林,朱正勇.庙垭铌钽稀土矿田成矿模式探讨[J].资源环境与工程,2018,32(B11):8-14. 被引量：5

计算机系统应用

2018年第12期

浏览历史

内容加载中请稍等...

基于RGB-D视频的多模态手势识别被引量：3

同被引文献29

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于RGB-D视频的多模态手势识别 被引量：3

同被引文献29

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于RGB-D视频的多模态手势识别被引量：3