基于深度学习的时空特征融合人体动作识别被引量：7

Fusion of spatio-temporal features based on deep learning for human action recognition

下载PDF

导出

摘要深度学习需要充分利用视频中动作的时空信息来进行动作识别。为了充分利用视频中的时空特征来提高动作识别的准确率,并以较低的成本保存相关信息,提出一种采用稀疏采样方案的时空特征融合动作识别框架。采用稀疏采样获得视频的RGB图和光流图,分别送入VGG-16网络提取视频的时空特征;融合时空卷积神经网络(CNN)提取中层时空融合特征;将中层时空融合特征送入C3D CNN识别出动作的类别。在HMDB51和UCF101两个数据集的实验结果表明:该框架能够充分利用视频的时间信息和空间信息,达到了较高的动作识别准确率。 Deep learning needs to make full use of the spatio-temporal information of the actions in the video to perform action recognition.In order to make full use of the spatio-temporal features in video to improve the accuracy of action recognition and save relevant information at a lower cost,a spatio-temporal feature fusion action recognition framework using sparse sampling scheme is proposed.The framework uses the sparse sampling to obtain the RGB images and optical flow images of videos,and respectively sends the spatio-temporal features to the VGG-16 network to extract the spatio-temporal features,then the spatial CNN and the temporal CNN are merged to extract the fused spatio-temporal features middle level,finally the fused spatio-temporal features are sent to the C3D CNN to performs action recognition.The experimental results of two datasets in HMDB51 and UCF101 show that the framework can make full use of the temporal information and spatial information of the video to achieve higher action recognition accuracy.

作者王倩孙宪坤范冬艳 WANG Qian;SUN Xiankun;FAN Dongyan(School of Electronic and Electrical Engineering,Shanghai University of Engineering Science,Shanghai 201620,China)

机构地区上海工程技术大学电子电气工程学院

出处《传感器与微系统》 CSCD 2020年第10期35-38,共4页 Transducer and Microsystem Technologies

基金国家自然科学基金青年科学基金资助项目(61802251,61801286) 上海市科学技术委员会科研计划项目(16DZ1206000) 上海工程技术大学科研项目(E3-0903-19-01053)。

关键词深度学习动作识别稀疏采样时空特征融合 C3D卷积神经网络(CNN) deep learning action recognition sparse sampling spatio-temporal feature fusion C3D convolutional neural network(CNN)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1杨天明,陈志,岳文静.基于视频深度学习的时空双流人物动作识别模型[J].计算机应用,2018,38(3):895-899. 被引量：25
2胡珂杰,蒋敏,孔军.基于混合关节特征的人体行为识别[J].传感器与微系统,2018,37(3):138-140. 被引量：5

二级参考文献1

1唐宋,陈利娟,陈志贤,叶茂.基于目标域局部近邻几何信息的域自适应图像分类方法[J].计算机应用,2017,37(4):1164-1168. 被引量：6

共引文献27

1吴晨,孙强,倪宏宇,颜文旭.基于骨架序列提取的异常行为识别[J].计算机系统应用,2022,31(11):215-222. 被引量：1
2毛志强,马翠红,崔金龙,王毅.基于双流卷积与双中心loss的行为识别研究[J].微电子学与计算机,2019,36(3):96-100. 被引量：3
3安妙,孔英会,沈辉,车辚辚.基于深度学习的行为识别及在电力系统的应用[J].电力科学与工程,2019,35(3):59-65. 被引量：13
4方国康,李俊,王垚儒.基于深度学习的ARM平台实时人脸识别[J].计算机应用,2019,39(8):2217-2222. 被引量：14
5胡薰尹,管业鹏.基于3D-LCRN视频异常行为识别方法[J].哈尔滨工业大学学报,2019,51(11):183-193. 被引量：8
6毕雪超.基于空间骨架时序图的舞蹈特定动作识别方法[J].信息技术,2019,43(11):16-19. 被引量：2
7马翠红,王毅,毛志强.基于时空双流融合网络与AM-Softmax的动作识别[J].网络安全技术与应用,2019,0(11):47-50. 被引量：1
8窦雪婷,王硕,季鑫盛.基于改进DNN-LSTM算法的车辆前方行人行为识别方法[J].计算机测量与控制,2019,27(11):175-179. 被引量：1
9盛敏,李兰.基于动作主视图和LSTM网络模型的人体行为识别[J].安庆师范大学学报（自然科学版）,2020,26(1):73-76. 被引量：1
10郭洪涛,龙娟娟.基于深度神经网络和投影树的高效率动作识别算法[J].计算机应用与软件,2020,37(4):273-279. 被引量：2

同被引文献45

1马双双,王佳,曹少中,杨树林,赵伟,张寒.基于深度学习的二维人体姿态估计算法综述[J].计算机系统应用,2022,31(10):36-43. 被引量：10
2毛刚,王良辉.人机协同:理解并建构未来教育世界的方式[J].教育发展研究,2021(1):16-24. 被引量：54
3范银行,赵海峰,张少杰.基于3D卷积残差网络的人体动作识别算法[J].计算机应用研究,2020,37(S02):300-301. 被引量：4
4李玉鹏,刘婷婷,张良.基于深度学习的人体动作识别方法[J].计算机应用研究,2020,37(1):304-307. 被引量：6
5胡齐齐,汪剑鸣,金光浩.基于时空信息的时序动作检测方法研究[J].微电子学与计算机,2019,36(2):88-92. 被引量：3
6卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：551
7杨曙光.一种改进的深度学习视频分类方法[J].现代计算机（中旬刊）,2017(3):66-69. 被引量：5
8杨天明,陈志,岳文静.基于视频深度学习的时空双流人物动作识别模型[J].计算机应用,2018,38(3):895-899. 被引量：25
9胡珂杰,蒋敏,孔军.基于混合关节特征的人体行为识别[J].传感器与微系统,2018,37(3):138-140. 被引量：5
10晋丽榕,王海梅,徐丹萍.基于LBP-HSV模型及改进SIFT算法的行人再识别算法[J].计算机测量与控制,2018,26(5):144-147. 被引量：4

引证文献7

1王倩,范冬艳.基于时空信息融合的时序动作定位[J].智能计算机与应用,2020,10(6):31-36.
2朱相华,智敏.基于改进深度学习方法的人体动作识别综述[J].计算机应用研究,2022,39(2):342-348. 被引量：6
3张瑷涵,刘翔,石蕴玉,刘思齐.基于深度学习的双流程短视频分类方法[J].计算机工程,2022,48(7):277-283. 被引量：2
4卢海燕,赵红东,王添盟,林江,耿立新,刘赫.基于轻量级卷积神经网络的红外行人行为识别[J].传感器与微系统,2022,41(9):129-131. 被引量：4
5胡丽军,吴燕玲,宋全军,徐湛楠.基于ST-GCN警用巡逻机器人警情识别系统设计[J].传感器与微系统,2023,42(6):78-81. 被引量：3
6李玉荣.基于计算机视觉技术的智能化课堂管理系统研究[J].通信与信息技术,2024(2):130-136.
7徐社远.改进的深度动作捕捉技术在民族传统体育动作识别中的应用[J].兰州文理学院学报（自然科学版）,2024,38(2):108-111.

二级引证文献15

1冯九龙,杨海涛,栾晓鹏,马营营,冯荟璇.基于5G多视频融合的流媒体应用探索与研究[J].现代信息科技,2022,6(5):60-63. 被引量：3
2马庆,李杰,王远超,许崇高.基于状态识别的人体运动中穿戴设备动态监控系统[J].自动化与仪器仪表,2023(1):166-171. 被引量：1
3孙小坚,林瑞全,方子卿,马驰.基于FPGA加速的低功耗的MobileNetV2 网络识别系统[J].计算机测量与控制,2023,31(5):221-227. 被引量：2
4包震伟,刘丹,米金鹏.弱监督与少样本学习场景下视频行为识别综述[J].计算机应用研究,2023,40(6):1629-1635. 被引量：1
5张君秋,赵建光.基于注意力机制与三维卷积聚合的动作识别[J].现代信息科技,2023,7(17):71-74.
6郑永生,肖军,温高能,雷磊,彭勃兴,文润玉.基于边缘设备轻量化行为识别算法[J].现代电子技术,2023,46(23):137-143.
7杜闯,何赟泽,邓海平,常珊,王耀南.基于百度飞桨的面向黑暗环境人员行为检测与身份识别[J].电子测量与仪器学报,2023,37(8):21-29. 被引量：1
8张德,王怡婷,甄昊宇.结合解耦注意力图卷积与时态建模的骨架动作识别[J].国外电子测量技术,2023,42(9):91-98.
9游义平,季云峰.体育视频中动作识别技术研究综述[J].智能计算机与应用,2023,13(11):1-13.
10王南.基于云计算的短视频媒体资源个性化推送方法[J].兵工自动化,2024,43(2):16-22. 被引量：2

传感器与微系统

2020年第10期

浏览历史

内容加载中请稍等...

基于深度学习的时空特征融合人体动作识别被引量：7

参考文献2

二级参考文献1

共引文献27

同被引文献45

引证文献7

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于深度学习的时空特征融合人体动作识别 被引量：7

参考文献2

二级参考文献1

共引文献27

同被引文献45

引证文献7

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于深度学习的时空特征融合人体动作识别被引量：7