基于深度学习的视频人体动作识别综述被引量：3

A survey of video human action recognition based on deep learning

下载PDF

导出

摘要随着网络多媒体技术的快速发展和视频采集设备的不断完善,越来越多的视频被共享到网络平台,视频逐渐占据了人类生活,因此视频理解已成为计算机视觉研究的热点之一。作为视频理解的首要任务,对动作识别的研究具有重要的意义。目前基于深度学习的二维图像识别分类方法已经取得了较大的进展,但是视频动作识别仍面临着巨大挑战。其原因在于视频和二维图像相差一个时间维度,对视频中行走、跑步、跳高和跳远等动作的理解不仅需要二维图像所具有的空间语义信息,还需要时序信息。因此,如何利用视频的时序信息对动作识别非常重要。首先介绍了动作识别的研究背景以及发展过程,分析了当前视频动作识别所面临的挑战,然后详细介绍了时序建模及参数优化的方法,分析了常用的动作识别数据集和度量参数,最后对未来的研究方向进行了展望。 With the rapid advancement of network multimedia technology and the continuous improvement of video capture equipment,an increasing number of videos are shared on network platforms,gradually becoming an integral part of human life.Consequently,video understanding has become one of the hot spots of computer vision research,with video understanding being a pivotal task.At present,2D image recognition classification methods based on deep learning have made significant strides.However,video action recognition still faces a formidable challenge.The reason is that videos differ from 2D images by an additional temporal dimension,and that understanding actions such as walking,running,high jumping,and long jumping in videos requires not only the spatial semantic information that 2D images possess but also temporal information.Therefore,effectively utilizing the temporal information of videos is critical for action recognition.This paper firstly introduced the research background and development process of action recognition,followed by an analysis of the current challenges in video action recognition.The methods of temporal modeling and parameter optimization were then presented in detail,along with an examination of the commonly used action recognition datasets and metric parameters.Finally,the paper outlined the future research directions in this field.

作者毕春艳刘越 BI Chun-yan;LIU Yue(Beijing Mixed Reality and New Display Engineering Technology Research Center,Beijing 100081,China;School of Optics and Photonics,Beijing Institute of Technology,Beijing 100081,China)

机构地区北京市混合现实与新型显示工程技术研究中心北京理工大学光电学院

出处《图学学报》 CSCD 北大核心 2023年第4期625-639,共15页 Journal of Graphics

基金国家自然科学基金项目(61960206007) 高等学校学科创新引智计划项目(B18005)。

关键词动作识别视频理解深度学习卷积神经网络计算机视觉 action recognition video understanding deep learning convolutional neural network computer vision

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1黄晴晴,周风余,刘美珍.基于视频的人体动作识别算法综述[J].计算机应用研究,2020,37(11):3213-3219. 被引量：17
2罗会兰,童康,孔繁胜.基于深度学习的视频中人体动作识别进展综述[J].电子学报,2019,47(5):1162-1173. 被引量：65
3钱文祥,衣杨.视频识别深度学习网络综述[J].计算机科学,2022,49(S02):341-350. 被引量：6
4钱慧芳,易剑平,付云虎.基于深度学习的人体动作识别综述[J].计算机科学与探索,2021,15(3):438-455. 被引量：33
5罗会兰,王婵娟,卢飞.视频行为识别综述[J].通信学报,2018,39(6):169-180. 被引量：38
6黄国范,李亚.人体动作姿态识别综述[J].电脑知识与技术,2013(1):133-135. 被引量：16
7李瑞峰,王亮亮,王珂.人体动作行为识别研究综述[J].模式识别与人工智能,2014,27(1):35-48. 被引量：96
8胡琼,秦磊,黄庆明.基于视觉的人体动作识别综述[J].计算机学报,2013,36(12):2512-2524. 被引量：123
9杜友田,陈峰,徐文立,李永彬.基于视觉的人的运动识别综述[J].电子学报,2007,35(1):84-90. 被引量：79
10陈万军,张二虎.基于深度信息的人体动作识别研究综述[J].西安理工大学学报,2015,31(3):253-264. 被引量：10

二级参考文献270

1刘相滨,向坚持,王胜春.人行为识别与理解研究探讨[J].计算机与现代化,2004(12):1-5. 被引量：12
2魏志强,纪筱鹏,冯业伟.基于自适应背景图像更新的运动目标检测方法[J].电子学报,2005,33(12):2261-2264. 被引量：54
3杜友田,陈峰,徐文立,李永彬.基于视觉的人的运动识别综述[J].电子学报,2007,35(1):84-90. 被引量：79
4谢林海,刘相滨.基于不变矩特征和神经网络的步态识别[J].微计算机信息,2007,23(19):279-281. 被引量：9
5Oliver N,Horvitz E.A comparison of HMMs and dynamic Bayesian networks for recognizing office activities[J].Lecture Notes in Artificial Intelligence,2005,3538:199-209.
6Kolonias I,Christmas W,Kittler J.Use of context in automatic annotation of sports videos[J].Lecture Notes in Computer Science,2004,3287:1-12.
7Park S,Aggarwal J K.A hierarchical Bayesian network for event recognition of human actions and interactions[J].Multimedia Systems,2004,10(2):164-179.
8Lafferty J,Mccallum A,Pereira F.Conditional random fields:probabilistic models for segmenting and labeling sequence data[A].In Proc ICML[C].Massachusetts:IEEE press,2001,282-289.
9Sminchisescu C,Kanaujia A,Li Z,Metaxas D.Conditional models for contextual human motion recognition[A].In Proc ICCV[C].Beijing:IEEE Computer Society Press,2005.2:1808-1815.
10Luhr S,Bui H H,Venkatesh S,West G A W.Recognition of Human Activity through Hierarchical Stochastic Learning[A].In Proc.PerCom[C].Texas:IEEE Computer Society Press,2003.416-422.

共引文献436

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2姚晶晶.体育运动视频人体关节点运动轨迹自动识别方法[J].商丘师范学院学报,2022,38(12):16-20.
3钟媛媛,侯庭毅,郭胜福,刘增建.冰箱产线中的AI应用及综合性检测分析[J].家电科技,2022(S01):778-781.
4范银行,赵海峰,张少杰.基于3D卷积残差网络的人体动作识别算法[J].计算机应用研究,2020,37(S02):300-301. 被引量：4
5余金锁,卢先领.基于分割注意力的特征融合CNN-Bi-LSTM人体行为识别算法[J].电子测量与仪器学报,2022,36(2):89-95. 被引量：6
6林羽晨,张金艺,秦政,姜玉稀.融合双重注意力机制的复合头部动作识别[J].电子测量技术,2020(11):85-90. 被引量：1
7朱文和.基于高斯平滑的视频时序检测算法[J].大众标准化,2021(2):253-254.
8许志豪,高铭,殷绍轩,崔杰.基于OpenPose的滑雪动作分析[J].智能计算机与应用,2022,12(4):101-103. 被引量：6
9吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
10王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：79

同被引文献33

1周玉林,李翰君,姚天奇,孙凯扬.基于神经网络预测足球运动员侧切变向动力学[J].医用生物力学,2021,36(S01):148-148. 被引量：1
2单迎杰.以S-T分析法分析教育技术专业课课堂教学问题[J].现代教育技术,2008,18(10):29-31. 被引量：16
3张庆如.啦啦操运动发展演进及特征表现[J].北京体育大学学报,2010,33(12):142-144. 被引量：85
4姜华,欧阳红,方红旺,胡海英,刘玉玺.一种双向长短时记忆循环神经网络的问句语义关系识别方法[J].福州大学学报（自然科学版）,2018,46(1):52-58. 被引量：6
5周鹏霄,邓伟,郭培育,刘清堂.课堂教学视频中的S-T行为智能识别研究[J].现代教育技术,2018,28(6):54-59. 被引量：29
6陈旭东,周昱琪,李梦杰,陈章进.基于SoC FPGA和CNN模型的动作识别系统设计[J].电子技术应用,2019,45(2):97-104. 被引量：7
7李美凤,何飞.智慧课堂中的“练习—反馈”环节教学行为分析——基于19节省级一等奖数学课例的视频分析[J].现代教育技术,2019,29(6):62-68. 被引量：12
8杨贺羽,杜洪波,朱立军,.基于顺序遗忘编码和Bi-LSTM的命名实体识别算法[J].计算机应用与软件,2020,37(2):213-217. 被引量：6
9许昊,张凯,田英杰,种法广,王子超.深度神经网络图像描述综述[J].计算机工程与应用,2021,57(9):9-22. 被引量：11
10骆祖莹,赵琦琦,段福庆.基于教师近场语音的课堂教学过程自动分析[J].现代教育技术,2021,31(8):76-84. 被引量：8

引证文献3

1康金龙,许涛,张华岭,宫胜.改进的自监督生成对抗网络算法在视频生成中的应用[J].信息记录材料,2024,25(8):144-146.
2崔家郡,康璐,马苗.课堂师生交互智能分析技术研究综述[J].计算机科学,2024,51(10):40-49.
3徐静.基于感知学习算法的啦啦操动作风格识别与性能分析[J].景德镇学院学报,2024,39(3):48-52.

1王美,杨欣欣,李慧颖,刘泱,张俊华.基于二维图像识别油田违章行为监测技术研究[J].安全,2023,44(5):55-60.
2陶峰,李燕苹,王瑞.基于图卷积网络改进的人体动作识别模型[J].电子测量技术,2023,46(8):59-64. 被引量：2
3李新春,张玉琛,阳士宇.融合全局与局部特征的UWB雷达人体动作识别算法[J].重庆邮电大学学报（自然科学版）,2023,35(4):636-645. 被引量：1

图学学报

2023年第4期

浏览历史

内容加载中请稍等...

基于深度学习的视频人体动作识别综述被引量：3

参考文献10

二级参考文献270

共引文献436

同被引文献33

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度学习的视频人体动作识别综述 被引量：3

参考文献10

二级参考文献270

共引文献436

同被引文献33

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度学习的视频人体动作识别综述被引量：3