结合目标检测的人体行为识别被引量：18

Human Action Recognition Combined With Object Detection

下载PDF

导出

摘要人体行为识别领域的研究方法大多数是从原始视频帧中提取相关特征,这些方法或多或少地引入了多余的背景信息,从而给神经网络带来了较大的噪声.为了解决背景信息干扰、视频帧存在的大量冗余信息、样本分类不均衡及个别类分类难的问题,本文提出一种新的结合目标检测的人体行为识别的算法.首先,在人体行为识别的过程中增加目标检测机制,使神经网络有侧重地学习人体的动作信息;其次,对视频进行分段随机采样,建立跨越整个视频段的长时时域建模;最后,通过改进的神经网络损失函数再进行行为识别.本文方法在常见的人体行为识别数据集UCF101和HMDB51上进行了大量的实验分析,人体行为识别的准确率(仅RGB图像)分别可达96.0%和75.3%,明显高于当今主流人体行为识别算法. Most of the research methods in the field of human action recognition extract relevant features from the original video frames.These methods introduce more or less redundant background information,which brings more noise to the neural network.In order to solve the problem of background information interference,large amount of redundant information in video frames,unbalanced sample classification and difficult classification of individual classes,this paper proposes a new algorithm for human action recognition combined with object detection.Firstly,the object detection mechanism is added in the process of human action recognition,so that the neural network has a focus on learning the motion information of the human body.Secondly,the video is segmentally and randomly sampled to establish long-term time domain modeling across the entire video segment.Finally,action recognition is performed through an improved neural network loss function.In this work,a large number of experimental analyses are performed on the popular human action recognition datasets UCF101 and HDBM51.The accuracy of human action recognition(RGB images only)is 96.0%and 75.3%,respectively,which is significantly higher than the state-of-the-art human action recognition algorithms.

作者周波李俊峰 ZHOU Bo;LI Jun-Feng(Institute of Automation,Faculty of Mechanical Engineering and Automation,Zhejiang Sci-Tech University,Hangzhou 310018)

机构地区浙江理工大学机械与自动控制学院自动化研究所

出处《自动化学报》 EI CSCD 北大核心 2020年第9期1961-1970,共10页 Acta Automatica Sinica

基金国家自然科学基金(61374022) 浙江省基础公益研究计划项目(LGG18F030001) 金华市科学技术研究计划重点项目(2018-1-027)资助。

关键词深度学习行为识别卷积神经网络机器视觉目标检测 Deep learning action recognition convolutional neural network(CNN) computer vision object detection

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1朱红蕾,朱昶胜,徐志刚.人体行为识别数据集研究进展[J].自动化学报,2018,44(6):978-1004. 被引量：35
2朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：132

二级参考文献54

1Fujiyoshi H, Lipton A J, Kanade T. Real-time human mo- tion analysis by image skeletonization. IEICE Transactions on Information and Systems, 2004, 87-D(1): 113-120.
2Chaudhry R, Ravichandran A, Hager G, Vidal R. His- tograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of hu- man actions. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1932-1939.
3Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Con- ference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893.
4Lowe D G. Object recognition from local scale-invariant fea- tures. In: Proceedings of the 7th IEEE International Confer- ence on Computer Vision. Kerkyra: IEEE, 1999. 1150-1157.
5Schuldt C, Laptev I, Caputo B. Recognizing human actions: a local SVM approach. In: Proceedings of the 17th In- ternational Conference on Pattern Recognition. Cambridge: IEEE, 2004. 32-36.
6Dollar P, Rabaud V, Cottrell G, Belongie S. Behavior recog- nition via sparse spatio-temporal features. In: Proceedings of the 2005 IEEE International Workshop on Visual Surveil- lance and Performance Evaluation of Tracking and Surveil- lance. Beijing, China: IEEE, 2005.65-72.
7Rapantzikos K, Avrithis Y, Kollias S. Dense saliency-based spatiotemporal feature points for action recognition. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1454-1461.
8Knopp J, Prasad M, Willems G, Timofte R, Van Gool L. Hough transform and 3D SURF for robust three dimensional classification. In: Proceedings of the llth European Confer- ence on Computer Vision (ECCV 2010). Berlin Heidelberg: Springer. 2010. 589-602.
9Klaser A, Marszaeek M, Schmid C. A spatio-temporal de- scriptor based on 3D-gradients. In: Proceedings of the 19th British Machine Vision Conference. Leeds: BMVA Press, 2008. 99.1-99.10.
10Wang H, Ullah M M, Klaser A, Laptev I, Schmid C. Evalua- tion of local spatio-temporal features for action recognition. In: Proceedings of the 2009 British Machine Vision Confer- ence. London, UK: BMVA Press, 2009. 124.1-124.11.

共引文献161

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
3童立靖,徐光亚,冯金芝.一种基于CNN与位姿自适应的运动模型生成方法[J].西安文理学院学报（自然科学版）,2024,27(2):1-7.
4谈笑.基于Spark大数据平台的老年病风险预警模型[J].微型电脑应用,2020,36(2):71-74. 被引量：2
5贾双成,杨凤萍.基于神经网络的人体动态行为智能识别方法[J].科技通报,2020(1):60-63. 被引量：1
6柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
7王明松,秦永佩,张鑫鑫.基于TensorFlow的动作行为识别原理与实践[J].电子技术（上海）,2021,50(4):112-113. 被引量：1
8朱文和.基于高斯平滑的视频时序检测算法[J].大众标准化,2021(2):253-254.
9吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
10周前祥,郭华岭,廖德智.载人航天器地理位置指示器工效学设计仿真软件的研制[J].计算机仿真,2000,17(1):60-63.

同被引文献106

1刘志颖,缪希仁,陈静,江灏.电力架空线路巡检可见光图像智能处理研究综述[J].电网技术,2020,44(3):1057-1069. 被引量：93
2王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：79
3徐光祐,曹媛媛.动作识别与行为理解综述[J].中国图象图形学报,2009,14(2):189-195. 被引量：50
4梁超,王亮,刘红云.基于扩展卡尔曼滤波的实时视觉SLAM算法[J].计算机工程,2013,39(8):231-234. 被引量：8
5章学静,陈禾,杨静.结合卡尔曼滤波和Mean Shift的抗遮挡跟踪算法[J].北京理工大学学报,2013,33(10):1056-1061. 被引量：15
6王宪保,李洁,姚明海,何文秀,钱沄涛.基于深度学习的太阳能电池片表面缺陷检测方法[J].模式识别与人工智能,2014,27(6):517-523. 被引量：88
7杨挺,赵黎媛,王成山.人工智能在电力系统及综合能源系统中的应用综述[J].电力系统自动化,2019,43(1):2-14. 被引量：226
8马钰锡,谭励,董旭,于重重.面向智能监控的行为识别[J].中国图象图形学报,2019,24(2):282-290. 被引量：34
9杨钊,陶大鹏,张树业,金连文.大数据下的基于深度神经网的相似汉字识别[J].通信学报,2014,35(9):184-189. 被引量：28
10李敏,崔树芹,谢治平.高斯混合模型在印花织物疵点检测中的应用[J].纺织学报,2015,36(8):94-98. 被引量：24

引证文献18

1王立刚,张志佳,李晋,范莹莹,刘立强.基于卷积神经网络的LED灯类字体数字识别[J].电子测量与仪器学报,2020(11):148-154. 被引量：8
2柳锋,李俊峰,戴文战.基于深度学习语义分割的导光板缺陷检测方法[J].计算机系统应用,2020,29(6):29-38. 被引量：11
3窦刚,刘荣华,范诚.基于卷积神经网络的考场不当行为识别[J].中国考试,2021(2):56-62. 被引量：6
4王昊飞,李俊峰.基于注意力机制的改进残差网络的人体行为识别方法[J].软件工程,2021,24(11):51-54. 被引量：5
5陈莹,龚苏明.改进通道注意力机制下的人体行为识别网络[J].电子与信息学报,2021,43(12):3538-3545. 被引量：13
6程楠楠.基于混合特征选择模型CatBoost-LightGBM的违约风险预测研究[J].现代信息科技,2021,5(14):116-120. 被引量：2
7王浩,王功臣,娄德章,刘永,张乐,付娟娟.基于AI边缘深度算法视频分析装置的电力场景异常识别技术研究[J].电力大数据,2021,24(11):1-8. 被引量：8
8吴胜昔,咸博龙,冒鑫鑫,顾幸生.基于姿态估计的护具佩戴检测与动作识别[J].信息与控制,2021,50(6):722-730. 被引量：6
9汤鹏杰,王瀚漓.从视频到语言:视频标题生成与描述研究综述[J].自动化学报,2022,48(2):375-397. 被引量：13
10龚苏明,陈莹.时空特征金字塔模块下的视频行为识别[J].计算机科学与探索,2022,16(9):2061-2067. 被引量：4

二级引证文献98

1费树岷,赵宏涛,杨艺,李春锋.基于时序拓扑非共享图卷积和多尺度时间卷积的骨架行为识别[J].信息与控制,2023,52(6):758-772.
2陶志勇,闫明豪,刘影,杜福廷.基于AG-CNN的轻量级调制识别方法[J].电子测量与仪器学报,2022,36(4):241-249. 被引量：2
3吴志华,钟铭恩,谭佳威,许平平,赵昱廷.复杂纹理布匹五类典型瑕疵图像检测算法研究[J].电子测量技术,2023,46(16):57-63.
4马竞,葛长赟.犯罪现场勘查智能考核系统的研究[J].中国公共安全,2023(3):72-77.
5韩文,魏超宇,刘辉军.基于Tiny-YOLOv3的田间绿色柑橘目标检测方法[J].中国计量大学学报,2020,31(3):349-356. 被引量：5
6何志,王立明.基于深度学习的聚烯烃材料表面缺陷视觉检测系统开发[J].云南化工,2020,47(11):54-57.
7孙浩杰,夏巧桥.基于循环神经网络的低复杂度最小和译码算法[J].电子测量技术,2021,44(5):74-80. 被引量：1
8施清清,黄鸿发,谢义东,胡彬.空调“智造”[J].中国质量,2021(7):36-43.
9曹磊,万旺根.基于动态视觉注意的多语言视频描述算法[J].工业控制计算机,2021,34(7):62-64.
10李俊峰,何炎森,戴文战.结合轻量化与级联深度学习网络的导光板缺陷检测方法[J].激光与光电子学进展,2021,58(14):188-198. 被引量：2

1肖利.运动健身测评移动App系统设计[J].微型电脑应用,2020,36(10):119-121.
2冯俊,何晔,马宁.浅谈面向态势的手势语义识别应用[J].科学与信息化,2020(29):24-26.
3余希达,高健.基于解耦控制算法的XYθ定位平台系统研究[J].组合机床与自动化加工技术,2020(10):110-116.

自动化学报

2020年第9期

浏览历史

内容加载中请稍等...

结合目标检测的人体行为识别被引量：18

参考文献2

二级参考文献54

共引文献161

同被引文献106

引证文献18

二级引证文献98

相关作者

相关机构

相关主题

浏览历史

结合目标检测的人体行为识别 被引量：18

参考文献2

二级参考文献54

共引文献161

同被引文献106

引证文献18

二级引证文献98

相关作者

相关机构

相关主题

浏览历史

结合目标检测的人体行为识别被引量：18