基于注意力机制的改进残差网络的人体行为识别方法被引量：5

Human Action Recognition Method based on Attention Mechanism and Improved ResNeXt Network

下载PDF

导出

摘要针对ResNeXt网络(残差网络)中存在的对特征提取不充分,以及数据集中背景信息干扰的问题,将ResNeXt网络和注意力机制相结合,提出了一种基于注意力机制的ResNeXt模型。首先,在ResNeXt网络的基础上,将浅层和深层的特征融合生成新型网络结构。其次,将全连接层由全局平均池化层替代,然后在通道空间注意力机制中添加一个条件因子,同时将改进后的注意力机制嵌入上述网络中。最后,在UCF101和HMDB51上分别进行实验,得到了95.2%和65.6%的准确率。研究表明,本文提出的模型可以有效地提取关键特征,充分利用不同层次的特征信息获得较好的准确率。 Aiming at problems of insufficient feature extraction in ResNeXt network and background information interference in the dataset,this paper proposes a ResNeXt model based on attention mechanism,which combines the ResNeXt network and attention mechanism.First,based on ResNeXt network,shallow and deep features are merged to generate a new network structure.Second,the fully connected layer is replaced by a global average pooling layer.Then channel attention mechanism is improved by adding a condition factor.At the same time,the improved attention mechanism is embedded in the above-mentioned network.Finally,experiments are performed on UCF101 and HMDB51 respectively,and the accuracy rates of 95.2% and 65.6% are obtained.Experiments show that the proposed model can effectively extract key features,and make full use of feature information of different layers to achieve better accuracy.

作者王昊飞李俊峰 WANG Haofei;LI Junfeng(Faculty of Mechanical Engineering&Automation,Zhejiang Sci-Tech University,Hangzhou 310018,China)

机构地区浙江理工大学机械与自动控制学院

出处《软件工程》 2021年第11期51-54,46,共5页 Software Engineering

关键词人体行为识别注意力机制 ResNeXt 全局平均池化 human action recognition attention mechanism ResNeXt network global average pooling

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1周波,李俊峰.结合目标检测的人体行为识别[J].自动化学报,2020,46(9):1961-1970. 被引量：20
2朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：132
3周风余,尹建芹,杨阳,张海婷,袁宪锋.基于时序深度置信网络的在线人体动作识别[J].自动化学报,2016,42(7):1030-1039. 被引量：19
4王翔,任佳.基于多注意力机制的深度神经网络故障诊断算法[J].浙江理工大学学报（自然科学版）,2020,43(2):224-231. 被引量：3
5徐岩,李晓振,吴作宏,高照,刘林.基于残差注意力网络的马铃薯叶部病害识别[J].山东科技大学学报（自然科学版）,2021,40(2):76-83. 被引量：16
6朱红蕾,朱昶胜,徐志刚.人体行为识别数据集研究进展[J].自动化学报,2018,44(6):978-1004. 被引量：36
7程海粟,李庆武,仇春春,郭晶晶.基于改进密集轨迹的人体行为识别算法[J].计算机工程,2016,42(8):199-205. 被引量：14

二级参考文献110

1Fujiyoshi H, Lipton A J, Kanade T. Real-time human mo- tion analysis by image skeletonization. IEICE Transactions on Information and Systems, 2004, 87-D(1): 113-120.
2Chaudhry R, Ravichandran A, Hager G, Vidal R. His- tograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of hu- man actions. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1932-1939.
3Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Con- ference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893.
4Lowe D G. Object recognition from local scale-invariant fea- tures. In: Proceedings of the 7th IEEE International Confer- ence on Computer Vision. Kerkyra: IEEE, 1999. 1150-1157.
5Schuldt C, Laptev I, Caputo B. Recognizing human actions: a local SVM approach. In: Proceedings of the 17th In- ternational Conference on Pattern Recognition. Cambridge: IEEE, 2004. 32-36.
6Dollar P, Rabaud V, Cottrell G, Belongie S. Behavior recog- nition via sparse spatio-temporal features. In: Proceedings of the 2005 IEEE International Workshop on Visual Surveil- lance and Performance Evaluation of Tracking and Surveil- lance. Beijing, China: IEEE, 2005.65-72.
7Rapantzikos K, Avrithis Y, Kollias S. Dense saliency-based spatiotemporal feature points for action recognition. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1454-1461.
8Knopp J, Prasad M, Willems G, Timofte R, Van Gool L. Hough transform and 3D SURF for robust three dimensional classification. In: Proceedings of the llth European Confer- ence on Computer Vision (ECCV 2010). Berlin Heidelberg: Springer. 2010. 589-602.
9Klaser A, Marszaeek M, Schmid C. A spatio-temporal de- scriptor based on 3D-gradients. In: Proceedings of the 19th British Machine Vision Conference. Leeds: BMVA Press, 2008. 99.1-99.10.
10Wang H, Ullah M M, Klaser A, Laptev I, Schmid C. Evalua- tion of local spatio-temporal features for action recognition. In: Proceedings of the 2009 British Machine Vision Confer- ence. London, UK: BMVA Press, 2009. 124.1-124.11.

共引文献223

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
3童立靖,徐光亚,冯金芝.一种基于CNN与位姿自适应的运动模型生成方法[J].西安文理学院学报（自然科学版）,2024,27(2):1-7.
4谈笑.基于Spark大数据平台的老年病风险预警模型[J].微型电脑应用,2020,36(2):71-74. 被引量：2
5黄海松,陈星燃,韩正功,范青松,朱云伟,胡鹏飞.基于多尺度注意力机制和知识蒸馏的茶叶嫩芽分级方法[J].农业机械学报,2022,53(9):399-407. 被引量：9
6贾双成,杨凤萍.基于神经网络的人体动态行为智能识别方法[J].科技通报,2020(1):60-63. 被引量：1
7柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
8王明松,秦永佩,张鑫鑫.基于TensorFlow的动作行为识别原理与实践[J].电子技术（上海）,2021,50(4):112-113. 被引量：1
9周宏宇,严春峰,宋旭,刘国英.基于加权三视角运动历史图像与时序分割的动作识别算法[J].电子测量与仪器学报,2020(11):194-203. 被引量：6
10王立刚,张志佳,李晋,范莹莹,刘立强.基于卷积神经网络的LED灯类字体数字识别[J].电子测量与仪器学报,2020(11):148-154. 被引量：8

同被引文献30

1张俊,李昌.基于LSTM多传感器数据融合人体行为识别方法[J].芜湖职业技术学院学报,2021,23(2):32-35. 被引量：4
2马钰锡,谭励,董旭,于重重.面向智能监控的行为识别[J].中国图象图形学报,2019,24(2):282-290. 被引量：35
3王俊,郑彤,雷鹏,张原,樵明朗.基于卷积神经网络的手势动作雷达识别方法[J].北京航空航天大学学报,2018,44(6):1117-1123. 被引量：22
4唐超,王文剑,张琛,彭华,李伟.基于RGB-D图像特征的人体行为识别[J].模式识别与人工智能,2019,32(10):901-908. 被引量：9
5戎辉,华一丁,张小俊,龚进峰,唐风敏,郭蓬,何佳.基于迁移学习和AlexNet的驾驶员行为状态识别方法[J].科学技术与工程,2019,19(28):208-216. 被引量：16
6孙宝聪.基于图像检测的机场人员异常行为分析技术研究[J].数字通信世界,2020(1):26-26. 被引量：4
7齐琦,钱慧芳.基于融合3DCNN神经网络的行为识别[J].电子测量技术,2019,42(22):140-144. 被引量：10
8刘帆,于凤芹.基于全局和局部特征的人体行为识别[J].激光与光电子学进展,2020,57(2):75-81. 被引量：8
9鲁志敏,袁勋,陈松.一种基于卷积神经网络的立体匹配算法设计[J].信息技术与网络安全,2020,39(5):1-5. 被引量：1
10许志猛,尹辉斌,林佳慧.基于空间聚类的FMCW雷达双人行为识别方法[J].福州大学学报（自然科学版）,2020,48(4):445-450. 被引量：6

引证文献5

1韩劢之.人体行为识别研究及标准化[J].信息技术与标准化,2022(3):57-62.
2姚捃,郭志林.一种端到端的考场多目标行为识别算法[J].计算机技术与发展,2022,32(9):174-179. 被引量：1
3姚捃,郭志林,赵杰.基于人体属性分析的考场行为识别[J].科学技术与工程,2022,22(22):9721-9727. 被引量：1
4魏东,何雪.基于引导信息的双目立体匹配算法[J].计算机技术与发展,2022,32(12):159-164.
5马泽宇,叶宁,徐康,王甦,王汝传.基于FMCW雷达和ResNeSt-GRU的行为识别方法[J].计算机与现代化,2023(11):101-107.

二级引证文献2

1宋宇婷,余本功.融合多粒度特征和标签语义共现的多标签分类[J].科学技术与工程,2023,23(16):6959-6966. 被引量：4
2高祺,易妍,王燕萍.一种电网综合场景技能评估方法[J].科技与创新,2023(20):86-88.

1朱锋,骆殿兵.有效建构教学情境促进学生道德成长——以“坚持国家利益至上”一课为例[J].教学月刊（中学版）（教学参考）,2021(10):39-42. 被引量：1
2吴建华,伍文锋,游江,严丽丽.冷挤压精加工技术在燃油喷嘴微孔加工中的应用[J].航天制造技术,2021(5):19-22. 被引量：1
3王佳,王晓梅.体验与迁移:在线社群与品牌契合的概念与测量[J].新闻与传播评论,2021,74(6):92-104. 被引量：5
4安玉香,李檀.基于分布式集群的语料库防篡改检索方法[J].计算机仿真,2021,38(9):460-464. 被引量：2

软件工程

2021年第11期

浏览历史

内容加载中请稍等...

基于注意力机制的改进残差网络的人体行为识别方法被引量：5

参考文献7

二级参考文献110

共引文献223

同被引文献30

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的改进残差网络的人体行为识别方法 被引量：5

参考文献7

二级参考文献110

共引文献223

同被引文献30

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的改进残差网络的人体行为识别方法被引量：5