结合注意力机制与时空特征融合的长时程行为识别方法被引量：2

Attention-embedded long-term spatial-temporal feature fusion for action recognition

下载PDF

导出

摘要为了建立基于视频行为识别的长时程图像序列的时空信息模型,文章提出了一种嵌入注意力的时空特征融合网络(attention-embedded spatial-temporal feature fusion network,ASTFFN)的深度神经网络模型。ASTFFN将一个包含动作的长时程图像序列分割成多个重叠的片段,并使用一个注意力嵌入特征提取网络(attention-embedded feature extraction network,AFEN)从每个片段中的RGB图像或光流图像中提取经过注意力加权的时空特征,进而融合每个片段的时空加权特征,生成行为识别的视频级预测。基于UCF101和HMDB51行为识别数据库进行了大量的实验,验证了方法的有效性。与目前主流的行为识别算法相比,该文方法在识别精度上取得了较好的效果。 To model the spatial-temporal information from long-term image sequences for video-based action recognition,a deep neural network named attention-embedded spatial-temporal feature fusion network(ASTFFN)was developed.ASTFFN divided a long-term image sequence containing action into several overlapping snippets and used an attention-embedded feature extraction network(AFEN)to extract attention-weighted spatial or temporal features from the RGB images or optical flow images in each snippet.Next,the weighted spatial and temporal features of each snippet were fused to generate video-level prediction of action recognition.Extensive experiments on two action recognition benchmarks,including the UCF101 database and the HMDB51 database,show the effectiveness of the proposed method.Compared with state-of-the-art action recognition algorithms,the proposed method achieves competitive results for recognition accuracy.

作者孙宁郝一嘉宦睿智刘佶鑫韩光 SUN Ning;HAO Yijia;HUAN Ruizhi;LIU Jixin;HAN Guang(Engineering Research Center of Wideband Wireless Communication Technology of Ministry of Education, Nanjing University of Posts and Telecommunications, Nanjing 210003, China)

机构地区南京邮电大学宽带无线通信技术教育部工程研究中心

出处《合肥工业大学学报（自然科学版）》 CAS 北大核心 2021年第8期1051-1058,1145,共9页 Journal of Hefei University of Technology：Natural Science

基金国家自然科学基金资助项目(61471206,61871445) 江苏省自然科学基金资助项目(BK61471206,BK61871445)和南京邮电大学科研基金资助项目(NY218066)。

关键词注意力机制时空特征融合动作识别 attention mechanism spatial-temporal feature fusion action recognition

分类号 TP751 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

同被引文献21

1胡敦利,柯浩然,张维.基于Kinect和ROS的骨骼轨迹人体姿态识别研究[J].高技术通讯,2020,30(2):177-184. 被引量：11
2蒋留兵,周小龙,车俐.基于无载波超宽带雷达的小样本人体动作识别[J].电子学报,2020,48(3):602-615. 被引量：13
3蒋圣南,陈恩庆,郑铭耀,段建康.基于ResNeXt的人体动作识别[J].图学学报,2020,41(2):277-282. 被引量：8
4刘创,梁军.基于注意力机制的车辆运动轨迹预测[J].浙江大学学报（工学版）,2020,54(6):1156-1163. 被引量：16
5许毓晓.基于AVI视频的舞蹈动作步态轮廓动态识别分析研究[J].现代电子技术,2020,43(16):119-121. 被引量：7
6王增强,张文强,张良.引入高阶注意力机制的人体行为识别[J].信号处理,2020,36(8):1272-1279. 被引量：11
7王松,党建武,王阳萍,金静.基于3D运动历史图像和多任务学习的动作识别[J].吉林大学学报（工学版）,2020,50(4):1495-1502. 被引量：5
8刘强,张文英,陈恩庆.基于异构多流网络的多模态人体动作识别[J].信号处理,2020,36(9):1422-1428. 被引量：7
9张浩博,付冬梅,周珂.时序增强的视频动作识别方法[J].模式识别与人工智能,2020,33(10):951-958. 被引量：6
10肖志涛,张曌,王雯.基于运动学动态图的人体动作识别方法[J].天津工业大学学报,2021,40(1):53-59. 被引量：3

引证文献2

1晏国良.基于动作捕捉的舞蹈视频动作识别技术研究[J].赤峰学院学报（自然科学版）,2022,38(9):48-52. 被引量：4
2门瑞,郭俊俊.基于LSTM的车辆移动轨迹预测研究[J].专用汽车,2024(6):70-72.

二级引证文献4

1于茜,齐飞,田广昊.基于超宽带定位和改进SVM的舞蹈动作识别系统研究[J].自动化与仪器仪表,2023(6):138-142.
2潘萍,彭高丰,潘凌云.基于开源框架的人机交互危险姿态识别系统设计[J].自动化与仪器仪表,2023(10):95-98.
3陈晓坚.基于动作捕捉技术和Unity 3D的演示系统设计[J].自动化与仪器仪表,2023(12):144-147.
4莫丽娅,黄铭.基于多传感器数据的虚拟现实翻译机器人交互自动化系统设计[J].自动化与仪器仪表,2024(3):189-192.

1徐丽珍,吴功才.基于青少年在线学习的特定动作识别[J].信息与电脑,2021,33(13):24-26.
2王宁.数字型创业企业的成长机制--基于双边规则多局域世界模型的仿真分析[J].科技管理研究,2021,41(14):163-173. 被引量：1
3王勇,张索宇,吕心怡.多重注意力特征融合网络对中文评价情感分析[J].小型微型计算机系统,2021,42(8):1633-1638. 被引量：3
4赵锐,赵国伟,张娟,王强,赵杰伦,董红月,张兴忠.改进CenterNet的高压输电线路巡检故障实时检测方法[J].计算机工程与应用,2021,57(17):246-252. 被引量：24
5杜京义,陈瑞,郝乐,史志芒.煤矿带式输送机异物检测[J].工矿自动化,2021,47(8):77-83. 被引量：23
6Yongfeng Gao,Jiaxing Tan,Zhengrong Liang,Lihong Li,Yumei Huo.Improved computer-aided detection of pulmonary nodules via deep learning in the sinogram domain[J].Visual Computing for Industry,Biomedicine,and Art,2019,2(1):129-137.
7马利,陈诗煊,牛斌.一种Anchor-Free的联合模型车辆多目标跟踪算法[J].辽宁大学学报（自然科学版）,2021,48(3):193-203. 被引量：3
8Anitha Ganesan,Anbarasu Balasubramanian.Indoor versus outdoor scene recognition for navigation of a micro aerial vehicle using spatial color gist wavelet descriptors[J].Visual Computing for Industry,Biomedicine,and Art,2019,2(1):192-204.
9Xi Wang,Feng Han,Xiaozhe Bian,Zhifeng Li.Mapping the Past with Present Digital Tools:Historic Urban Landscape Research in Chinese City,Xi’an Walled City Area[J].Built Heritage,2018,2(4):42-57. 被引量：1
10Kai Wang,Chenpei Li,Yanhui Li,Jinling Lu,Yueshe Wang,Xingqi Luo.Multi-physics analysis of the galvanic corrosion of Mg-steel couple under the influence of time-dependent anisotropic deposition film[J].Journal of Magnesium and Alloys,2021,9(3):866-882. 被引量：3

合肥工业大学学报（自然科学版）

2021年第8期

浏览历史

内容加载中请稍等...

结合注意力机制与时空特征融合的长时程行为识别方法被引量：2

同被引文献21

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

结合注意力机制与时空特征融合的长时程行为识别方法 被引量：2

同被引文献21

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

结合注意力机制与时空特征融合的长时程行为识别方法被引量：2