基于注意力机制和残差网络的视频行为识别

Video Behavior Recognition Based on Attention Mechanism and Residual Network

下载PDF

导出

摘要针对现有的视频人体行为识别模型识别能力有限,以及双流识别方法易受光照因素的影响导致时间成本较高的问题,提出一种基于注意力机制的ResNeXt模型用于识别视频中的人体行为。将经过预处理后的视频帧数据作为该模型的输入,该卷积网络模型使用ResNeXt101层网络作为核心残差块。在ResNeXt三维卷积神经网络模型的基础上,通过引入注意力机制来加强重要的特征信道,提高网络模型的特性表示及稳健性。使用Kinetics的预训练模型,对UCF-101和HMDB-51的数据进行了训练和学习,迭代200次后,在验证集上的识别率分别达到了96.0%和69.9%。实验结果显示,该模型能有效识别视频中的时空特征,与以往的识别模型相比准确率有所提高,且在人体行为识别任务中识别率较好。该模型能在保证深层网络的同时,使特征不丢失并且防止发生过拟合,同时识别的正确率也得到了改善,证明了该模型是有效可行的。 In view of the limited recognition ability of the existing video human behavior recognition models and the high time cost of the dual stream recognition method due to the influence of lighting factors,we propose a ResNeXt model based on attention mechanism to recognize human behavior in video.The preprocessed video frame data is used as the input of the model,and the ResNeXt101 layer network is used as the core residual block by the convolution network model.On the basis of ResNeXt three-dimensional convolutional neural network model,attention mechanism is introduced to strengthen important characteristic channels and improve the characteristic representation and robustness of the network model.We use the pre-training model of Kinetics dynamics to train and learn the data of UCF-101 and HMDB-51.After 200 iterations,the recognition rates on the verification set reach 96.0%and 69.9%respectively.The experimental results show that such model can effectively recognize the spatiotemporal features in video,and the recognition accuracy is significantly improved compared with the previous recognition models.Such model can not only ensure that the features are not lost,but also prevent the occurrence of over fitting,and the accuracy of recognition has been significantly improved,which proves that the model is effective and feasible.

作者李建平赖永倩 LI Jian-ping;LAI Yong-qian(School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China)

机构地区东北石油大学计算机与信息技术学院

出处《计算机技术与发展》 2023年第4期69-74,共6页 Computer Technology and Development

基金国家自然科学基金重点项目(61933007)。

关键词深度学习残差网络三维卷积网络视频行为识别注意力机制 deep learning residual network three dimensional convolution network video behavior recognition attention mechanism

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1梁绪,李文新,张航宁.人体行为识别方法研究综述[J].计算机应用研究,2022,39(3):651-660. 被引量：20
2黄志强,李军.基于空间通道注意力机制与多尺度融合的交通标志识别研究[J].南京邮电大学学报（自然科学版）,2022,42(2):93-102. 被引量：8
3朱红蕾,朱昶胜,徐志刚.人体行为识别数据集研究进展[J].自动化学报,2018,44(6):978-1004. 被引量：35
4王志强.一种基于三维残差网络分组膨胀卷积的人体行为识别方法[J].现代计算机,2022,28(5):65-70. 被引量：1
5张丽红,郭磊.基于压缩奖惩机制的视频行为识别方法研究[J].测试技术学报,2020,34(5):418-424. 被引量：1
6龚捷,罗聪,罗琴.基于注意力机制和残差网络的动作识别模型[J].电子测量技术,2021,44(14):111-116. 被引量：7

二级参考文献24

1黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：400
2单言虎,张彰,黄凯奇.人的视觉行为识别研究回顾、现状及展望[J].计算机研究与发展,2016,53(1):93-112. 被引量：47
3苏本跃,蒋京,汤庆丰,盛敏.基于函数型数据分析方法的人体动态行为识别[J].自动化学报,2017,43(5):866-876. 被引量：17
4孙彬,孔德慧,张雯晖,贾文浩.基于深度图像的人体行为识别综述[J].北京工业大学学报,2018,44(10):1353-1368. 被引量：8
5张索非,冯烨,吴晓富.基于深度卷积神经网络的目标检测算法进展[J].南京邮电大学学报（自然科学版）,2019,39(5):72-80. 被引量：29
6郭明祥,宋全军,徐湛楠,董俊,谢成军.基于三维残差稠密网络的人体行为识别算法[J].计算机应用,2019,39(12):3482-3489. 被引量：9
7蔡强,邓毅彪,李海生,余乐,明少锋.基于深度学习的人体行为识别方法综述[J].计算机科学,2020,47(4):85-93. 被引量：32
8伍晓晖,田启川.交通标志识别方法综述[J].计算机工程与应用,2020,56(10):20-26. 被引量：34
9赫磊,邵展鹏,张剑华,周小龙.基于深度学习的行为识别算法综述[J].计算机科学,2020,47(S01):139-147. 被引量：24
10蓝金辉,王迪,申小盼.卷积神经网络在视觉图像检测的研究进展[J].仪器仪表学报,2020,41(4):167-182. 被引量：82

共引文献66

1谈笑.基于Spark大数据平台的老年病风险预警模型[J].微型电脑应用,2020,36(2):71-74. 被引量：2
2毛天雅,余磊,周啸辉,姚天,万文文,熊邦书,欧巧凤.基于改进MobileNet V1的红外图像人体行为识别方法[J].辽宁工程技术大学学报（自然科学版）,2023(3):362-369. 被引量：1
3朱文和.基于高斯平滑的视频时序检测算法[J].大众标准化,2021(2):253-254.
4周前祥,郭华岭,廖德智.载人航天器地理位置指示器工效学设计仿真软件的研制[J].计算机仿真,2000,17(1):60-63.
5阿里木·库尔班,阿地拉,吐热尼萨·麦麦提明,解文琴,吐尔根·依布拉音,卡哈尔江·阿比的热西提.基于Kinect的命名实体标注工具的研究与实现[J].电脑知识与技术,2018,14(5):67-70.
6吴恺华,郑皓,谢飞.高速公路服务区中的城市形象塑造策略研究[J].公路,2018,63(11):199-203. 被引量：7
7陈煜平,邱卫根.基于CNN/LSTM和稀疏下采样的人体行为识别[J].计算机工程与设计,2019,40(5):1445-1450. 被引量：10
8罗会兰,童康,孔繁胜.基于深度学习的视频中人体动作识别进展综述[J].电子学报,2019,47(5):1162-1173. 被引量：67
9陈煜平,邱卫根.基于视觉的人体行为识别算法研究综述[J].计算机应用研究,2019,36(7):1927-1934. 被引量：21
10徐寅鹏,臧严,李秋洁.基于关节数据的人体动作识别[J].电脑知识与技术,2019,15(9X):200-203.

1郑小柔,沈金聪,林汉民,郑誉煌.基于固态面阵激光雷达的人体行为识别研究[J].科技创新与应用,2023,13(11):30-33.
2王林,田晨光.融合注意力和多尺度时空图网络的人体行为识别[J].单片机与嵌入式系统应用,2023,23(4):41-44.
3王小妍.影响花椒病虫害发生的因素及防治措施分析[J].河北农机,2022(23):151-153.
4单东风,于磊,骆文杰,熊思璇,刘家仁,吴克伟.多任务对比学习的自监督视频表达[J].计算机科学与应用,2023,13(3):433-443.
5乔迤,曲毅.基于自适应融合权重的人体行为识别方法[J].计算机工程与设计,2023,44(3):845-851. 被引量：1
6刘大亮,张学勇,姜福东,唐岩,孙燕霞,宋来庆,刘学卿.苹果花芽休眠及萌芽早期生理变化及其与气温、光照变化的相关性[J].烟台果树,2023(1):9-14.
7冯雨威,吴丽君.基于时空注意力金字塔卷积的动作识别[J].网络安全与数据治理,2023,42(2):76-82.
8李萱峰,张奇.基于时空深度度量学习的单样本人体行为识别算法[J].电脑知识与技术,2023,19(7):24-26. 被引量：1
9靳巾,张育嘉,徐叙远,刘孟洋.基于播放速率预测的自监督视频表征算法研究[J].网络新媒体技术,2023,12(2):11-18.
10陈泯融,彭俊杰,曾国强.基于多流融合网络的3D骨架人体行为识别[J].华南师范大学学报（自然科学版）,2023,55(1):94-101. 被引量：4

计算机技术与发展

2023年第4期

浏览历史

内容加载中请稍等...

基于注意力机制和残差网络的视频行为识别

参考文献6

二级参考文献24

共引文献66

相关作者

相关机构

相关主题

浏览历史