面向时空特征融合的GSTIN动作识别网络

GSTIN with spatiotemporal feature fusion for video action recognition

下载PDF

导出

摘要视频动作识别是计算机视觉领域一个十分具有挑战性的课题,主要任务是利用深度学习等视频智能分析技术识别的深层信息推导出视频人体行为动作。通过结合双流卷积神经网络和三维卷积神经网络的结构特点,提出了一种面向时空特征融合的GSTIN(GoogLeNet based on spatio-temporal intergration network)。GSTIN中设计了时空特征融合模块InBST(inception blend spatio-temporal feature),提升网络对空间特征与时间特征的利用能力;在时空特征融合模块InBST基础上,构建了适合动作识别的多流网络结构。GSTIN在动作识别数据集UCF101、HMDB51上识别精度分别达到了93.8%和70.6%,这表明GSTIN与其他动作识别网络相比具有较好的识别性能。 Video action recognition is a very challenging topic in the field of computer vision.The main task is to use the deep information by intelligent video analysis technology such as deep learning to recognize the human behavior.To further improve the performance of the two main frameworks,this paper proposed GSTIN for spatiotemporal feature fusion.GSTIN designed a spatiotemporal feature fusion module InBST,which could make network obtain the interactive temporal and spatial information.Based on the spatiotemporal feature fusion module InBST,GSTIN constructed a multi branch GSTIN suitable for action recognition.GSTIN was tested two classic video action recognition datasets UCF101 and HMDB51.Compared with the action recognition networks,experimental results show that GSTIN has better recognition performance.

作者李克文张震涛李素杰雷永秀 Li Kewen;Zhang Zhentao;Li Sujie;Lei Yongxiu(College of Computer Science&Technology,China University of Petroleum(East China),Qingdao Shandong 266580,China;SINOPEC Pipeline Storage&Transportation Co.,Ltd.,Xuzhou Jiangsu 221008,China)

机构地区中国石油大学(华东)计算机科学与技术学院中国石化管道储运有限公司

出处《计算机应用研究》 CSCD 北大核心 2021年第8期2479-2484,共6页 Application Research of Computers

基金国家自然科学基金重大项目(51991361) 国家自然科学基金资助项目(61673396)。

关键词深度学习动作识别双流卷积神经网络三维卷积神经网络时空特征融合 deep learning video action recognition two stream convolutional neural network 3D convolutional neural network spatiotemporal feature fusion

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1罗会兰,王婵娟,卢飞.视频行为识别综述[J].通信学报,2018,39(6):169-180. 被引量：37
2胡琼,秦磊,黄庆明.基于视觉的人体动作识别综述[J].计算机学报,2013,36(12):2512-2524. 被引量：123
3蔡强,邓毅彪,李海生,余乐,明少锋.基于深度学习的人体行为识别方法综述[J].计算机科学,2020,47(4):85-93. 被引量：31
4李洪均,丁宇鹏,李超波,张士兵.基于特征融合时序分割网络的行为识别研究[J].计算机研究与发展,2020,57(1):145-158. 被引量：15
5杨天明,陈志,岳文静.基于视频深度学习的时空双流人物动作识别模型[J].计算机应用,2018,38(3):895-899. 被引量：25

二级参考文献11

1Kishore K. Reddy,Mubarak Shah.Recognizing 50 human action categories of web videos[J].Machine Vision and Applications.2013(5)
2Chris Ellis,Syed Zain Masood,Marshall F. Tappen,Joseph J. LaViola,Rahul Sukthankar.Exploring the Trade-off Between Accuracy and Observational Latency in Action Recognition[J].International Journal of Computer Vision.2013(3)
3Rongrong Ji,Hongxun Yao,Xiaoshuai Sun.Actor-independent action search using spatiotemporal vocabulary with appearance hashing[J].Pattern Recognition.2010(3)
4Juan Carlos Niebles,Hongcheng Wang,Li Fei-Fei.Unsupervised Learning of Human Action Categories Using Spatial-Temporal Words[J].International Journal of Computer Vision.2008(3)
5Ivan Laptev.On Space-Time Interest Points[J].International Journal of Computer Vision (-).2005(2-3)
6黎洪松,李达.人体运动分析研究的若干新进展[J].模式识别与人工智能,2009,22(1):70-78. 被引量：38
7同鸣,王凡,王硕,姬成龙.一种3DHOGTCC和3DHOOFG的行为识别新框架[J].计算机研究与发展,2015,52(12):2802-2812. 被引量：2
8单言虎,张彰,黄凯奇.人的视觉行为识别研究回顾、现状及展望[J].计算机研究与发展,2016,53(1):93-112. 被引量：46
9郝亚洲,郑庆华,陈艳平,闫彩霞.面向网络舆情数据的异常行为识别[J].计算机研究与发展,2016,53(3):611-620. 被引量：22
10唐宋,陈利娟,陈志贤,叶茂.基于目标域局部近邻几何信息的域自适应图像分类方法[J].计算机应用,2017,37(4):1164-1168. 被引量：6

共引文献219

1吴晨,孙强,倪宏宇,颜文旭.基于骨架序列提取的异常行为识别[J].计算机系统应用,2022,31(11):215-222. 被引量：1
2钟媛媛,侯庭毅,郭胜福,刘增建.冰箱产线中的AI应用及综合性检测分析[J].家电科技,2022(S01):778-781.
3范银行,赵海峰,张少杰.基于3D卷积残差网络的人体动作识别算法[J].计算机应用研究,2020,37(S02):300-301. 被引量：4
4余金锁,卢先领.基于分割注意力的特征融合CNN-Bi-LSTM人体行为识别算法[J].电子测量与仪器学报,2022,36(2):89-95. 被引量：4
5朱文和.基于高斯平滑的视频时序检测算法[J].大众标准化,2021(2):253-254.
6王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：71
7王鹏.氦氖激光照射耳穴治疗冠心病30例[J].中华理疗杂志,2000,23(2):119-120.
8李尚学.建设一支具有创新能力的教师队伍[J].人民教育,2000(2):16-16. 被引量：2
9毛志强,马翠红,崔金龙,王毅.基于双流卷积与双中心loss的行为识别研究[J].微电子学与计算机,2019,36(3):96-100. 被引量：3
10雷庆,李绍滋,陈锻生.一种结合姿态和场景的图像中人体行为分类方法[J].小型微型计算机系统,2015,36(5):1098-1103. 被引量：4

1刘谋黎.深度卷积神经网络在计算机视觉中的应用研究综述[J].科学大众（科技创新）,2021(7):55-55. 被引量：1
2蒋瑞,刘哲,宋余庆,陈鹏,郝文.基于联合特征学习和多重迁移学习的肝脏病变分类[J].江苏大学学报（自然科学版）,2021,42(5):554-561. 被引量：4
3João P.C.Trigueiro,Raquel S.Borges,Rodrigo L.Lavall,Hallen D.R.Calado,Glaura G.Silva.Polymeric Nanomaterials as Electrolyte and Electrodes in Supercapacitors[J].Nano Research,2009,2(9):733-739. 被引量：1
4Yijie Zhang,Kevin de Haan,Yair Rivenson,Jingxi Li,Apostolos Delis,Aydogan Ozcan.Digital synthesis of histological stains using micro-structured and multiplexed virtual staining of label-free tissue[J].Light(Science & Applications),2020,9(1):1273-1285. 被引量：7
5孙圆龙,徐晓辉,宋涛,崔迎港,司玉龙.高效运算网络在作物叶部病害识别中的研究[J].中国农机化学报,2021,42(7):156-161. 被引量：1
6陈葛,方杨.基于投影函数的人眼检测方法综述[J].现代信息科技,2021,5(5):1-7.
7孟颖,田启川,吴施瑶.基于U型网络复合特征的视网膜血管分割方法[J].计算机应用与软件,2021,38(8):227-232. 被引量：5
8宋晨勇,白皓然,孙伟浩,马皓冉.基于GoogLeNet改进模型的苹果叶病诊断系统设计[J].中国农机化学报,2021,42(7):148-155. 被引量：15
9张焱,张娟,方志军.基于通道注意力和门控循环单元的图像去雨算法[J].计算机应用研究,2021,38(8):2505-2509. 被引量：5
10刘海华,宋永琴.符号互动论视阈下影视剧人物的“自我认同”探究--以台剧《想见你》为例[J].环球首映,2021(6):39-40.

计算机应用研究

2021年第8期

浏览历史

内容加载中请稍等...

面向时空特征融合的GSTIN动作识别网络

参考文献5

二级参考文献11

共引文献219

相关作者

相关机构

相关主题

浏览历史