面向视频中人体行为识别的复合型深度神经网络被引量：6

Composite Deep Neural Network for Human Activities Recognition in Video

下载PDF

导出

摘要在视频人体行为识别研究中三维卷积神经网络和双流卷积神经网络均存在不足.针对此种情况,文中提出结合双流网络架构和三维网络架构的复合型深度神经网络.在双流架构的时间流子网络和空间流子网络部分均采用改进的R(2+1)D卷积神经网络,分别从视频的RGB图像序列和光流图像序列中学习行为表示和分类方法,并融合时间流子网络、空间流子网络的分类结果.进一步地,在网络训练过程中,提出基于梯度中心化算法改进的带动量的随机梯度下降算法,在不改变网络结构的情况下提高网络的泛化性能.实验表明,文中网络在UCF101、HMDB51数据集上均获得较高的识别精度. Aiming at the deficiencies of 3D convolutional neural network and two-stream convolutional neural network for human activities recognition in video,a composite deep neural network combining two-stream convolutional network and 3D convolutional network is proposed.The improved residual(2+1)D convolutional neural network is utilized in both the temporal sub-network and the spatial sub-network of two-stream architecture.Behavioral representation and classification methods are learned from RGB and optical flow of video,respectively.The classification results of temporal stream and spatial stream sub-networks are combined.Furthermore,in the process of network training,stochastic gradient descent with the momentum improved by gradient centralization algorithm is proposed to improve the network generalization performance without varying the network structure.Experimental results show that the proposed network achieves higher accuracy on UCF101 and HMDB51.

作者黄敏尚瑞欣钱惠敏 HUANG Min;SHANG Ruixing;QIAN Huimin(College of Energy and Electrical Engineering,Hohai University,Nanjing 211100)

机构地区河海大学能源与电气学院

出处《模式识别与人工智能》 EI CSCD 北大核心 2022年第6期562-570,共9页 Pattern Recognition and Artificial Intelligence

关键词人体行为识别双流卷积网络三维卷积神经网络梯度中心化 Human Activity Recognition Two-Stream Convolutional Network 3D Convolution Neural Network Gradient Centralization

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献50

1潘雪峰,吴思,李锦涛,张勇东,刘金刚.动态背景体育运动视频合成对比[J].计算机应用研究,2006,23(5):255-257. 被引量：3
2黄学祥,时中,宋爱国,胡天健.基于惯性动作捕捉的主从遥操作关节空间直接控制方法[J].东南大学学报（自然科学版）,2016,46(2):283-288. 被引量：3
3唐铂,李振华,王春勇,来建成,严伟.线阵扫描三维成像激光雷达系统[J].激光与红外,2017,47(11):1358-1364. 被引量：10
4胡正平,张乐,李淑芳,孙德纲.视频监控系统异常目标检测与定位综述[J].燕山大学学报,2019,43(1):1-12. 被引量：23
5谢克.浅析立定跳远易错动作与解决对策[J].体育教学,2019,39(2):74-76. 被引量：3
6罗会兰,童康.时空压缩激励残差乘法网络的视频动作识别[J].通信学报,2019,40(10):189-198. 被引量：7
7胡正平,刁鹏成,张瑞雪,李淑芳,赵梦瑶.基于注意力机制的时间分组深度网络行为识别算法[J].模式识别与人工智能,2019,32(10):892-900. 被引量：10
8杨兴明,范楼苗.基于区域特征融合网络的群组行为识别[J].模式识别与人工智能,2019,32(12):1116-1121. 被引量：3
9祝莉,王正珍,朱为模.健康中国视域中的运动处方库构建[J].体育科学,2020,40(1):4-15. 被引量：138
10胡正平,赵梦瑶,辛丙一.结合全局与局部视频表示的视频异常检测算法[J].模式识别与人工智能,2020,33(2):133-140. 被引量：6

引证文献6

1孙浩鹏.基于PC-SGD的深度学习雷达人体点云补全[J].重庆理工大学学报（自然科学）,2022,36(11):127-134.
2郑小柔,沈金聪,林汉民,郑誉煌.基于固态面阵激光雷达的人体行为识别研究[J].科技创新与应用,2023,13(11):30-33.
3罗会兰,于亚威,王婵娟.多维特征激励网络用于视频行为识别[J].计算机科学,2023,50(S02):226-233.
4杨凯翔,高君宇,冯洋博,徐常胜.时序动作单元感知的开集动作识别[J].模式识别与人工智能,2023,36(9):806-817.
5孔令凯,王森.人工智能辅助姿态识别和运动处方的研究[J].现代电子技术,2024,47(4):139-142.
6吉根林,戚小莎,王嘉琦.基于深度学习的视频异常检测研究综述[J].模式识别与人工智能,2024,37(2):128-143.

1邓淼磊,高振东,李磊,陈斯.基于深度学习的人体行为识别综述[J].计算机工程与应用,2022,58(13):14-26. 被引量：16
2胡逸群.基于特征提取的外卖O2O订单送达时间预测研究[J].中国物价,2022(6):120-123.
3林剑峰.一封匿名信--有关拖课[J].师道（人文）,2022(6):47-49.
4董大亮,冯叶妮.二战爆发前美国对日本在南海地区扩张行动的反应[J].内蒙古民族大学学报（社会科学版）,2022,48(2):20-26.
5李猛.基于差分进化算法的电力变压器故障监测方法[J].电气应用,2022,41(6):9-15. 被引量：3
6邵玉豪,林嘉懿,吴盛俊.基于随机梯度下降算法实现对环上量子游走的动态完全控制[J].南京大学学报（自然科学版）,2022,58(2):219-227. 被引量：1
7李林峰,马文书,胡坤然.不同植骨材料应用于腰后路椎间植骨中的临床对比研究[J].粘接,2022(6):50-54.
8袁明星,刘馨,张雪波.驱动约束下直线电机自适应鲁棒优化控制[J].控制工程,2022,29(5):813-818.
9张晗,邬群勇.基于LDA和优化蚁群的OD流向时空语义聚类算法[J].地球信息科学学报,2022,24(5):837-850. 被引量：2
10康冠,蓝旭,罗想利,李继东,赵霖,赵珂,闫亮,张旭,厉孟.锁定型后足融合逆行髓内钉胫距跟融合术治疗Charcot足的疗效分析[J].中国骨与关节损伤杂志,2022,37(6):649-651. 被引量：1

模式识别与人工智能

2022年第6期

浏览历史

内容加载中请稍等...

面向视频中人体行为识别的复合型深度神经网络被引量：6

同被引文献50

引证文献6

相关作者

相关机构

相关主题

浏览历史

面向视频中人体行为识别的复合型深度神经网络 被引量：6

同被引文献50

引证文献6

相关作者

相关机构

相关主题

浏览历史

面向视频中人体行为识别的复合型深度神经网络被引量：6