基于三维残差稠密网络的人体行为识别算法被引量：9

Human behavior recognition algorithm based on three-dimensional residual dense network

下载PDF

导出

摘要针对现有的人体行为识别算法不能充分利用网络多层次时空信息的问题,提出了一种基于三维残差稠密网络的人体行为识别算法。首先,所提算法使用三维残差稠密块作为网络的基础模块,模块通过稠密连接的卷积层提取人体行为的层级特征;其次,经过局部特征聚合自适应方法来学习人体行为的局部稠密特征;然后,应用残差连接模块来促进特征信息流动以及减轻训练的难度;最后,通过级联多个三维残差稠密块实现网络多层局部特征提取,并使用全局特征聚合自适应方法学习所有网络层的特征用以实现人体行为识别。设计的网络算法在结构上增强了对网络多层次时空特征的提取,充分利用局部和全局特征聚合学习到更具辨识力的特征,增强了模型的表达能力。在基准数据集KTH和UCF-101上的大量实验结果表明,所提算法的识别率(top-1精度)分别达到了93.52%和57.35%,与三维卷积神经网络(C3D)算法相比分别提升了3.93和13.91个百分点。所提算法框架有较好的鲁棒性和迁移学习能力,能够有效地处理多种视频行为识别任务。 Concerning the problem that the existing algorithm for human behavior recognition cannot fully utilize the multi-level spatio-temporal information of network, a human behavior recognition algorithm based on three-dimensional residual dense network was proposed. Firstly, the proposed network adopted the three-dimensional residual dense blocks as the building blocks, these blocks extracted the hierarchical features of human behavior through the densely-connected convolutional layer. Secondly, the local dense features of human behavior were learned by the local feature aggregation adaptive method. Thirdly, residual connection module was adopted to facilitate the flow of feature information and mitigate the difficulty of training. Finally, after realizing the multi-level local feature extraction by concatenating multiple three-dimensional residual dense blocks, the aggregation adaptive method for global feature was proposed to learn the features of all network layers for realizing human behavior recognition. In conclusion, the proposed algorithm has improved the extraction of network multi-level spatio-temporal features and the features with high discrimination are learned by local and global feature aggregation, which enhances the expression ability of model. The experimental results on benchmark datasets KTH and UCF-101 show that, the recognition rate(top-1 recognition accuracy) of the proposed algorithm can achieve 93.52% and 57.35% respectively, which outperforms that of Three-Dimensional Convolutional neural network(C3 D) algorithm by 3.93 percentage points and 13.91 percentage points respectively. The proposed algorithm framework has excellent robustness and migration learning ability, and can effectively handle multiple video behavior recognition tasks.

作者郭明祥宋全军徐湛楠董俊谢成军 GUO Mingxiang;SONG Quanjun;XU Zhannan;DONG Jun;XIE Chengjun(Institute of Intelligent Machines,Chinese Academy of Sciences,Hefei Anhui 230031,China;University of Science and Technology of China,Hefei Anhui 230026,China)

机构地区中国科学院合肥智能机械研究所中国科学技术大学

出处《计算机应用》 CSCD 北大核心 2019年第12期3482-3489,共8页 journal of Computer Applications

基金国家重点研发计划项目(2017YFC0806504) 安徽省科技强警项目(201904d07020007)~~

关键词人体行为识别视频分类三维残差稠密网络深度学习特征聚合 human behavior recognition video classification three-dimensional residual dense network deep learning feature aggregation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李英杰,尹怡欣,邓飞.一种有效的行为识别视频特征[J].计算机应用,2011,31(2):406-409. 被引量：10
2李瑞峰,王亮亮,王珂.人体动作行为识别研究综述[J].模式识别与人工智能,2014,27(1):35-48. 被引量：96

二级参考文献143

1BERGTHOLDT M, KAPPES J, SCHMIDT S, et al. A study of parts-based object class detection using complete graphs[J]. International Journal of Computer Vision, 2010, 87(1/2) : 93 - 117.
2LAPTEV I, LINDEBERG T. Local descriptors for spatio-temporal recognition[C] // Proceedings of ECCV Workshop on Spatial Coherence for Visual Motion Analysis. New York: Springer, 2004:1 - 12.
3LAPTEV I, LINDEBERG T. Velocity adaptation of space-time interest points[ C] // Proceedings of the International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2004:52 - 56.
4SINGH M, BASU A, MANDAL M K. Human activity recognition based on silhouette directionality[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(9) : 1280 - 1292.
5SCHULDT C , LAPTEV I , CAPUTO B . Recognizing human actions: A local SVM approach [C] // Proceedings of the International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2004:32 -36.
6BUTUROVIC L J. PCP: A program for supervised classification of gene expression profiles[J]. Bioinformatics, 2006, 22(2): 245-247.
7Mokhber A,Achard C,Milgram M. Recognition of Human Behavior by Space-Time Silhouette Characterization[J].Pattern Recognition Let-ters,2008,(01):81-89.
8Polat E,Yeasin M,Sharma R. Robust Tracking of Human Body Parts for Collaborative Human Computer Interaction[J].{H}COMPUTER VISION AND IMAGE UNDERSTANDING,2003,(01):44-69.
9Kjellstr?m H,Romero J,Kragic' D. Visual Object-Action Recogni-tion:Inferring Object Affordances from Human Demonstration[J].{H}COMPUTER VISION AND IMAGE UNDERSTANDING,2011,(01):81-90.
10Suma E A,Krum D M,Lange B. Adapting User Interfaces for Gestural Interaction with the Flexible Action and Articulated Skele-ton Toolkit[J].Computers& Graphics,2012,(03):193-201.

共引文献104

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2许志豪,高铭,殷绍轩,崔杰.基于OpenPose的滑雪动作分析[J].智能计算机与应用,2022,12(4):101-103. 被引量：6
3周前祥,郭华岭,廖德智.载人航天器地理位置指示器工效学设计仿真软件的研制[J].计算机仿真,2000,17(1):60-63.
4姜莹礁,赵怀勋,贾琪,王寻.基于聚类RBF神经网络的人体行为识别[J].计算机应用与软件,2013,30(2):47-49. 被引量：6
5洪运国.基于改进Canny算子和神经网络的人体行为识别模型[J].计算机工程与应用,2013,49(8):156-159. 被引量：4
6韩骏浩,赵怀勋.基于监控系统的人体行为识别技术研究[J].网络安全技术与应用,2014(6):23-24. 被引量：1
7向金海,邹秀斌,樊恒,邓君丽.基于时空局部特征融合的人体行为识别[J].武汉大学学报（工学版）,2014,47(4):571-576.
8韩骏浩,赵怀勋.一种改进的人体行为检测与跟踪算法研究[J].电子科技,2014,27(9):25-28.
9张飞燕,李俊峰.基于光流速度分量加权的人体行为识别[J].浙江理工大学学报（自然科学版）,2015,33(1):115-123. 被引量：2
10应锐,蔡瑾,冯辉,杨涛,胡波.基于运动块及关键帧的人体动作识别[J].复旦学报（自然科学版）,2014,53(6):815-822. 被引量：6

同被引文献33

1何书芹,梁西银,颜昌林,郭贝,刘昊.基于多尺度熵和动态时间规整的步态身份识别[J].重庆大学学报（自然科学版）,2018,41(11):84-91. 被引量：14
2王华华,黄龙,周远文,赵永宽.改进的mRmR特征选择方法在人体行为识别中的应用[J].重庆邮电大学学报（自然科学版）,2019,31(2):261-269. 被引量：4
3窦方正,孙汉昌,孙显,刁文辉,付琨.基于DBN与对象融合的遥感图像变化检测方法[J].计算机工程,2018,44(4):294-298. 被引量：32
4王献锋,黄文准,张善文.基于加权局部判别CCA的多视角步态识别方法[J].计算机工程与应用,2018,54(21):90-94. 被引量：11
5庞悦,赵威,张雅楠,许宏科.基于深度学习的LSTM的交通流量预测[J].单片机与嵌入式系统应用,2019,19(3):72-75. 被引量：6
6鹿天然,于凤芹,陈莹.一种基于线性序列差异分析降维的人体行为识别方法[J].计算机工程,2019,45(3):237-241. 被引量：11
7谢国亚,刘宇,路永乐,邸克,郭俊启,余跃.基于MEMS惯性传感器时域特征的人体行为识别[J].压电与声光,2019,41(2):221-224. 被引量：7
8孙佳美,吴成茂.正则化图形模糊聚类及鲁棒分割算法[J].计算机工程与应用,2019,55(11):179-186. 被引量：30
9石英,孙明军,李之达,罗佳齐,杨明东.基于运动历史图像与卷积神经网络的行为识别[J].湘潭大学学报（自然科学版）,2019,41(2):109-117. 被引量：14
10田联房,吴啟超,杜启亮,黄理广,李淼,张大明.基于人体骨架序列的手扶电梯乘客异常行为识别[J].华南理工大学学报（自然科学版）,2019,47(4):10-19. 被引量：19

引证文献9

1王潇齐,刘铭原,孙宜帆,崔钰涵.基于改进稠密轨迹与Fisher向量编码的人体行为识别方法[J].物联网技术,2020,10(9):24-26.
2王小亮,苏新彦,孔庆珊,崔敏,赵飞飞,李剑.基于深度学习的地下震源定位方法[J].单片机与嵌入式系统应用,2020,20(12):45-48.
3蒋丽,黄仕建,严文娟.基于低秩行为信息和多尺度卷积神经网络的人体行为识别方法[J].计算机应用,2021,41(3):721-726. 被引量：7
4徐传淇,姚宇,王浩然,胡智翔,徐传健.基于局部多片段的轻量级行为识别网络MLNet[J].计算机应用,2021,41(S01):51-58.
5刘志鹏.面向体育训练的人体姿势实时识别研究[J].闽南师范大学学报（自然科学版）,2022,35(1):115-120. 被引量：1
6王志强.一种基于三维残差网络分组膨胀卷积的人体行为识别方法[J].现代计算机,2022,28(5):65-70. 被引量：1
7倪苒岩,张轶.基于视频时空特征的行为识别方法[J].计算机应用,2023,43(2):521-528.
8陈西江,梁全恩,韩贤权,安庆.利用多时间尺度卷积的视频行为识别网络[J].国防科技大学学报,2023,45(3):136-145.
9牛为华,翟瑞冰.基于改进3D ResNet的视频人体行为识别方法研究[J].计算机工程与科学,2023,45(10):1814-1821.

二级引证文献9

1李嘉智,刘宁.基于改进LRCN的人体运动识别方法[J].电子测量技术,2023,46(18):186-192.
2刘志鹏.面向体育训练的人体姿势实时识别研究[J].闽南师范大学学报（自然科学版）,2022,35(1):115-120. 被引量：1
3王松.基于时空图卷积网络改进的人体行为识别方法[J].楚雄师范学院学报,2022,37(3):91-100.
4高杨.基于时空图卷积网络的课堂教学行为分析[J].新疆师范大学学报（自然科学版）,2023,42(1):89-96.
5李建平,赖永倩.基于注意力机制和残差网络的视频行为识别[J].计算机技术与发展,2023,33(4):69-74.
6李智强.基于多尺度变换的变电站开关柜局部放电识别方法[J].电气技术与经济,2023(9):203-205.
7张晓蓉,李伟,石岩,陈鹏,张鹏程,李清,张长青.基于时空信息可信融合的视频监控暴力检测算法[J].计算机应用,2023,43(S02):65-71.
8刘琳.基于卷积神经网络的学生课堂行为识别系统设计[J].现代电子技术,2024,47(6):142-146.
9曾光辉.基于匹配自主学习的网络信息识别与分类算法[J].自动化与信息工程,2024,45(3):45-50.

1杨晨,王婕婷,李飞江,钱宇华.基于概率的支持向量数据描述方法[J].计算机应用,2019,39(11):3134-3139. 被引量：3
2张乃光,李珊珊,薛子育.基于深度学习的盗版视频分类[J].广播电视信息,2019,0(S01):84-87. 被引量：1
3杨丰嘉.基于Log-Euclidean词袋模型与基于Stein核稀疏编码的人体行为识别算法的优化与改进[J].科技创新与应用,2019,0(35):10-11. 被引量：2
4马翠红,王毅,毛志强.基于时空双流与局部融合网络的行为识别[J].工业控制计算机,2019,32(11):71-72.
5金志强,李晓辉,吕仁健,汪涵,程凯.基于控制理论的软件自适应方法[J].计算机与现代化,2019,0(11):49-54. 被引量：1
6刘德宝,王献忠,刘明敏.基于拉格朗日高斯变换的奥运会视频分类机制研究[J].光电子．激光,2019,30(10):1110-1115. 被引量：1
7郑鹰,刘小强,张秋义,付强.时空信息基础设施建设与服务标准体系框架构建[J].科技管理研究,2019,39(21):1-6. 被引量：7
8朱亚杰.自动贴片机未来发展趋势[J].电子乐园,2019(19):48-48.
9李晓薇,余江,常俊,杨锦朋,冉亚鑫.一种基于CSI的非合作式人体行为识别方法[J].计算机科学,2019,46(12):266-271. 被引量：9
10李丹霞,马乐荣,何景.LBSN中融合时空信息的连续兴趣点推荐[J].计算机应用研究,2019,36(12):3574-3578. 被引量：3

计算机应用

2019年第12期

浏览历史

内容加载中请稍等...

基于三维残差稠密网络的人体行为识别算法被引量：9

参考文献2

二级参考文献143

共引文献104

同被引文献33

引证文献9

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于三维残差稠密网络的人体行为识别算法 被引量：9

参考文献2

二级参考文献143

共引文献104

同被引文献33

引证文献9

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于三维残差稠密网络的人体行为识别算法被引量：9