基于多阶信息融合的行为识别方法研究被引量：9

Multi-order Information Fusion Method for Human Action Recognition

下载PDF

导出

摘要双流卷积神经网络能够获取视频局部空间和时间特征的一阶统计信息,测试阶段将多个视频局部特征的分类器分数平均作为最终的预测.但是,一阶统计信息不能充分建模空间和时间特征分布,测试阶段也未考虑使用多个视频局部特征之间的更高阶统计信息.针对这两个问题,本文提出一种基于二阶聚合的视频多阶信息融合方法.首先,通过建立二阶双流模型得到视频局部特征的二阶统计信息,与一阶统计信息形成多阶信息.其次,将基于多阶信息的视频局部特征分别进行二阶聚合,形成高阶视频全局表达.最后,采用两种策略融合该表达.实验表明,本文方法能够有效提高行为识别精度,在HMDB51和UCF101数据集上的识别准确率比双流卷积神经网络分别提升了8%和2:1%,融合改进的密集点轨迹(Improved dense trajectory,IDT)特征之后,其性能进一步提升. The classical two-stream convolutional neural network(CNN)can capture the first-order statistics of the local spatial and temporal features from an input video,while making final predictions by averaging the softmax scores of the local video features.However,the first-order statistics can not fully characterize the distribution of the spatial and temporal features,while higher-order information inherent in local features is discarded at the test stage.To solve the two problems above,this paper proposes a multi-order information fusion method for human action recognition.To this end,we first introduce a novel two-stream CNN model for capturing second-order statistics of the local spatial and temporal features,which,together with the original first-order statistics,forms the so-called multi-order information.We perform individually second-order aggregation of these extracted local multi-order information to compute global video representations.Finally,two strategies are proposed to fuse video representations for prediction.The experimental results demonstrate that our proposed method significantly improves recognition accuracy over the original two-stream CNN model,i.e.,8%and 2.1%gains on the HMDB51 and UCF101,respectively.The performance of our method is further improved by combining traditional IDT(improved dense trajectory)features.

作者张冰冰葛疏雨王旗龙李培华 ZHANG Bing-Bing;GE Shu-Yu;WANG Qi-Long;LI Pei-Hua(School of Information and Communication Engineering,Dalian University of Technology,Dalian 116033;College of Intelligence and Computing,Tianjin University,Tianjin 300350)

机构地区大连理工大学信息与通信工程学院天津大学智能与计算学部

出处《自动化学报》 EI CAS CSCD 北大核心 2021年第3期609-619,共11页 Acta Automatica Sinica

基金国家自然科学基金(61971086,61806140,61471082)资助。

关键词行为识别双流卷积神经网络多阶信息融合二阶聚合 Human action recognition two-stream convolutional neural network multi-order information fusion second-order aggregation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：132
2苏本跃,蒋京,汤庆丰,盛敏.基于函数型数据分析方法的人体动态行为识别[J].自动化学报,2017,43(5):866-876. 被引量：17
3周风余,尹建芹,杨阳,张海婷,袁宪锋.基于时序深度置信网络的在线人体动作识别[J].自动化学报,2016,42(7):1030-1039. 被引量：18

二级参考文献79

1Fujiyoshi H, Lipton A J, Kanade T. Real-time human mo- tion analysis by image skeletonization. IEICE Transactions on Information and Systems, 2004, 87-D(1): 113-120.
2Chaudhry R, Ravichandran A, Hager G, Vidal R. His- tograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of hu- man actions. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1932-1939.
3Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Con- ference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893.
4Lowe D G. Object recognition from local scale-invariant fea- tures. In: Proceedings of the 7th IEEE International Confer- ence on Computer Vision. Kerkyra: IEEE, 1999. 1150-1157.
5Schuldt C, Laptev I, Caputo B. Recognizing human actions: a local SVM approach. In: Proceedings of the 17th In- ternational Conference on Pattern Recognition. Cambridge: IEEE, 2004. 32-36.
6Dollar P, Rabaud V, Cottrell G, Belongie S. Behavior recog- nition via sparse spatio-temporal features. In: Proceedings of the 2005 IEEE International Workshop on Visual Surveil- lance and Performance Evaluation of Tracking and Surveil- lance. Beijing, China: IEEE, 2005.65-72.
7Rapantzikos K, Avrithis Y, Kollias S. Dense saliency-based spatiotemporal feature points for action recognition. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1454-1461.
8Knopp J, Prasad M, Willems G, Timofte R, Van Gool L. Hough transform and 3D SURF for robust three dimensional classification. In: Proceedings of the llth European Confer- ence on Computer Vision (ECCV 2010). Berlin Heidelberg: Springer. 2010. 589-602.
9Klaser A, Marszaeek M, Schmid C. A spatio-temporal de- scriptor based on 3D-gradients. In: Proceedings of the 19th British Machine Vision Conference. Leeds: BMVA Press, 2008. 99.1-99.10.
10Wang H, Ullah M M, Klaser A, Laptev I, Schmid C. Evalua- tion of local spatio-temporal features for action recognition. In: Proceedings of the 2009 British Machine Vision Confer- ence. London, UK: BMVA Press, 2009. 124.1-124.11.

共引文献162

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
3童立靖,徐光亚,冯金芝.一种基于CNN与位姿自适应的运动模型生成方法[J].西安文理学院学报（自然科学版）,2024,27(2):1-7.
4贾双成,杨凤萍.基于神经网络的人体动态行为智能识别方法[J].科技通报,2020(1):60-63. 被引量：1
5柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
6王明松,秦永佩,张鑫鑫.基于TensorFlow的动作行为识别原理与实践[J].电子技术（上海）,2021,50(4):112-113. 被引量：1
7周宏宇,严春峰,宋旭,刘国英.基于加权三视角运动历史图像与时序分割的动作识别算法[J].电子测量与仪器学报,2020(11):194-203. 被引量：6
8吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
9王鹏.氦氖激光照射耳穴治疗冠心病30例[J].中华理疗杂志,2000,23(2):119-120.
10杨观赐,杨静,苏志东,陈占杰.改进的YOLO特征提取算法及其在服务机器人隐私情境检测中的应用[J].自动化学报,2018,44(12):2238-2249. 被引量：22

同被引文献80

1肖致明,刘文,杨建芳,乔韩.心理状态对火车司机安全绩效影响综述[J].中国安全科学学报,2022,32(S02):13-18. 被引量：2
2周育新,白宏阳,李伟,郭宏伟,徐啸康.基于关键帧的轻量化行为识别方法研究[J].仪器仪表学报,2020,41(7):196-204. 被引量：8
3沈海燕,冯云梅,史宏.基于信息融合的客运站人体异常行为识别研究[J].公路交通科技,2009(S1):58-61. 被引量：2
4马钰锡,谭励,董旭,于重重.面向智能监控的行为识别[J].中国图象图形学报,2019,24(2):282-290. 被引量：34
5庄伟源,成运,林贤明,苏松志,曹冬林,李绍滋.关键肢体角度直方图的行为识别[J].智能系统学报,2015,10(1):20-26. 被引量：1
6陈婷婷,阮秋琦,安高云.视频中人体行为的慢特征提取算法[J].智能系统学报,2015,10(3):381-386. 被引量：8
7姬晓飞,王昌汇,王扬扬.分层结构的双人交互行为识别方法[J].智能系统学报,2015,10(6):893-900. 被引量：4
8龚冬颖,黄敏,张洪博,李绍滋.RGBD人体行为识别中的自适应特征选择方法[J].智能系统学报,2017,12(1):1-7. 被引量：4
9苏本跃,蒋京,汤庆丰,盛敏.基于函数型数据分析方法的人体动态行为识别[J].自动化学报,2017,43(5):866-876. 被引量：17
10罗海波,许凌云,惠斌,常铮.基于深度学习的目标跟踪方法研究现状与展望[J].红外与激光工程,2017,46(5):6-12. 被引量：100

引证文献9

1钟秋波,郑彩明,朴松昊.时空域融合的骨架动作识别与交互研究[J].智能系统学报,2020,15(3):601-608. 被引量：8
2杨观赐,李杨,赵乐,刘赛赛,何玲,刘丹.基于传感器数据的用户行为识别方法综述[J].包装工程,2021,42(18):94-102. 被引量：8
3凌永标,毛峰,杨岚岚,邱兴卫,张志锐,张杰.基于混合注意力网络的安全工器具检测[J].计算机技术与发展,2022,32(6):209-214.
4张海超,张闯.融合注意力的轻量级行为识别网络研究[J].电子测量与仪器学报,2022,36(5):173-179. 被引量：8
5乔迤,曲毅.基于自适应融合权重的人体行为识别方法[J].计算机工程与设计,2023,44(3):845-851. 被引量：1
6沈加炜,陆一鸣,陈晓艺,钱美玲,陆卫忠.基于深度学习的人体行为检测方法研究综述[J].计算机与现代化,2023(9):1-9. 被引量：1
7曾明如,熊嘉豪,祝琴.基于T-Fusion的TFP3D人体行为识别算法[J].计算机集成制造系统,2023,29(12):4032-4039.
8苏本跃,郭梦娟,朱邦国,盛敏.顺序主导和方向驱动下基于点边特征的人体动作识别方法[J].控制与决策,2024,39(9):3090-3098.
9朱高伟.基于骨架数据的列车司机异常行为检测[J].计算机科学与应用,2024,14(7):42-50.

二级引证文献26

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2彭道刚,潘俊臻,王丹豪,胡捷.基于改进YOLO v5的电厂管道油液泄漏检测[J].电子测量与仪器学报,2022,36(12):200-209. 被引量：20
3朱望纯,张博.超轻量人脸关键点检测算法[J].电子测量技术,2023,46(5):98-104. 被引量：4
4李琪,墨瀚林,赵婧涵,郝宏翔,李华.时空双仿射微分不变量及骨架动作识别[J].中国图象图形学报,2021,26(12):2879-2891. 被引量：3
5曾胜强,李琳.基于姿态校正与姿态融合的2D/3D骨架动作识别方法[J].计算机应用研究,2022,39(3):900-905. 被引量：9
6易思恒,陈永辉,王赋攀,蔡婷.面向人机交互的通道注意力位移图神经网络[J].小型微型计算机系统,2022,43(3):604-610. 被引量：1
7罗旭飞,崔敏,张鹏.基于骨骼的双支融合模型的人体行为识别[J].电子测量技术,2022,45(11):140-146. 被引量：3
8常丽,张雪,蒋辉,杨娟,万紫玉.融合YOLOv5s与SRGAN的实时隧道火灾检测[J].电子测量与仪器学报,2022,36(8):223-230. 被引量：13
9武东辉,许静,陈继斌,孙彦玺,仇森.基于融合注意力机制与CNN-LSTM的人体行为识别算法[J].科学技术与工程,2023,23(2):681-689. 被引量：10
10周宏伟,于安宁,宋馨谷,张新蕙,王瑾.基于智能可穿戴技术的骑行手套设计研究[J].艺术与设计（理论版）,2023(5):118-121. 被引量：1

1林玲,陈姚节,徐新,郭同欢.轨迹特征融合双流模型的动态手势识别[J].计算机技术与发展,2020,30(12):34-39. 被引量：3
2李瑞祥,赵海涛,葛小三,袁占良.多匹配策略融合的无人机影像匹配方法[J].测绘科学,2021,46(3):87-95. 被引量：7
3周榴,董怡,夏威,赵星羽,张琪,王文平,高欣,杨军.基于超声影像组学的原发性肝细胞癌分级预测[J].中国医学物理学杂志,2020,37(1):59-64. 被引量：13
4李冉.新视角下人体域网模型的二阶统计量[J].现代信息科技,2020,4(19):41-44.
5黄继斌,何怡刚,隋永波,黄源,吴裕庭.瑞利衰落信道模型的综合验证方法[J].电子测量与仪器学报,2020(11):10-18. 被引量：4
6Jing Wang,Liyang Cao,Yunhai Zhang,Yongsheng Liu,Hui Fang,Jie Chen.Effect of mass transfer channels on flexural strength of C/SiC composites fabricated by femtosecond laser assisted CVI method with optimized laser power[J].Journal of Advanced Ceramics,2021,10(2):227-236. 被引量：3

自动化学报

2021年第3期

浏览历史

内容加载中请稍等...

基于多阶信息融合的行为识别方法研究被引量：9

参考文献3

二级参考文献79

共引文献162

同被引文献80

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于多阶信息融合的行为识别方法研究 被引量：9

参考文献3

二级参考文献79

共引文献162

同被引文献80

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于多阶信息融合的行为识别方法研究被引量：9