姿态特征与深度特征在图像动作识别中的混合应用被引量：21

Hybrid of Pose Feature and Depth Feature for Action Recognition in Static Image

下载PDF

导出

摘要人体姿态是动作识别的重要语义线索,而CNN能够从图像中提取有很强判别能力的深度特征,本文从图像局部区域提取姿态特征,从整体图像中提取深度特征,探索两者在动作识别中的互补作用.首先介绍了一种姿态表示方法,每个肢体部件的姿态由描述该部件姿态的一组Poselet检测得分表示.为了抑制检测错误,设计了基于部件的模型作为检测上下文.为了从数量有限的数据集中训练CNN网络,本文使用了预训练和精细调节的方法.在两个数据集中的实验表明,本文介绍的姿态特征与深度特征混合使用,动作识别性能得到了极大提升. Body pose is an important semantic cue for action recognition, and CNN can extract strong discriminative depth feature. This paper extracts pose feature from local image patches and gets depth feature from holistic image, then exploits their complementary relationship in action recognition. A pose representation is introduced, in which pose of a body part is represented by a collection of poselets which describe its pose variability. To suppress detection ambiguity,part-based model is designed as the context of detection for each poselet. CNN is trained through pre-training and fine tuning on the data set with very limited images. Empirical results demonstrate aggressive performance improvement by concatenating pose feature and depth feature.

作者钱银中沈一帆 QIAN Yin-Zhong;SHEN Yi-Fan(School of Software,Changzhou College of Information Technology,Changzhou 213164;School of Computer Science,Fudan University,Shanghai 200433;Shanghai Key Laboratory of Intelligent Information Processing,Fudan University,Shanghai 200433)

机构地区常州信息职业技术学院软件学院复旦大学计算机科学技术学院复旦大学上海市智能信息处理重点实验室

出处《自动化学报》 EI CSCD 北大核心 2019年第3期626-636,共11页 Acta Automatica Sinica

基金江苏高校品牌专业建设工程资助项目(PPZY2015A090) 常州信息职业技术学院自然科学项目(CXZK201803Z)资助~~

关键词动作识别姿态特征 poselet 深度特征 Action recognition pose feature poselet depth feature

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：132
2关秋菊,罗晓牧,郭雪梅,王国利.基于隐马尔科夫模型的人体动作压缩红外分类[J].自动化学报,2017,43(3):398-406. 被引量：3

二级参考文献51

1Fujiyoshi H, Lipton A J, Kanade T. Real-time human mo- tion analysis by image skeletonization. IEICE Transactions on Information and Systems, 2004, 87-D(1): 113-120.
2Chaudhry R, Ravichandran A, Hager G, Vidal R. His- tograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of hu- man actions. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1932-1939.
3Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Con- ference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893.
4Lowe D G. Object recognition from local scale-invariant fea- tures. In: Proceedings of the 7th IEEE International Confer- ence on Computer Vision. Kerkyra: IEEE, 1999. 1150-1157.
5Schuldt C, Laptev I, Caputo B. Recognizing human actions: a local SVM approach. In: Proceedings of the 17th In- ternational Conference on Pattern Recognition. Cambridge: IEEE, 2004. 32-36.
6Dollar P, Rabaud V, Cottrell G, Belongie S. Behavior recog- nition via sparse spatio-temporal features. In: Proceedings of the 2005 IEEE International Workshop on Visual Surveil- lance and Performance Evaluation of Tracking and Surveil- lance. Beijing, China: IEEE, 2005.65-72.
7Rapantzikos K, Avrithis Y, Kollias S. Dense saliency-based spatiotemporal feature points for action recognition. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1454-1461.
8Knopp J, Prasad M, Willems G, Timofte R, Van Gool L. Hough transform and 3D SURF for robust three dimensional classification. In: Proceedings of the llth European Confer- ence on Computer Vision (ECCV 2010). Berlin Heidelberg: Springer. 2010. 589-602.
9Klaser A, Marszaeek M, Schmid C. A spatio-temporal de- scriptor based on 3D-gradients. In: Proceedings of the 19th British Machine Vision Conference. Leeds: BMVA Press, 2008. 99.1-99.10.
10Wang H, Ullah M M, Klaser A, Laptev I, Schmid C. Evalua- tion of local spatio-temporal features for action recognition. In: Proceedings of the 2009 British Machine Vision Confer- ence. London, UK: BMVA Press, 2009. 124.1-124.11.

共引文献133

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
3童立靖,徐光亚,冯金芝.一种基于CNN与位姿自适应的运动模型生成方法[J].西安文理学院学报（自然科学版）,2024,27(2):1-7.
4贾双成,杨凤萍.基于神经网络的人体动态行为智能识别方法[J].科技通报,2020(1):60-63. 被引量：1
5柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
6王明松,秦永佩,张鑫鑫.基于TensorFlow的动作行为识别原理与实践[J].电子技术（上海）,2021,50(4):112-113. 被引量：1
7吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
8王鹏.氦氖激光照射耳穴治疗冠心病30例[J].中华理疗杂志,2000,23(2):119-120.
9杨观赐,杨静,苏志东,陈占杰.改进的YOLO特征提取算法及其在服务机器人隐私情境检测中的应用[J].自动化学报,2018,44(12):2238-2249. 被引量：22
10陈友东,刘嘉蕾,胡澜晓.人机协作中人的动作终点预测[J].北京航空航天大学学报,2019,45(1):35-43. 被引量：5

同被引文献148

1冯文宇,朱洪堃,殷佳炜,费敏锐,张堃.无人CT智能姿态识别算法研究[J].仪器仪表学报,2020(8):188-195. 被引量：8
2刘今越,李顺达,陈梦倩,郭士杰.面向移乘搬运护理机器人的人体姿态视觉识别[J].机器人,2019,41(5):601-608. 被引量：14
3李鹏,王德勇,师文喜,姜志国.大数据环境下基于深度学习的行人再识别[J].北京邮电大学学报,2019,42(6):29-34. 被引量：6
4田慧生.论教学环境对学生学习活动的潜在影响[J].课程．教材．教法,1993,13(10):29-34. 被引量：29
5褚一平,张引,叶修梓,张三元.基于隐条件随机场的自适应视频分割算法[J].自动化学报,2007,33(12):1252-1258. 被引量：11
6邱望标,李超.基于运动捕捉技术的中国少数民族舞蹈艺术保护方法研究[J].电子科技大学学报（社科版）,2009,11(4):101-104. 被引量：13
7许振辉,张峰,孙凤梅,胡占义.基于邻域传递的鱼眼图像的准稠密匹配[J].自动化学报,2009,35(9):1159-1167. 被引量：18
8邱望标,李超.基于运动捕捉技术的中国少数民族舞蹈艺术保护方法研究[J].北京舞蹈学院学报,2009(3):37-40. 被引量：7
9曹巨江,蒙巧利.三维扫描仪技术在用户界面设计中的研究[J].包装工程,2010,31(12):53-56. 被引量：1
10谭志国,鲁敏,胡延平,郭裕兰,庄钊文.基于点云-模型匹配的激光雷达目标识别[J].计算机工程与科学,2012,34(4):32-36. 被引量：3

引证文献21

1张堃,刘志诚,刘纪元,华亮,费敏锐.面向人机协作系统的上肢姿态精准识别算法研究[J].仪器仪表学报,2023,44(1):275-282. 被引量：4
2王克全.安徽盆景的发展与创新[J].花卉,2000(3):23-23.
3陈占军,王耀武,龚咏喜.基于自适应支持加权准则的建筑物图像匹配扩散研究[J].计算机应用与软件,2019,36(12):214-219. 被引量：1
4苏奕,张瑶.基于虚拟现实技术的体能训练动作模拟系统设计[J].现代电子技术,2020,43(16):174-176. 被引量：6
5陈伟江.基于三维人体动作识别技术的交互舞蹈系统研究[J].现代科学仪器,2020(3):165-168.
6田治国.基于特征提取的武术散打鞭腿动作视觉图像识别方法[J].齐齐哈尔大学学报（自然科学版）,2021,37(1):51-55. 被引量：2
7李国友,李晨光,王维江,杨梦琪,杭丙鹏.基于单样本学习的多特征人体姿态模型识别研究[J].光电工程,2021,48(2):31-40. 被引量：9
8王钱芊,齐林,刘治国.空间光学特性的运动信息采集与姿态识别[J].激光杂志,2021,42(4):91-95. 被引量：3
9赵涛.视觉图像技术在田径失误动作识别仿真中的应用[J].电脑编程技巧与维护,2022(1):136-137.
10田治国,林敏勇.太极拳发力动作图像模糊特征识别方法研究[J].商丘师范学院学报,2022,38(3):19-23.

二级引证文献32

1何青云.虚拟现实技术在体育教学的应用研究综述[J].内江科技,2021,42(8):35-36. 被引量：4
2容博尚.大数据在体能训练中应用的可行性研究[J].当代体育科技,2021,11(5):61-62. 被引量：6
3王荣超,张力,张涛,慕晓冬.基于局部光照一致性约束的准稠密匹配方法[J].微电子学与计算机,2022,39(2):60-66. 被引量：1
4方妹娟,宫海晓,陈琳.基于虚拟现实技术的辽宁舰仿真体验系统设计[J].信息与电脑,2022,34(3):128-130.
5张斌.基于虚拟现实技术的少儿体育体感训练系统设计[J].信息与电脑,2022,34(18):80-82. 被引量：1
6张乘菲,吴海艳.虚拟现实技术在运动员体能训练中的重要性[J].文体用品与科技,2023(3):186-188.
7张乘菲,吴海艳.虚拟现实技术在运动员体能训练中的重要性[J].文体用品与科技,2023(2):185-187.
8张江峰,闫涛,陈斌,钱宇华,宋艳涛.全局时空特征耦合的多景深三维形貌重建[J].计算机应用,2023,43(3):894-902. 被引量：1
9屠强.标志盘在短跑练习中的应用[J].文体用品与科技,2023(14):129-131.
10毋宁,王鹏,李晓艳,吕志刚,孙梦宇.基于自适应特征感知的轻量化人体姿态估计[J].液晶与显示,2023,38(8):1107-1117. 被引量：2

1李继宏.中学体育特长生相关问题及解决策略探讨[J].知识文库,2018,0(12):195-195.
2荣丹,李建军,杨德宝,张慧杰.高中生生物学能力训练中的问题及对策——对高中生生物学竞赛集中训练的分析[J].中学生物教学,2019,0(6):35-37. 被引量：2
3莫玲萍.元认知策略对高中英语阅读教学有效研究的实验设计[J].新课程,2018,0(36):23-23.
4胡太,杨明.结合目标检测的小目标语义分割算法[J].南京大学学报（自然科学版）,2019,55(1):73-84. 被引量：4
5苑志慧.利用网络开展过程性评价的尝试[J].数码世界,2018(12):195-195.
6常思远,李有乘,孙培岩,朱永杰,谢党恩.一种基于MTCNN的视频人脸检测及识别方法[J].许昌学院学报,2019,38(2):149-152. 被引量：6
7张佳琪,张继贤,赵争.深度神经网络的高分三号全极化SAR图像分类方法[J].测绘科学,2019,44(2):6-11. 被引量：7
8张加加,王修晖.基于CNN与SVM融合的步态识别方法[J].中国计量大学学报,2019,30(1):65-71. 被引量：5
9何斌,刘会娜,张继良,林青,孙明华,葛英辉.无对比剂肾动脉MRA反转时间在高血压患者中的优化研究[J].中国实用医刊,2019,46(3):10-13.
10陈飞,程合彬,王伟光.基于CNN-LSTMs混合模型的人体行为识别方法[J].信息技术与信息化,2019(4):32-34. 被引量：4

自动化学报

2019年第3期

浏览历史

内容加载中请稍等...

姿态特征与深度特征在图像动作识别中的混合应用被引量：21

参考文献2

二级参考文献51

共引文献133

同被引文献148

引证文献21

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

姿态特征与深度特征在图像动作识别中的混合应用 被引量：21

参考文献2

二级参考文献51

共引文献133

同被引文献148

引证文献21

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

姿态特征与深度特征在图像动作识别中的混合应用被引量：21