基于视频的实时多人姿态估计方法被引量：14

Real-Time Multi-Person Video-Based Pose Estimation

导出

摘要针对图像和视频中多人姿态估计存在人体边界框定位不准确、困难关键点检测精度有待提高等问题,设计了一套基于自顶向下框架的实时多人姿态估计模型。首先将深度可分离卷积加入目标检测算法中,提高人体检测器运行速度;然后基于特征金字塔网络结合上下文语义信息,采用在线难例挖掘算法解决困难关键点检测精度低的问题;最后结合空间变换网络与姿态相似度计算,剔除冗余姿态,改善边界框定位准确性。本文提出模型在2017MS COCO Test-dev数据集上的平均检测精度比Mask R-CNN模型提升了14.84%,比RMPE模型提升了2.43%,帧频达到22frame/s。 For multi-person pose estimation in images and videos,it is necessary to address the inaccurate positioning of the human-bounding box and improve the detection accuracy of hard keypoints.This paper designs a real-time multi-person pose-estimation model based on a top-down framework.First,depth-separable convolution is added to the target-detection algorithm to improve the running speed of the human detector;then,by combining the feature pyramid network with context-semantic information,the online hard-example mining algorithm is used to solve the problem of low detection accuracy at hard keypoints.Finally,combining the spatial-transformation network and pose-similarity calculation,the redundant pose is eliminated and the accuracy of the bounding-box positioning is improved.In this paper,the average detection precision of the proposed model on the 2017 MS COCO Test-dev dataset is 14.84%higher than that of the Mask R-CNN model,and 2.43%higher than that of the RMPE model.The frame frequency is 22 frame·s-1.

作者闫芬婷王鹏吕志刚丁哲乔梦雨 Yan Fenting;Wang Peng;LüZhigang;Ding Zhe;Qiao Mengyu(School of Electronics and Information Engineering,Xi′an Technological University,Xi'an,Shaanxi 710021,China)

机构地区西安工业大学电子信息工程学院

出处《激光与光电子学进展》 CSCD 北大核心 2020年第2期89-96,共8页 Laser & Optoelectronics Progress

基金国家自然科学基金(61671362) 陕西省科技厅重点研发计划(2019GY-022)。

关键词图像处理多人姿态估计空间变换网络语义信息姿态距离 image processing multi-person pose estimation spatial transformer network semantic information pose distance

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1冯小雨,梅卫,胡大帅.基于改进Faster R-CNN的空中目标检测[J].光学学报,2018,38(6):242-250. 被引量：116
2魏湧明,全吉成,侯宇青阳.基于YOLOv2的无人机航拍图像定位研究[J].激光与光电子学进展,2017,54(11):95-104. 被引量：58
3姜明星,胡敏,王晓华,任福继,王浩文.视频序列中表情和姿态的双模态情感识别[J].激光与光电子学进展,2018,55(7):161-168. 被引量：11

二级参考文献25

1李少军,朱振福.采用粒子滤波的先跟踪后检测算法[J].红外与激光工程,2009,38(2):352-357. 被引量：15
2江亲瑜,李平,孙兰.最大类间方差算法在运动检测系统中的应用[J].计算机应用,2011,31(1):260-262. 被引量：13
3刘海军,柳征,姜文利,周一宇.基于云模型和矢量神经网络的辐射源识别方法[J].电子学报,2010,38(12):2797-2804. 被引量：19
4储珺,施芒,符祥.基于光流的动态背景运动目标检测算法[J].南昌航空大学学报（自然科学版）,2011,25(3):1-6. 被引量：12
5殷亮,高昆,白廷柱.基于改进Otsu法的遥感图像油罐目标分割研究[J].光学技术,2012,38(2):197-201. 被引量：6
6余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：592
7闫静杰,郑文明,辛明海,邱伟.表情和姿态的双模态情感识别[J].中国图象图形学报,2013,18(9):1101-1106. 被引量：15
8曲仕茹,杨红红.采用Kalman_BP神经网络的视频序列多目标检测与跟踪[J].红外与激光工程,2013,42(9):2553-2560. 被引量：6
9宋远骏,李德毅,杨孝宗,崔东华.电子产品可靠性的云模型评价方法[J].电子学报,2000,28(12):74-76. 被引量：84
10杨陈晨,顾国华,钱惟贤,陈钱,徐富元.基于Harris角点的KLT跟踪红外图像配准的硬件实现[J].红外技术,2013,35(10):632-637. 被引量：7

共引文献175

1庞立新,高凡,何大海,李满勤,刘方尧.一种基于注意力机制RetinaNet的小目标检测方法[J].制导与引信,2019,0(4):11-16.
2华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：7
3姜阔胜,徐瑞,王迪.基于深度学习的铜封帽内螺纹缺陷检测研究[J].安徽理工大学学报（自然科学版）,2022,42(3):93-98.
4倪立,黄征,杨静.基于改进YOLOV5模型的嵌入式端航拍图像目标检测[J].北京测绘,2023,37(9):1232-1236.
5杨静,李正民.基于贝叶斯估计的红外弱小目标检测算法[J].国外电子测量技术,2021,40(12):19-23. 被引量：1
6徐亚杰,王海星.基于新特征算子的复杂背景红外弱目标检测算法[J].国外电子测量技术,2021,40(12):7-11. 被引量：2
7明勇,甘晓敏,杨帆.基于时空域及高阶矩的红外弱目标检测算法[J].国外电子测量技术,2021,40(12):1-6. 被引量：2
8米曲酶对奶牛的影响[J].四川奶牛,2000(1):27-28.
9刘喜斌.普遍情况下阐述动生电动势产生机理的简单方法[J].工科物理,2000,10(4):26-28.
10张薇,吕晓琪,吴凉,张明,李菁.基于典型医学图像的分类技术研究进展[J].激光与光电子学进展,2018,55(12):90-99. 被引量：8

同被引文献103

1黄珊珊,郭忠文,孔勇强.基于骨架模型的人体动作识别方法[J].中国海洋大学学报（自然科学版）,2019,49(S02):164-169. 被引量：5
2何书芹,梁西银,颜昌林,郭贝,刘昊.基于多尺度熵和动态时间规整的步态身份识别[J].重庆大学学报（自然科学版）,2018,41(11):84-91. 被引量：14
3谢玮,成艳英,陈柯,张玉春.基于图像处理技术的行人运动轨迹提取方法[J].消防科学与技术,2019,38(1):44-47. 被引量：11
4白云飞,李瞡,何金龙.基于嵌入式视频监控的摔倒检测系统的设计[J].电视技术,2014,38(15):231-236. 被引量：10
5王君泽,朱小龙,瞿畅.基于Kinect骨架追踪的人体摔倒自动检测[J].上海交通大学学报,2015,49(9):1359-1365. 被引量：18
6冷纪岚.人体运动姿态图像矫正识别仿真研究[J].计算机仿真,2015,32(12):451-454. 被引量：5
7蒋政,程春玲.基于Haar特性的改进HOG的人脸特征提取算法[J].计算机科学,2017,44(1):303-307. 被引量：25
8孟爽,王辉,谢蓄芬,邹念育,李博文,曹帆.超像素有偏观测模糊聚类的乳腺超声图像分割[J].中国医学物理学杂志,2017,34(7):693-697. 被引量：1
9张海娜.不同视角下海量高分辨率视频图像数据挖掘方法[J].科学技术与工程,2017,17(26):257-261. 被引量：4
10赵斌,鲍天龙,朱明.基于图像语义分割和CNN模型的老人跌倒检测[J].计算机系统应用,2017,26(10):213-218. 被引量：9

引证文献14

1牛瑞,王昱.用VC++6.0实现图像浏览器功能[J].电脑编程技巧与维护,2000(5):85-87.
2赵心驰,胡岸明,何为.基于卷积神经网络和XGBoost的摔倒检测[J].激光与光电子学进展,2020,57(16):240-248. 被引量：7
3刘亮.基于姿态估计的健身操运动员训练动作自动检测系统[J].自动化与仪器仪表,2021(3):119-122. 被引量：2
4张华,陈来.基于最近邻特定点的人体运动姿态特征点标定识别方法[J].激光杂志,2021,42(4):183-186. 被引量：2
5朱兴动,田少兵,范加利,王正.基于深度学习的自底向上舰载机轮廓关键点检测算法[J].舰船电子工程,2021,41(10):135-140.
6张云绚,董绵绵.基于改进高分辨率网络的多人姿态估计方法[J].中国新技术新产品,2021(21):33-35.
7卢健,杨腾飞,赵博,王航英,罗毛欣,周嫣然,李哲.基于深度学习的人体姿态估计方法综述[J].激光与光电子学进展,2021,58(24):61-80. 被引量：12
8王荣昌,王峰,任帅军,王勇.基于双流融合网络的单兵伪装偏振成像检测[J].光学学报,2022,42(9):185-197. 被引量：4
9张亚凤,刘翠响,马杰,苏亚婷.基于多特征点匹配的三维人体姿态重建[J].激光与光电子学进展,2022,59(16):315-322. 被引量：3
10张云绚,董绵绵,王鹏,李晓艳,吕志刚,邸若海,毋宁.结合二阶注意力机制的多尺度人体姿态估计[J].科学技术与工程,2022,22(32):14321-14327.

二级引证文献28

1王晓勇,江颖洁,徐彬泰,周洁,田安琪,马良.基于并行神经网络的塑料光纤链路自动识别模型[J].塑料科技,2020,48(12):110-114.
2李安安,石萍.人体日常健康管理可穿戴设备研究进展[J].北京生物医学工程,2021,40(4):430-436. 被引量：5
3陆雅诺,陈炳才.融合注意力机制的无锚点森林火灾检测算法[J].计算机与现代化,2021(11):61-66. 被引量：2
4孙军,周志楠.基于穿戴设备的人体运动数据采集系统设计[J].机电产品开发与创新,2022,35(1):38-41.
5赵珍珍,董彦如,曹慧,曹斌.老年人跌倒检测算法的研究现状[J].计算机工程与应用,2022,58(5):50-65. 被引量：9
6邬春学,贺欣欣.基于ResNet50对地震救援中人体姿态估计的研究[J].信息技术与网络安全,2022,41(3):50-58.
7张宏鸣,李永恒,周利香,汪润,李书琴,王红艳.基于改进YOLO v3的肉牛多目标骨架提取方法[J].农业机械学报,2022,53(3):285-293. 被引量：10
8邬春学,贺欣欣.基于改进匈牙利算法对多人人体关键点匹配的研究[J].信息技术与网络安全,2022,41(5):45-50. 被引量：2
9盛洋,王健庆.基于计算机视觉的人体姿态识别研究[J].现代信息科技,2022,6(16):87-91. 被引量：4
10冯晓伟,辛迪,王泽辰,黄昕昊,卜雄洙.基于多传感器融合的人体运动分析系统设计[J].自动化与仪器仪表,2022(10):207-211. 被引量：1

1郑其宝.浅析动画电影《寻梦环游记Coco》的叙事结构[J].传媒与教育,2018(1H):161-163.
2苏志刚,赵世伟,郝敬堂.基于零加速修正的室内惯性定位算法[J].计算机工程与设计,2020,41(4):988-992. 被引量：2
3徐浩,裴福俊,蒋宁.一种基于李群描述的深空探测器姿态估计方法[J].深空探测学报,2020,7(1):102-108.
4陈珂,谢博,朱兴统.基于情感词典和Transformer模型的情感分析算法研究[J].南京邮电大学学报（自然科学版）,2020,40(1):55-62. 被引量：12
5王红,李晗,李浩飞.民航突发事件领域本体关系提取方法的研究[J].计算机科学与探索,2020,14(2):285-293. 被引量：7
6刘思琴,冯胥睿瑞.基于BERT的文本情感分析[J].信息安全研究,2020,6(3):220-227. 被引量：23
7胡敦利,张维.基于Mask R-CNN的动态物体剔除方法在RGB-D视觉SLAM中的应用[J].工业控制计算机,2020,33(3):15-17.
8李卫疆,漆芳.基于多通道双向长短期记忆网络的情感分析[J].中文信息学报,2019,33(12):119-128. 被引量：17
9李健,张皓若,何斌.结合形变模型的人体姿态估计优化算法[J].西安电子科技大学学报,2020,47(2):23-31. 被引量：3
10李科.特征挖掘算法与不同机器学习方法在回归问题中的应用研究[J].网络安全技术与应用,2020(4):44-45.

激光与光电子学进展

2020年第2期

浏览历史

内容加载中请稍等...

基于视频的实时多人姿态估计方法被引量：14

参考文献3

二级参考文献25

共引文献175

同被引文献103

引证文献14

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于视频的实时多人姿态估计方法 被引量：14

参考文献3

二级参考文献25

共引文献175

同被引文献103

引证文献14

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于视频的实时多人姿态估计方法被引量：14