结合坐标Transformer的轻量级人体姿态估计算法被引量：1

Lightweight human pose estimation algorithm combined with coordinate Transformer

下载PDF

导出

摘要针对现有的大多数自底向上人体姿态估计算法存在模型规模大、计算成本高及对边缘设备不友好等问题,提出了一种基于YOLOv5s6-Pose的轻量级多人姿态估计网络模型YOLOv5s6-Pose-CT。该模型在颈部网络中引入空间和通道重建卷积,以减少空间和通道维度上的特征冗余。同时,提出了一种坐标Transformer嵌入于主干网络中,使模型专注于长距离依赖和拥有高效的局部特征提取能力。其次,通过使用无偏特征位置对齐来解决多尺度融合过程中出现的特征错位问题。最后,使用损失函数MPDIoU对边界框的回归损失重新定义。在COCO 2017数据集上的实验结果表明,本文优化的网络模型与主流的轻量级网络EfficientHRNet-H1模型相比,在保持相同精度的同时,参数量和计算量分别减少16.2%和66.1%。相比于基准模型YOLOv5s6-Pose,参数量减少11.2%,计算量降低5.8%,平均检测精度和平均召回率分别提升2.5%和2.6%。 Addressing issues such as large model size,high computational costs,and limited compatibility with edge devices in most existing bottom-up human pose estimation algorithms,this study proposed a lightweight multi-person pose estimation network model named YOLOv5s6-Pose-CT based on YOLOv5s6-Pose.In order to reduce feature redundancy across both spatial and channel dimensions,the network model introduced spatial and channel reconstruction convolution in the neck network.Simultaneously,a coordinate Transformer was incorporated into the backbone network to enhance long-distance dependence while maintaining efficient local feature extraction ability.Furthermore,unbiased feature position alignment was employed to resolve feature dislocation during multi-scale fusion.Finally,this study redefined the regression loss of bounding boxes using the MPDIoU(minimum point distance-based IoU)loss function.Experimental results on the COCO 2017 dataset demonstrated that compared with EfficientHRNet-H1(a mainstream lightweight network),our optimized network model reduced parameters by 16.2%and computation by 66.1%,respectively,while maintaining comparable accuracy levels.Moreover,compared with the baseline approach,our proposed model achieved parameter and computation reductions of 11.2%and 5.8%,respectively,along with improvements of 2.5%in average detection accuracy and 2.6%in recall rate.

作者黄友文林志钦章劲陈俊宽 HUANG Youwen;LIN Zhiqin;ZHANG Jin;CHEN Junkuan(School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou Jiangxi 341000,China)

机构地区江西理工大学信息工程学院

出处《图学学报》 CSCD 北大核心 2024年第3期516-527,共12页 Journal of Graphics

基金江西省教育厅资助项目(GJJ180443)。

关键词人体姿态估计轻量级坐标Transformer 无偏特征位置对齐损失函数 human pose estimation lightweight coordinate Transformer unbiased feature position alignment loss function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1曾文献,马月,李伟光.轻量化二维人体骨骼关键点检测算法综述[J].科学技术与工程,2022,22(16):6377-6392. 被引量：13
2任好盼,王文明,危德健,高彦彦,康智慧,王全玉.基于高分辨率网络的人体姿态估计方法[J].图学学报,2021,42(3):432-438. 被引量：13
3卢健,杨腾飞,赵博,王航英,罗毛欣,周嫣然,李哲.基于深度学习的人体姿态估计方法综述[J].激光与光电子学进展,2021,58(24):61-80. 被引量：13
4赵心驰,胡岸明,何为.基于卷积神经网络和XGBoost的摔倒检测[J].激光与光电子学进展,2020,57(16):240-248. 被引量：9
5范溢华,王永振,燕雪峰,宫丽娜,郭延文,魏明强.人脸识别任务驱动的低光照图像增强算法[J].图学学报,2022,43(6):1170-1181. 被引量：5
6蔡敏敏,黄继风,林晓,周小平.基于人体姿态估计与聚类的特定运动帧获取方法[J].图学学报,2022,43(1):44-52. 被引量：6
7蔡兴泉,霍宇晴,李发建,孙海燕.面向太极拳学习的人体姿态估计及相似度计算[J].图学学报,2022,43(4):695-706. 被引量：5
8冯杰,郑建立.基于卷积与Transformer的人体姿态估计方法对比研究[J].软件工程,2023,26(3):18-24. 被引量：3

二级参考文献43

1肖文福,孙燚,陈恩庆.一种基于深度可分离卷积的实时多人姿态估计[J].计算机应用研究,2020,37(S02):348-350. 被引量：6
2白云飞,李瞡,何金龙.基于嵌入式视频监控的摔倒检测系统的设计[J].电视技术,2014,38(15):231-236. 被引量：10
3王君泽,朱小龙,瞿畅.基于Kinect骨架追踪的人体摔倒自动检测[J].上海交通大学学报,2015,49(9):1359-1365. 被引量：18
4赵斌,鲍天龙,朱明.基于图像语义分割和CNN模型的老人跌倒检测[J].计算机系统应用,2017,26(10):213-218. 被引量：9
5李白萍,韩新怡,吴冬梅.基于卷积神经网络的实时人群密度估计[J].图学学报,2018,39(4):728-734. 被引量：7
6吴珍发,赵皇进,郑国磊.人机任务仿真中虚拟人行为建模及仿真实现[J].图学学报,2019,40(2):410-415. 被引量：8
7范书瑞,贾雅亭,刘晶花.基于三轴加速度传感器人体姿态识别的特征选择[J].应用科学学报,2019,37(3):427-436. 被引量：15
8唐彪,樊启润,孙开鑫,卢仕,万美琳.人体姿态识别算法在视觉人机交互中的应用[J].计算机测量与控制,2019,27(7):242-247. 被引量：8
9王鹏,王慧,孔凡宁,姚刚.基于FPGA的视频监控摔倒检测报警系统[J].电机与控制学报,2019,23(8):122-128. 被引量：16
10刘瑜兴,王淑侠,徐光耀,兰望桂,何卫平.基于Leap Motion的三维手势交互系统研究[J].图学学报,2019,40(3):556-564. 被引量：14

共引文献54

1马兰村.让人瞩目的服装业“名牌战略”[J].中外服装,2000(5):24-25.
2王晓勇,江颖洁,徐彬泰,周洁,田安琪,马良.基于并行神经网络的塑料光纤链路自动识别模型[J].塑料科技,2020,48(12):110-114.
3单嘉良,梁雨欢,冯培基.基于卷积神经网络的人体姿态估计方法研究[J].中国宽带,2021(3):183-183.
4李安安,石萍.人体日常健康管理可穿戴设备研究进展[J].北京生物医学工程,2021,40(4):430-436. 被引量：6
5陆雅诺,陈炳才.融合注意力机制的无锚点森林火灾检测算法[J].计算机与现代化,2021(11):61-66. 被引量：2
6赵珍珍,董彦如,曹慧,曹斌.老年人跌倒检测算法的研究现状[J].计算机工程与应用,2022,58(5):50-65. 被引量：9
7邬春学,贺欣欣.基于ResNet50对地震救援中人体姿态估计的研究[J].信息技术与网络安全,2022,41(3):50-58. 被引量：1
8张宏鸣,李永恒,周利香,汪润,李书琴,王红艳.基于改进YOLO v3的肉牛多目标骨架提取方法[J].农业机械学报,2022,53(3):285-293. 被引量：10
9张伯树,张志华,张洋.改进的HRNet应用于路面裂缝分割与检测[J].测绘通报,2022(3):83-89. 被引量：8
10邬春学,贺欣欣.基于改进匈牙利算法对多人人体关键点匹配的研究[J].信息技术与网络安全,2022,41(5):45-50. 被引量：3

同被引文献6

1孙旭辉,官铮,王学.红外与可见光图像分组融合的视觉Transformer[J].中国图象图形学报,2023,28(1):166-178. 被引量：5
2许正森,雷相达,管海燕.多尺度局部特征增强Transformer道路裂缝检测模型[J].中国图象图形学报,2023,28(4):1019-1028. 被引量：8
3周丽娟,毛嘉宁.视觉Transformer识别任务研究综述[J].中国图象图形学报,2023,28(10):2969-3003. 被引量：5
4樊圣澜,柏正尧,陆倩杰,周雪.基于Transformer网络的COVID-19肺部CT图像分割[J].中国图象图形学报,2023,28(10):3203-3213. 被引量：2
5翟永杰,赵晓瑜,王璐瑶,王亚茹,宋晓轲,朱浩硕.IDD-YOLOv7:一种用于输电线路绝缘子多缺陷的轻量化检测方法[J].图学学报,2024,45(1):90-101. 被引量：4
6张相胜,杨骁.基于改进YOLOv7-tiny的橡胶密封圈缺陷检测方法[J].图学学报,2024,45(3):446-453. 被引量：1

引证文献1

1章东平,魏杨悦,何数技,徐云超,胡海苗,黄文君.特征融合与层间传递:一种基于Anchor DETR改进的目标检测方法[J].图学学报,2024,45(5):968-978.

1刘亚兰,李磊,鲁艳,宋春武,李向义,曾凡江.不同采收间隔双排油莎豆(Cyperus esculentus)带风场结构与防风效能的模拟研究[J].干旱区地理,2022,45(6):1908-1915. 被引量：2
2朱强军,胡斌,汪慧兰,王杨.基于轻量化YOLOv8s交通标志的检测[J].图学学报,2024,45(3):422-432. 被引量：4
3黎冠,李志伟,陈浩,童波,张宪阳.基于改进YOLOv5s的轻量化安全帽佩戴检测算法[J].华北科技学院学报,2024,21(3):32-41.
4刘若江,张翔.运动处方对大学心理健康的干预作用研究分析[J].当代体育科技,2022,12(2):5-9. 被引量：2
5王会征,孙良晨,李新龙,刘海藤,王国宾,兰玉彬.基于改进YOLOv7-tiny的番茄叶片病虫害检测方法[J].农业工程学报,2024,40(10):194-202.
6王娜,陈勇,崔艳荣,胡蓉华.基于改进轻量化YOLO v5n的番茄叶片病害识别方法[J].江苏农业科学,2024,52(8):192-199.
7邹宏睿,任佳,潘海鹏,周传辉.基于改进YOLOv5s的轻量化布匹瑕疵检测算法[J].浙江理工大学学报（自然科学版）,2024,51(3):389-398.

图学学报

2024年第3期

浏览历史

内容加载中请稍等...

结合坐标Transformer的轻量级人体姿态估计算法被引量：1

参考文献8

二级参考文献43

共引文献54

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合坐标Transformer的轻量级人体姿态估计算法 被引量：1

参考文献8

二级参考文献43

共引文献54

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合坐标Transformer的轻量级人体姿态估计算法被引量：1