融合Transformer和注意力的轻量高效人体姿态估计

Lightweight and Efficient Human Pose Estimation Fusing Transformer and Attention

下载PDF

导出

摘要针对人体姿态估计算法的沉重计算成本和庞大网络规模问题,提出面向人体姿态估计的轻量级高效视觉变换器(lightweight efficient vision transformer for human posture estimation,LEViTPose)。引入深度可分离卷积、通道混洗和多尺度卷积核并行技术来设计轻量级预处理模块LStem;提出一种级联组空间线性退化注意力(cascaded group spatial linear reduction attention,CGSLRA),采用特征分组划分多个注意头的方式来提升内存存储效率,采用组内特征降维来降低计算冗余;通过引入逐点卷积和分组反卷积来设计轻量级特征还原模块(lightweight feature recovery module,LFRM)。实验结果表明,所提方法相比基线模型,可以在提升网络性能和推理速度的同时降低网络规模和计算开销。在MPII和COCO验证集上与LiteHRNet-30相比,平均准确率分别提高了2.6和3.4个百分点,推理速度提升了1倍。 Aiming at the heavy computational cost and huge network scale problem of human posture estimation algo-rithms,lightweight efficient vision transformer for human posture estimation(LEViTPose)is proposed.Firstly,a light-weight preprocessing module LStem is designed by introducing deepwise separable convolution,channel shuffle and multi-scale convolution kernel parallel techniques.Then,a cascaded group spatial linear reduction attention(CGSLRA)is proposed,which uses feature grouping to divide multiple attention heads to improve memory efficiency,and uses intra-group feature dimension reduction to reduce computational redundancy.Finally,a lightweight feature recovery module(LFRM)is designed by introducing pointwise convolution and group transposed convolution.The experimental results show that the proposed method can improve the network performance and inference speed while reducing the network size and computational overhead compared to the baseline model.Compared with LiteHRNet-30 on the MPII and COCO validation sets,the average accuracy is improved by 2.6 and 3.4 percentage points,and the inference speed is increased by a factor of 1.

作者吴程鹏谭光兴陈海峰李春宇 WU Chengpeng;TAN Guangxing;CHEN Haifeng;LI Chunyu(College of Automation,Guangxi University of Science and Technology,Liuzhou,Guangxi 545616,China)

机构地区广西科技大学自动化学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第22期197-208,共12页 Computer Engineering and Applications

基金国家自然科学基金(61563005)。

关键词人体姿态估计轻量级网络注意力机制 TRANSFORMER human pose estimation lightweight network attention mechanism Transformer

分类号 TP391 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1高坤,李汪根,束阳,王志格,葛英奎.融入密集连接的多尺度轻量级人体姿态估计[J].计算机工程与应用,2022,58(24):196-204. 被引量：6
2Wenqiang Zhang,Jiemin Fang,Xinggang Wang,Wenyu Liu.Efficient Pose: Efficient human pose estimation with neural architecture search[J].Computational Visual Media,2021,7(3):335-347. 被引量：8

二级参考文献6

1邓益侬,罗健欣,金凤林.基于深度学习的人体姿态估计方法综述[J].计算机工程与应用,2019,55(19):22-42. 被引量：46
2钱慧芳,易剑平,付云虎.基于深度学习的人体动作识别综述[J].计算机科学与探索,2021,15(3):438-455. 被引量：34
3苏江毅,宋晓宁,吴小俊,於东军.多模态轻量级图卷积人体骨架行为识别方法[J].计算机科学与探索,2021,15(4):733-742. 被引量：11
4Wenqiang Zhang,Jiemin Fang,Xinggang Wang,Wenyu Liu.Efficient Pose: Efficient human pose estimation with neural architecture search[J].Computational Visual Media,2021,7(3):335-347. 被引量：8
5何坚,郭泽龙,刘乐园,苏予涵.基于滑动窗口和卷积神经网络的可穿戴人体活动识别技术[J].电子与信息学报,2022,44(1):168-177. 被引量：19
6邓辉,徐杨.融入注意力和密集连接的轻量型人体姿态估计[J].计算机工程与应用,2022,58(16):265-273. 被引量：9

共引文献12

1方芹,缪宁杰,董仲星,郑树松,王佳敏,罗文东,周霖.基于知识蒸馏的轻量级人体姿态估计网络设计[J].机械设计与制造工程,2021,50(12):64-68.
2刘玉杰,张敏杰,李宗民,李华.基于全局姿态感知的轻量级人体姿态估计[J].图学学报,2022,43(2):333-341. 被引量：2
3曾文献,马月,李伟光.轻量化二维人体骨骼关键点检测算法综述[J].科学技术与工程,2022,22(16):6377-6392. 被引量：14
4Ming C.Lin,Xin Tong,Wenping Wang.Message from the Best Paper Award Committee[J].Computational Visual Media,2022,8(3):329-329.
5高坤,李汪根,束阳,王志格,葛英奎.融入密集连接的多尺度轻量级人体姿态估计[J].计算机工程与应用,2022,58(24):196-204. 被引量：6
6刘豪,吴红兰,房宇轩.结合全局上下文信息的高效人体姿态估计[J].计算机工程,2023,49(7):102-109. 被引量：2
7卢官明,卢峻禾,陈晨.基于深度学习的二维人体姿态估计研究进展[J].南京邮电大学学报（自然科学版）,2024,44(1):44-55. 被引量：2
8高坤,李汪根,束阳,葛英奎,王志格.结合密集连接的轻量级高分辨率人体姿态估计[J].中国图象图形学报,2024,29(5):1408-1420.
9房鑫,陈兵旗,彭书博,张雄楚,李永正.基于改进YOLOv4的前方车辆检测方法[J].传感器与微系统,2024,43(10):155-159.
10冯明文,徐杨,张永丹,肖慈,黄易仟.结合动态分裂卷积和注意力的多尺度人体姿态估计[J].计算机工程与应用,2024,60(22):219-229.

1姚景丽,程光,万飞,朱德平.改进YOLOv8的轻量化轴承缺陷检测算法[J].计算机工程与应用,2024,60(21):205-214. 被引量：1
2邹梦梦,周欣冉,马春雨,吕娜,朱林,高圆圆,郭飞.临床-MRI影像组学的列线图模型可有效预测宫颈癌淋巴脉管浸润[J].分子影像学杂志,2024,47(10):1046-1053.
3何芬,王振.一类混合型趋化模型的黎曼问题[J].数学物理学报（A辑）,2024,44(2):354-360.
4张勇,黄丹飞,张乐超,张丽丽,周尧,唐鸿宇.基于深度学习的癌变组织显微高光谱图像分类[J].激光与光电子学进展,2024,61(18):237-244.
5周朦,郑瑞,周晋,邓冉,彭玉兴.基于机器视觉的电梯曳引钢带表面损伤检测[J].起重运输机械,2024(20):94-106.
6李秉涛,何勇.基于改进的YOLOv4-tiny模型剪枝与量化[J].计算机与数字工程,2024,52(9):2721-2725.
7陶志勇,高亚静,王萌,林森.轻量级Transformer的双向交互近红外手指静脉图像识别[J].兰州大学学报（自然科学版）,2024,60(5):621-628.
8张浩林,林建强,莫腾飞,张翰升.基于轻量化YOLOv7的汽车保险盒检测算法[J].南方农机,2024,55(21):18-23.
9詹华税,袁洪君.一类退化抛物方程熵解的稳定性[J].厦门大学学报（自然科学版）,2024,63(2):315-320.
10邹磊,冯治国,梁鹏翔,李昂,牛天宇.基于U-Net的启闭机钢丝绳缺陷定位方法研究[J].国外电子测量技术,2024,43(9):155-160.

计算机工程与应用

2024年第22期

浏览历史

内容加载中请稍等...

融合Transformer和注意力的轻量高效人体姿态估计

参考文献2

二级参考文献6

共引文献12

相关作者

相关机构

相关主题

浏览历史