基于自注意力机制的双分支密集人群计数算法

Dual-branch crowd counting algorithm based onself-attention mechanism

下载PDF

导出

摘要针对密集人群计数中人头尺度变化大、复杂背景干扰的问题,提出基于自注意力机制的双分支密集人群计数算法.该算法结合卷积神经网络(CNN)和Transformer 2种网络框架,通过多尺度CNN分支和基于卷积增强自注意力模块的Transformer分支,分别获取人群局部信息和全局信息.设计双分支注意力融合模块,以具备连续尺度的人群特征提取能力;通过基于混合注意力模块的Transformer网络提取深度特征,进一步区分复杂背景并聚焦人群区域.采用位置级-全监督方式和计数级-弱监督方式,在ShanghaiTech Part A、ShanghaiTech Part B、UCFQNRF、JHU-Crowd++等数据集上进行实验.结果表明,算法在4个数据集上的性能均优于最近研究,全监督算法在上述数据集的平均绝对误差和均方根误差分别为55.3、6.7、82.9、55.7和93.1、9.8、145.1、248.0,可以实现高密集、高遮挡场景下的准确计数.特别是在弱监督算法对比中,以低参数量实现了更佳的计数精度,并达到全监督87.9%的计数效果. A dual-branch crowd counting algorithm based on self-attention mechanism was proposed to solve the problems of large variation in head scale and complex background interference in crowd counting.The algorithm combined two network frameworks,including convolutional neural network(CNN)and Transformer.The multiscale CNN branch and Transformer branch based on convolution enhanced self-attention module were used to obtain local and global crowd information respectively.The dual-branch attention fusion module was designed to enable continuous-scale crowd feature extraction.The Transformer network with the hybrid attention module was utilized to extract deep features,which facilitated the distinction of complex backgrounds and focused on the crowd regions.The experiments were conducted on ShanghaiTech Part A,ShanghaiTech Part B,UCF-QNRF,JHU-Crowd++and other datasets using position-level full supervision and count-level weak supervision.Results showed that the performance of the proposed algorithms was better than that of recent studies.The MAE and MSE of the fully supervised algorithm in the above datasets were 55.3,6.7,82.9,55.7,and 93.1,9.8,145.1,248.0,respectively,which could achieve accurate counting in high density and high occlusion scenes.Good counting precision was achieved with low parameters,and a counting accuracy of 87.9%of the full supervision was attained especially in the comparison of weakly supervised algorithms.

作者杨天乐李玲霞张为 YANG Tian-le;LI Ling-xia;ZHANG Wei(School of Microelectronics,Tianjin University,Tianjin 300072,China)

机构地区天津大学微电子学院

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2023年第10期1955-1965,共11页 Journal of Zhejiang University：Engineering Science

基金国家重点研发计划资助项目(2020YFC1522405) 省级科技重大专项与工程项目(19ZXZNGX00030).

关键词人群计数深度学习自注意力机制双分支弱监督学习 crowd counting deep learning self-attention mechanism dual-branch weakly supervised learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李萌,孙艳歌,郭华平,吴飞.多层次融合与注意力机制的人群计数算法[J].吉林大学学报（信息科学版）,2022,40(6):1009-1016. 被引量：3
2刘迪,郭继昌,汪昱东,张怡.融合注意力机制的多尺度显著性目标检测网络[J].西安电子科技大学学报,2022,49(4):118-126. 被引量：9
3万洪林,王晓敏,彭振伟,白智全,杨星海,孙建德.基于新型多尺度注意力机制的密集人群计数算法[J].电子与信息学报,2022,44(3):1129-1136. 被引量：6
4Dingkang LIANG,Xiwu CHEN,Wei XU,Yu ZHOU,Xiang BAI.TransCrowd:weakly-supervised crowd counting with transformers[J].Science China(Information Sciences),2022,65(6):44-57. 被引量：10

二级参考文献9

1孟月波,纪拓,刘光辉,徐胜军,李彤月.编码-解码多尺度卷积神经网络人群计数方法[J].西安交通大学学报,2020,54(5):149-157. 被引量：9
2邓远志,胡钢.基于特征金字塔的人群密度估计方法[J].测控技术,2020,39(6):108-114. 被引量：3
3时斐斐,张松龙,彭力.结合边缘特征先验引导的深度卷积显著性检测[J].计算机工程与应用,2020,56(14):199-206. 被引量：4
4张晴,左保川,石艳娇,戴蒙.多尺度卷积神经网络显著物体检测[J].中国图象图形学报,2020,25(6):1116-1129. 被引量：6
5左静,巴玉林.基于多尺度融合的深度人群计数算法[J].激光与光电子学进展,2020,57(24):307-315. 被引量：13
6孙豪杰,李苗钰,章盼盼,许鹏飞.用于面瘫分级的自监督非对称特征学习方法[J].西安电子科技大学学报,2021,48(3):115-122. 被引量：2
7杨莉,张亚楠,王婷婷,刘添翼.基于改进Faster R-CNN的钢材表面缺陷检测方法[J].吉林大学学报（信息科学版）,2021,39(4):409-415. 被引量：20
8朱新丽,才华,寇婷婷,杜冬晖,孙俊喜.行人多目标跟踪算法[J].吉林大学学报（理学版）,2021,59(5):1161-1170. 被引量：9
9王婧媛,方健.基于Yolov5的密集场所人数估计方法[J].吉林大学学报（信息科学版）,2021,39(6):682-687. 被引量：12

共引文献24

1丁兆敏,郑凯东.融合注意力机制与HRNet的人群计数算法[J].信息技术与信息化,2022(10):31-34. 被引量：1
2张玉波,王建阳,韩爽,王冬梅.一种非对称的轻量级图像盲去模糊网络[J].吉林大学学报（理学版）,2023,61(2):362-370. 被引量：3
3冉瑞生,李进,董殊宏.基于Swin Transformer的弱监督人群计数研究[J].中国安全科学学报,2023,33(3):111-117. 被引量：1
4王柯俨,成吉聪,黄诗芮,蔡坤伦,王威然,李云松.融合上下文感知注意力的低光图像去雾网络[J].西安电子科技大学学报,2023,50(2):23-32.
5何晴,杨倩倩,彭思凡,殷保群.基于Transformer和语义增强的人群计数算法[J].网络安全与数据治理,2023,42(5):50-58.
6张世辉,赵维勃,王磊,王威,李群鹏.MSIANet:多尺度交互注意力人群计数网络[J].电子与信息学报,2023,45(6):2236-2245. 被引量：2
7韩素玉,王国栋,王永,刘瑞.基于间接—即时注意力优化模块的密集人群计数算法[J].青岛大学学报（自然科学版）,2023,36(2):50-57.
8王娟,刘子杉,武明虎,陈关海,郭力权.融合超分辨率重建技术的多尺度目标检测算法[J].西安电子科技大学学报,2023,50(3):122-131. 被引量：2
9魏畅,关佶红,张毅超,李文根.一种面向航空图像的自适应目标计数模型[J].计算机科学,2023,50(8):93-98.
10黄叶祺,王明伟,闫瑞,雷涛.基于改进的YOLOv5金刚石线表面质量检测[J].广西师范大学学报（自然科学版）,2023,41(4):123-134. 被引量：2

1衣柳成.有关密集人群人脸检测的若干思考[J].数字技术与应用,2023,41(9):116-118.
2余胜,谢莉.基于迁移学习和卷积视觉转换器的农作物病害识别研究[J].中国农机化学报,2023,44(8):191-197.
3龚安,李中浩,梁辰宏.夜间多场景的邻近感知实时行人检测算法[J].中国图象图形学报,2023,28(9):2693-2705.
4孙凯明,郝明,王刚.基于机器视觉的高速在线药粒计数系统程序的设计[J].黑龙江科学,2023,14(18):77-79.
5孙圣.律则必然性对层级个体化问题的回应[J].自然辩证法通讯,2023,45(5):42-48. 被引量：1
6许亦博,赵文义,李灵巧,杨辉华.基于乐高采样的自监督表示学习方法[J].桂林电子科技大学学报,2023,43(3):181-186.
7王欣,李少华,刘瑜,张毅,蒋兰兰,宋永臣.CO_(2)地质封存中储层岩石润湿性测量研究进展[J].上海理工大学学报,2023,45(3):205-219. 被引量：1
8王雪岩,陈序航,贾小涛,杨建磊,屈钢,赵巍胜.面向自旋存内计算架构的图算法优化设计[J].电子与信息学报,2023,45(9):3193-3199.
9王大正,张涛.双任务交互下的四段监督人群计数网络[J].小型微型计算机系统,2023,44(10):2120-2126.
10刘培刚,孙洁,杨超智,李宗民.密集场景下基于多尺度特征聚合的人群计数方法[J].计算机科学,2023,50(9):235-241. 被引量：1

浙江大学学报（工学版）

2023年第10期

浏览历史

内容加载中请稍等...

基于自注意力机制的双分支密集人群计数算法

参考文献4

二级参考文献9

共引文献24

相关作者

相关机构

相关主题

浏览历史