基于多尺度注意力机制的道路场景语义分割模型被引量：5

Road Scene Semantic Segmentation Model Based on Multi-Scale Attention Mechanism

下载PDF

导出

摘要通过对道路场景进行语义分割可以辅助车辆感知周边环境,达到避让行人、车辆以及各类小目标物体障碍的目的,提高行驶的安全性。针对道路场景语义分割中小目标物体识别精度不高、网络参数量过大等问题,提出一种基于多尺度注意力机制的语义分割模型。利用小波变换的多尺度多频率信息分析特性,设计一种多尺度小波注意力模块,并将其嵌入到编码器结构中,通过融合不同尺度及频率的特征信息,保留更多的边缘轮廓细节。使用编码器与解码器之间的层级连接,以及改进的金字塔池化模块进行多方面特征提取,在保留上下文特征信息的同时获得更多的图像细节。通过设计多级损失函数训练网络模型,从而加快网络收敛。在剑桥驾驶标注视频数据集上的实验结果表明,该模型的平均交并比为60.21%,与DeepLabV3+和DenseASPP模型相比参数量减少近30%,在不额外增加参数量的前提下提升了模型的分割精度,且在不同场景下均具有较好的鲁棒性。 Semantic segmentation of road scenes can assist vehicles to perceive the surrounding environment,to avoid pedestrians,vehicles and all kinds of small object obstacles,and further improve the safety of driving.This study proposes a semantic segmentation network based on multi-scale attention mechanism,aiming at the problems of low recognition accuracy of small objects in semantic segmentation of road scene in deep learning,and the large number of network parameters adversely affecting the deployment.A multi-scale wavelet attention module is designed based on the characteristics of wavelet transform with multi-scale and multi frequency information analysis and embedded into the encoder structure.By fusing the characteristics of different scales and frequencies,more edge contour details are retained.The hierarchical connection between the encoder and the decoder and the improved pyramid pooling module are used for feature extraction in many aspects to obtain more image details,while retaining the context feature information.By designing the training model of multistage loss function,the network convergence is accelerated.The experimental results on the Cambridge-driving Labeled Video Database(CamVid) show that the average intersection and merge ratio of the model is 60.21%,which reduces the parameters by nearly 30% compared with DeepLabV3+ and DenseASP models.The segmentation accuracy of this model is improved without additional parameters,and the model has good robustness in different scenes.

作者范润泽刘宇红张荣芬李景玉 FAN Runze;LIU Yuhong;ZHANG Rongfen;LI Jingyu(College of Big Data and Information Engineering,Guizhou University,Guiyang 550025,China)

机构地区贵州大学大数据与信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2023年第2期288-295,共8页 Computer Engineering

基金贵州省科学技术基金(黔科合基础-ZK[2021]重点001)。

关键词深度学习语义分割注意力机制小波变换金字塔池化 deep learning semantic segmentation attention mechanism wavelet transform pyramid pooling

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1音松,陈雪云,贝学宇.改进Mask RCNN算法及其在行人实例分割中的应用[J].计算机工程,2021,47(6):271-276. 被引量：15
2张艳,杜会娟,孙叶美,李现国.基于改进SSD算法的遥感图像目标检测[J].计算机工程,2021,47(9):252-258. 被引量：11
3曹炬,陈钢,李艳姣.多策略粒子群优化算法[J].计算机工程与科学,2014,36(9):1716-1721. 被引量：6

二级参考文献15

1李灏,丁晓东.基于最速下降最优解参考的粒子群算法[J].计算机工程与应用,2006,42(16):44-45. 被引量：4
2龙文,梁昔明,董淑华,阎纲.嵌入局部一维搜索技术的混合粒子群优化算法[J].计算机应用研究,2009,26(9):3279-3281. 被引量：3
3王广学,黄晓涛,周智敏.基于邻域统计分布变化分析的UWB SAR隐蔽目标变化检测[J].电子与信息学报,2011,33(1):49-54. 被引量：10
4曹家梓,宋爱国.基于马尔科夫随机场的纹理图像分割方法研究[J].仪器仪表学报,2015,36(4):776-786. 被引量：48
5辛鹏,许悦雷,唐红,马时平,李帅,吕超.全卷积网络多层特征融合的飞机快速检测[J].光学学报,2018,38(3):337-343. 被引量：29
6王俊强,李建胜,周学文,张旭.改进的SSD算法及其对遥感影像小目标检测性能的分析[J].光学学报,2019,39(6):365-374. 被引量：50
7温尧乐,李林燕,尚欣茹,胡伏原.一种改进的Mask RCNN特征融合实例分割方法[J].计算机应用与软件,2019,36(10):130-133. 被引量：18
8罗元,王薄宇,陈旭.基于深度学习的目标检测技术的研究综述[J].半导体光电,2020,41(1):1-10. 被引量：65
9于博,马书浩,李红艳,李春庚,安居白.远红外车载图像实时行人检测与自适应实例分割[J].激光与光电子学进展,2020,57(2):286-296. 被引量：9
10李文斌,何冉.基于深度神经网络的遥感图像飞机目标检测[J].计算机工程,2020,46(7):268-276. 被引量：13

共引文献29

1曾秀云,陆华才,吕禾丰.基于改进Faster R-CNN的棉布包装缺陷检测的方法研究[J].电子测量与仪器学报,2022,36(4):179-186. 被引量：6
2薛阳,张舒翔,贾巍,秦瑶.基于改进Faster RCNN的电缆外护套破损检测[J].电子测量技术,2023,46(15):158-164.
3文传军,汪庆淼.广义可能性C均值聚类算法[J].计算机工程与科学,2015,37(5):1015-1018. 被引量：2
4吴润秀,孙辉,朱德刚,赵嘉.具有高斯扰动的局部引导粒子群优化算法[J].计算机工程与科学,2016,38(6):1183-1192. 被引量：8
5卫星,焦蓬蓬,史永.基于柔性形态学滤波优化的周期性噪声消除算法[J].现代电子技术,2016,39(21):70-74. 被引量：3
6周冰,李聪,邓娟.PSO约束优化耦合直方图均衡化的图像增强算法[J].现代电子技术,2016,39(15):32-37. 被引量：5
7李杰,孙闽红,仇兆炀.时频域重叠多信号智能检测方法研究[J].信号处理,2021,37(5):878-884. 被引量：3
8侯思祖,刘雅婷,陈天威.基于CNN-WF的高灵敏紫外成像仪中的图像配准与融合[J].半导体光电,2021,42(4):596-602. 被引量：3
9王浩桐,郭中华.改进SSD的飞机遥感图像目标检测[J].液晶与显示,2022,37(1):116-127. 被引量：9
10方春恩,唐小雨,李伟,张宁,魏晓光,陈军平.基于多策略粒子群算法的500 kV直流断路器用快速机械开关优化设计[J].高压电器,2022,58(1):79-88. 被引量：6

同被引文献22

1梁博,于蕾,李爽.基于卷积神经网络的多任务图像语义分割[J].无线电工程,2019,49(7):575-580. 被引量：11
2张日升,原明亭,丁军航,官晟,孟宪法.基于图像阈值分割的浒苔图像提取[J].自动化技术与应用,2020,39(2):83-86. 被引量：15
3桑高丽,郑增国,闫超.基于区域分割的表情鲁棒三维人脸识别方法[J].计算机应用研究,2020,37(3):914-918. 被引量：12
4景庄伟,管海燕,彭代峰,于永涛.基于深度神经网络的图像语义分割研究综述[J].计算机工程,2020,46(10):1-17. 被引量：47
5段立娟,孙启超,乔元华,陈军成,崔国勤.基于注意力感知和语义感知的RGB-D室内图像语义分割算法[J].计算机学报,2021,44(2):275-291. 被引量：16
6贺照蒙,孔广黔,吴云.一种改进的室内场景语义分割网络[J].计算机工程与应用,2021,57(16):197-202. 被引量：2
7叶剑锋,徐轲,熊峻峰,王化明.基于注意力机制和辅助任务的语义分割算法[J].计算机工程,2021,47(9):203-209. 被引量：7
8周东明,张灿龙,唐艳平,李志欣.联合语义分割与注意力机制的行人再识别模型[J].计算机工程,2022,48(2):201-206. 被引量：3
9张静怡.基于非对称融合和关联上下文的RGBD语义分割算法研究[J].现代计算机,2022,28(1):96-100. 被引量：2
10邱云飞,温金燕.基于DeepLabV3+与注意力机制相结合的图像语义分割[J].激光与光电子学进展,2022,59(4):122-131. 被引量：20

引证文献5

1苏晓东,李世洲,赵佳圆,亮洪宇,张玉荣,徐红岩.基于多级叠加和注意力机制的图像语义分割[J].计算机工程,2023,49(9):265-271. 被引量：3
2徐杰,孙偲远.基于条件扩散隐式模型单幅图像去雨[J].计算机技术与发展,2023,33(12):79-84.
3朱新杰,熊风光,谢帅康,宋宁栋,李文清.交叉特征融合和RASPP驱动的场景分割方法[J].计算机系统应用,2024,33(1):76-86. 被引量：1
4王柳,梁铭炬.融合深度信息的室内场景分割算法[J].计算机系统应用,2024,33(3):111-117.
5肖慈,徐杨,张永丹,冯明文,黄易仟.结合注意力和低光增强的夜间语义分割[J].计算机工程,2024,50(7):271-281.

二级引证文献4

1任月冬,游新冬,滕尚志,吕学强.基于预训练模型的单帧航拍图像无监督语义分割[J].北京信息科技大学学报（自然科学版）,2024,39(2):21-28. 被引量：1
2何松,唐程华,陈鑫.融合残差反卷积的图像分割算法研究[J].福建电脑,2024,40(5):1-5. 被引量：1
3赵婉秋,张俊虎,李海涛.用于建筑物分割的平行结构特征融合网络[J].计算机工程,2024,50(8):239-248.
4闵莉,董冰洁,安冬.基于多注意力机制与跨特征融合的语义分割算法[J].计算机工程,2024,50(8):282-289.

1张宇,杨金科.“实践育人”研究的现状、演化路径与热点主题——基于citespace的可视化知识图谱分析[J].吉林师范大学学报（人文社会科学版）,2022,50(6):116-124.
2刘婉春,景明利,王子昭,陈腾飞,樊锐博.基于Transformer和双残差网络的图像去模糊算法研究[J].信息技术与信息化,2023(1):217-220.
3邬开俊,梅源.VAE-Fuse:一种无监督的多聚焦融合模型[J].西安电子科技大学学报,2022,49(6):129-138. 被引量：2
4高峰,郑源,范嘉博,李艳,李文强.基于光谱共焦原理的滚珠螺母多尺度测量方法[J].仪器仪表学报,2022,43(10):22-31.
5徐益民,杨余旺,郭利强.一种蚁群算法优化的BP神经网络技术研究[J].计算机与数字工程,2022,50(11):2373-2376. 被引量：1

计算机工程

2023年第2期

浏览历史

内容加载中请稍等...

基于多尺度注意力机制的道路场景语义分割模型被引量：5

参考文献3

二级参考文献15

共引文献29

同被引文献22

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多尺度注意力机制的道路场景语义分割模型 被引量：5

参考文献3

二级参考文献15

共引文献29

同被引文献22

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多尺度注意力机制的道路场景语义分割模型被引量：5