融合注意力和多尺度特征的街景图像语义分割被引量：2

Semantic Segmentation of Street View Image Based on Attention and Multi-scale Features

下载PDF

导出

摘要为了解决在街道场景图像语义分割任务中传统U-Net网络在多尺度类别下目标分割的准确率较低和图像上下文特征的关联性较差等问题,提出一种改进U-Net的语义分割网络AS-UNet,实现对街道场景图像的精确分割.首先,在U-Net网络中融入空间通道挤压激励(spatial and channel squeeze&excitation block,scSE)注意力机制模块,在通道和空间两个维度来引导卷积神经网络关注与分割任务相关的语义类别,以提取更多有效的语义信息;其次,为了获取图像的全局上下文信息,聚合多尺度特征图来进行特征增强,将空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)多尺度特征融合模块嵌入到U-Net网络中;最后,通过组合使用交叉熵损失函数和Dice损失函数来解决街道场景目标类别不平衡的问题,进一步提升分割的准确性.实验结果表明,在街道场景Cityscapes数据集和Cam Vid数据集上AS-UNet网络模型的平均交并比(mean intersection over union,MIo U)相较于传统U-Net网络分别提高了3.9%和3.0%,改进的网络模型显著提升了对街道场景图像的分割效果. This study aims to solve the problems faced by traditional U-Net network in the semantic segmentation task of street scene images,such as the low accuracy of object segmentation under multi-scale categories and the poor correlation of image context features.To this end,it proposes an improved U-Net semantic segmentation network AS-UNet to achieve accurate segmentation of street scene images.Firstly,the spatial and channel squeeze & excitation block(scSE)attention mechanism module is integrated into the U-Net network to guide the convolutional neural network to focus on semantic categories related to segmentation tasks in both channel and space dimensions,to extract more effective semantic information.Secondly,to obtain the global context information of the image,the multi-scale feature map is aggregated for feature enhancement,and the atrous spatial pyramid pooling(ASPP) multi-scale feature fusion module is embedded into the U-Net network.Finally,the cross-entropy loss function and Dice loss function are combined to solve the problem of unbalanced target categories in street scenes,and the accuracy of segmentation is further improved.The experimental results show that the mean intersection over union(MIoU) of the AS-UNet network model in the Cityscapes and CamVid datasets increases by 3.9% and 3.0%,respectively,compared with the traditional U-Net network.The improved network model significantly improves the segmentation effect of street scene images.

作者洪军刘笑楠刘振宇 HONG Jun;LIU Xiao-Nan;LIU Zhen-Yu(School of Information Science and Engineering,Shenyang University of Technology,Shenyang 110870,China)

机构地区沈阳工业大学信息科学与工程学院

出处《计算机系统应用》 2024年第5期94-102,共9页 Computer Systems & Applications

基金辽宁省应用基础研究计划(2023JH2/101300225)。

关键词图像语义分割街道场景 U-Net 注意力机制多尺度特征融合 image semantic segmentation street scene U-Net attention mechanism multi-scale feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1郑美珠,赵景秀.基于区域一致性测度的彩色图像边缘检测[J].计算机应用,2011,31(9):2485-2488. 被引量：5
2钮圣虓,王盛,杨晶晶,陈更生.完全基于边缘信息的快速图像分割算法[J].计算机辅助设计与图形学学报,2012,24(11):1410-1419. 被引量：36
3王龙飞,严春满.道路场景语义分割综述[J].激光与光电子学进展,2021,58(12):36-58. 被引量：23

二级参考文献61

1Liuyuan Deng,Ming Yang,Zhidong Liang,Yuesheng He,Chunxiang Wang.Fusing Geometrical and Visual Information via Superpoints for the Semantic Segmentation of 3D Road Scenes[J].Tsinghua Science and Technology,2020,25(4):498-507. 被引量：7
2周继苗,李必军,陈世增.一种多层特征融合的道路场景实时分割方法[J].测绘通报,2020(1):10-15. 被引量：8
3王保平,刘升虎,张家田,张艳宁,范九伦.一种基于模糊熵和FKCN的边缘检测方法[J].计算机学报,2006,29(4):664-669. 被引量：22
4张晶,张权,王欣.一种新的基于统计向量和神经网络的边缘检测方法[J].计算机研究与发展,2006,43(5):920-926. 被引量：13
5薛斌党,薛文芳,姜志国.三维种子填充算法的改进[J].计算机辅助设计与图形学学报,2006,18(10):1553-1556. 被引量：16
6王江涛,杨静宇.一种基于Tsallis熵的彩色图像边缘检测方法[J].计算机应用研究,2007,24(7):309-311. 被引量：4
7GONZALEZ R C, WOODS R E. Digital image processing[ M]. 2nd ed. New York: Prentice Hall, 2003.
8TRAHANLAS P E, VENETSANOPOULOS A N. Color edge detection using vector order statistics [ J]. IEEE Transactions on Image Processing, 1993, 2(2) : 259 -264.
9SCHARCANSKI J, VENETSANOPOULOS A N. Edge detection of color images using directional operators [ J]. IEEE Transactions on Circuits and Systems for Video Technology, 1997, 7 (2) : 397 - 401.
10DONY R D, WESOLKOWSKI S. Edge detection on color images using RGB vector angles [ C]// Proceedings of IEEE Conference on Electrical and Computer Engineering. Piscataway, NJ: IEEE, 1999:687-392.

共引文献61

1李翠芸,曹潇男,姬红兵,邹其兵.基于偏微分方程的快速二维经验模态分解方法及其应用[J].计算机辅助设计与图形学学报,2014,26(7):1143-1150. 被引量：5
2曹晓倩,马彩文.一种光照度不一致鲁棒立体匹配算法[J].机器人,2014,36(5):634-640. 被引量：1
3陈一民,姚杰.单幅图像多尺度小波深度提取算法[J].计算机辅助设计与图形学学报,2014,26(11):2023-2030. 被引量：2
4罗晓霞,王莉青,薛弘晔.基于小波变换和曲波变换的图像边缘检测新算法[J].计算机工程与科学,2015,37(1):157-161. 被引量：10
5林丽君,殷鹰,何明格,尹湘云.基于小波模极大值的磁瓦裂纹缺陷边缘检测算法[J].电子科技大学学报,2015,44(2):283-288. 被引量：21
6李玲,张旭,贾磊磊.基于图像处理的车牌定位算法研究[J].大众科技,2015,17(5):19-20.
7韩建栋,朱婷婷,李月香.结合粗糙集与分层思想的彩色图像分割算法[J].计算机应用,2015,35(7):2020-2024. 被引量：6
8姜建国,李婷,杨玲敏,李朋辉.c_3通道高分辨率遥感图像阴影检测算法的改进[J].计算机辅助设计与图形学学报,2015,27(8):1490-1497. 被引量：10
9李文宁,张爱武,王书民,胡少兴,张晓.地面激光点云阶层式分类方法[J].计算机辅助设计与图形学学报,2015,27(8):1555-1561. 被引量：4
10岳颀.基于自适应权重极线距离变换的立体匹配[J].科学技术与工程,2015,35(28):39-42. 被引量：1

同被引文献4

1庄怡,唐真.基于色彩连续性的建筑色彩系统规划研究——以上海市松江新城城市副中心为例[J].建筑学报,2023(S02):127-131. 被引量：1
2陈丹.城市建筑色彩规划设计管控与实践--以漳州市为例[J].福建建筑,2022(6):21-24. 被引量：4
3王运武,黄荣怀,焦艳丽.数字化转型视域中的智慧学习环境理论演进[J].黑龙江高教研究,2024,42(3):154-160. 被引量：4
4马翔悦,徐金东,倪梦莹.基于多尺度特征模糊卷积神经网络的遥感图像分割[J].山东大学学报（工学版）,2024,54(3):44-54. 被引量：2

引证文献2

1郭淼.基于多尺度特征融合技术的弱信息图像分割研究[J].移动信息,2024,46(9):256-257.
2王菲.建筑颜色识别算法研究——基于卷积神经网络和图像识别技术[J].办公自动化,2024,29(19):54-56.

1陈文艺,苗宗成.基于DeepLabv3+算法的城市街景语义分割算法研究[J].无线互联科技,2024,21(9):103-105.
2刘艳梅,陈鑫顺,陈震,孙改生.基于深度学习的输电线路目标检测[J].沈阳航空航天大学学报,2024,41(2):68-75.
3刘冰,胡明强.基于DDRNet的无步长卷积语义分割方法[J].长春工业大学学报,2024,45(1):59-65.
4禤浚波,梁英豪,梁淑慧,张绿云,胡巍,柯宝毅,马文宇,李成.基于改进U-Net和X线片的脊柱侧弯Cobb角自动测量算法研究[J].基因组学与应用生物学,2024,43(4):708-718.
5汤维杰,方挺,韩家明,袁东祥.基于轻量级MobileNetV2-DeeplabV3+的棒材分割方法[J].重庆工商大学学报（自然科学版）,2024,41(3):66-71.
6王银,沈灵鑫,李茂环,王健安,李小松.融合视觉特征的光伏组件语义分割模型研究[J].太阳能学报,2024,45(4):500-511.
7梁秀满,高绍品,刘振东.利用轻量型卷积神经网络模型识别苹果叶部病害的探索[J].中国植保导刊,2024,44(4):41-49.
8汪香念,饶红霞,谢家豪.基于YOLOv5的小动物目标检测算法研究[J].工业控制计算机,2024,37(5):80-82. 被引量：1
9张悦,梁珊珊.基于改进Node2vec算法的锅炉温度场分割方法研究[J].电力科学与工程,2024,40(5):72-78.
10张越,王逊.基于改进Swin-Unet的遥感图像分割方法[J].无线电工程,2024,54(5):1217-1225.

计算机系统应用

2024年第5期

浏览历史

内容加载中请稍等...

融合注意力和多尺度特征的街景图像语义分割被引量：2

参考文献3

二级参考文献61

共引文献61

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合注意力和多尺度特征的街景图像语义分割 被引量：2

参考文献3

二级参考文献61

共引文献61

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合注意力和多尺度特征的街景图像语义分割被引量：2