基于多级叠加和注意力机制的图像语义分割被引量：3

Image Semantic Segmentation Based on Multi-level Superposition and Attention Mechanism

下载PDF

导出

摘要针对目标空间复杂度高容易造成小尺度目标丢失和边界分割不连续等问题,借鉴DeepLabv3+网络结构,建立基于多级叠加和注意力机制的图像语义分割模型。在编码器阶段,采用不同尺度的平均池化操作构建多尺度平均池化模块,使用不同扩张率的空洞卷积组成多尺度叠加模块扩大卷积运算的感受野,增强对局部特征的获取能力,并利用由通道和空间组成的注意力机制模块抑制无意义的特征,增强有意义的特征,提高对小尺度目标及局部边界的分割精度。在解码器阶段,通过双线性插值法对特征图进行分辨率恢复,并结合通道维度信息进行像素填充补充特征信息,并使用Softmax激活函数进行语义分割的输出预测。实验结果表明,该模型在PASCAL VOC2012和SUIM公开数据集上的平均交并比分别达到85.6%和60.8%,在整体分割精度和小尺度图像的分割效果上明显优于多数图像语义分割模型。 To address the common problems such as small-scale targets being easily lost and boundary segmentation being discontinuous owing to the complexity of target space,a semantic image segmentation model based on multi-level superposition and attention mechanism is established using the DeepLabv3+network structure.The encoder stage involves the following:average pooling operations are used at different scales to construct a multi-scale average pooling module;hollow convolutions with different expansion rates are used to form a multi-scale superposition module,expand the receptive field of convolution operations,and enhance the ability to obtain local features;an attention mechanism module composed of channels and spaces is utilized to suppress meaningless features,enhance meaningful features,and improve the segmentation accuracy of small-scale targets and target boundaries.In the decoder stage,bilinear interpolation is used to restore the resolution of the feature map,and pixel filling is combined with channel dimension information to supplement the feature information.A Softmax activation function is used for semantic segmentation output prediction.The experimental results show that the Mean Intersection over Union(MIoU)of this model on the PASCAL VOC2012 and SUIM public datasets reaches 85.6%and 60.8%,respectively.It significantly outperforms most image semantic segmentation models in terms of overall segmentation accuracy and small-scale image segmentation performance.

作者苏晓东李世洲赵佳圆亮洪宇张玉荣徐红岩 SU Xiaodong;LI Shizhou;ZHAO Jiayuan;LIANG Hongyu;ZHANG Yurong;XU Hongyan(School of Computer and Information Engineering,Harbin University of Commerce,Harbin 150028,China;Heilongjiang Key Laboratory of Electronic Commerce and Intelligent Information Processing,Harbin 150028,China)

机构地区哈尔滨商业大学计算机与信息工程学院黑龙江省电子商务与智能信息处理重点实验室

出处《计算机工程》 CAS CSCD 北大核心 2023年第9期265-271,278,共8页 Computer Engineering

基金黑龙江省自然科学基金(LH2022F035) 哈尔滨商业大学研究生创新科研项目(YJSCX2022-743HSD) 2022年哈尔滨商业大学教师创新支持计划项目(XL0068)。

关键词语义分割小尺度目标注意力机制多尺度叠加多尺度平均池化 semantic segmentation small-scale target attention mechanism multi-scale superposition multi-scale average pooling

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1范润泽,刘宇红,张荣芬,李景玉.基于多尺度注意力机制的道路场景语义分割模型[J].计算机工程,2023,49(2):288-295. 被引量：5
2景庄伟,管海燕,彭代峰,于永涛.基于深度神经网络的图像语义分割研究综述[J].计算机工程,2020,46(10):1-17. 被引量：47
3邱云飞,温金燕.基于DeepLabV3+与注意力机制相结合的图像语义分割[J].激光与光电子学进展,2022,59(4):122-131. 被引量：20
4姚燕,胡立坤,郭军.基于改进DeepLabv3+网络的轻量级语义分割算法[J].激光与光电子学进展,2022,59(4):192-199. 被引量：7
5叶剑锋,徐轲,熊峻峰,王化明.基于注意力机制和辅助任务的语义分割算法[J].计算机工程,2021,47(9):203-209. 被引量：7

二级参考文献21

1苏金玲,王朝晖.基于Graph Cut和超像素的自然场景显著对象分割方法[J].苏州大学学报（自然科学版）,2012,28(2):27-33. 被引量：7
2汪海洋,潘德炉,夏德深.二维Otsu自适应阈值选取算法的快速实现[J].自动化学报,2007,33(9):968-971. 被引量：134
3曹炬,陈钢,李艳姣.多策略粒子群优化算法[J].计算机工程与科学,2014,36(9):1716-1721. 被引量：6
4杨雪,范勇,高琳,邱运春.基于纹理基元块识别与合并的图像语义分割[J].计算机工程,2015,41(3):253-257. 被引量：5
5郑宝玉,王雨,吴锦雯,周全.基于深度卷积神经网络的弱监督图像语义分割[J].南京邮电大学学报（自然科学版）,2018,38(5):1-12. 被引量：6
6田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：222
7谭光鸿,侯进,韩雁鹏,罗朔.基于卷积神经网络的低参数量实时图像分割算法[J].激光与光电子学进展,2019,56(9):92-100. 被引量：13
8袁立,袁吉收,张德政.基于DeepLab-v3+的遥感影像分类[J].激光与光电子学进展,2019,56(15):228-235. 被引量：29
9黄刚,刘先林.基于深度学习的道路标线自动提取与分类方法[J].中国激光,2019,46(8):138-145. 被引量：28
10王中宇,倪显扬,尚振东.利用卷积神经网络的自动驾驶场景语义分割[J].光学精密工程,2019,27(11):2429-2438. 被引量：33

共引文献79

1田志新,廖薇,茅健,吴建民,袁泉,徐震.融合边缘监督的改进Deeplabv3+水下鱼类分割方法[J].电子测量与仪器学报,2022,36(10):208-216. 被引量：3
2姜妍,张立国.面向深度学习模型的对抗攻击与防御方法综述[J].计算机工程,2021,47(1):1-11. 被引量：19
3袁铭阳,黄宏博,周长胜.全监督学习的图像语义分割方法研究进展[J].计算机工程与应用,2021,57(4):43-54. 被引量：10
4刘永波,胡亮,曹艳,唐江云,雷波.基于U-Net的玉米叶部病斑分割算法[J].中国农学通报,2021,37(5):88-95. 被引量：11
5沈言善,王阿川.基于深度学习的遥感图像地物分割方法[J].液晶与显示,2021,36(5):733-740. 被引量：10
6陈明瑶,徐琨,李晓旋.基于风格迁移的手势分割方法[J].计算机与现代化,2021(5):20-25.
7朱晓武,周正玉,刘剑,王彦泽.自然资源外业调查通用平台技术研究[J].地理空间信息,2021,19(7):27-30. 被引量：4
8王龙飞,严春满.道路场景语义分割综述[J].激光与光电子学进展,2021,58(12):36-58. 被引量：23
9白欢欢.一种融合多注意力机制的服饰分割方法研究[J].国外电子测量技术,2021,40(7):52-58. 被引量：6
10姚金龙,王希乐,刘贺,张锦华,曹羽德.基于U-Net神经网络的行人图像语义分割[J].信息与电脑,2021,33(18):69-71.

同被引文献9

1杨小明,罗云.ISODATA算法的实现与分析[J].采矿技术,2006,6(2):66-66. 被引量：10
2景庄伟,管海燕,彭代峰,于永涛.基于深度神经网络的图像语义分割研究综述[J].计算机工程,2020,46(10):1-17. 被引量：47
3胡高珍,徐胜军,孟月波,刘光辉,冯峰,段中兴.基于边缘约束局部区域MRF的图像分割方法[J].计算机工程,2021,47(6):253-261. 被引量：6
4叶剑锋,徐轲,熊峻峰,王化明.基于注意力机制和辅助任务的语义分割算法[J].计算机工程,2021,47(9):203-209. 被引量：7
5张宸嘉,朱磊,俞璐.卷积神经网络中的注意力机制综述[J].计算机工程与应用,2021,57(20):64-72. 被引量：103
6林思玉,王敬东,顾东泽,姜宜君.一种基于FCOS神经网络的小建筑物目标检测方法[J].半导体光电,2022,43(2):369-376. 被引量：4
7Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：90
8褚张晴晴,钟志强,颜子夜,战荫伟.基于特征融合与注意力机制的脑肿瘤分割算法[J].计算机工程,2023,49(10):154-161. 被引量：4
9徐浩宸,刘满华.基于多层次自注意力网络的人脸特征点检测[J].计算机工程,2024,50(2):239-246. 被引量：1

引证文献3

1任月冬,游新冬,滕尚志,吕学强.基于预训练模型的单帧航拍图像无监督语义分割[J].北京信息科技大学学报（自然科学版）,2024,39(2):21-28. 被引量：1
2赵婉秋,张俊虎,李海涛.用于建筑物分割的平行结构特征融合网络[J].计算机工程,2024,50(8):239-248.
3闵莉,董冰洁,安冬.基于多注意力机制与跨特征融合的语义分割算法[J].计算机工程,2024,50(8):282-289.

二级引证文献1

1赵东哲,周英森,李保路.基于Faster R-CNN的防排水板料袋自动拆垛视觉定位系统[J].价值工程,2024,43(23):58-61.

1王俪璇,叶成名,眭天波,魏瑞龙,李洪富.川藏交通廊道冰川和地表水遥感监测及耦合分析[J].测绘通报,2023(6):50-55. 被引量：1
2李云萍,丁兆艳,李萍,王正滨,李文.原发性宫颈透明细胞癌超声特征分析[J].中国超声医学杂志,2023,39(4):472-474. 被引量：2
3王跃,王云帆.胰腺巨大浆液性囊腺癌侵犯十二指肠1例并文献复习[J].诊断病理学杂志,2023,30(4):376-377.
4章益民.基于对比边界学习的超面片Transformer点云分割网络[J].计算机时代,2023(9):75-80.
5刘新根,王伯芝,刘笑娣.基于空间S形曲线的盾构轨迹纠偏方法[J].隧道建设（中英文）,2023,43(S01):457-463. 被引量：1
6方家吉,赖一波,唐正涛,喻擎苍.基于DeepLabv3+的轻量级电力线语义分割方法[J].计算机时代,2023(9):19-23. 被引量：1
7刘培刚,孙洁,杨超智,李宗民.密集场景下基于多尺度特征聚合的人群计数方法[J].计算机科学,2023,50(9):235-241.
8杨峰.基于热力图像的道路场景稠密多级语义分割方法[J].实验室研究与探索,2023,42(6):125-130.
9刘一俊,张勇,孙志虎,魏永孝,郭斌.西北地区某基坑凸边大变形险情加固处理分析[J].山西建筑,2023,49(17):93-95.
10包善书,车波,邓林红.基于双源域迁移学习的肺音信号识别[J].计算机工程,2023,49(9):295-302. 被引量：1

计算机工程

2023年第9期

浏览历史

内容加载中请稍等...

基于多级叠加和注意力机制的图像语义分割被引量：3

参考文献5

二级参考文献21

共引文献79

同被引文献9

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多级叠加和注意力机制的图像语义分割 被引量：3

参考文献5

二级参考文献21

共引文献79

同被引文献9

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多级叠加和注意力机制的图像语义分割被引量：3