基于多注意力机制与跨特征融合的语义分割算法

Semantic Segmentation Algorithm Based on Multi-Attention Mechanism and Cross-Feature Fusion

下载PDF

导出

摘要图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的图像语义分割算法。该算法选取轻量级网络MobileNetv2作为主干,以缩短训练时间;通过优化空洞空间金字塔池化模块中空洞卷积的膨胀率,改善多尺度语义特征的提取效果,提高模型对小目标的分割能力,并将兼具通道与空间的卷积块注意力机制引入其中,更加关注对分割起决定作用的区域,从而加强对目标边界的提取;在编码器中设计跨特征融合模块,以聚合不同层次特征图的空间信息和语义信息,提高网络学习特征的能力;在编码和解码部分均引入坐标注意力机制,以分解全局平均池化的方式将位置信息嵌入到通道中,从而得到分割目标的准确位置。实验结果表明,所提算法F3crc-DeepLabv3+在PASCAL VOC 2012增强数据集和Cityspaces数据集上的平均交并比分别达到了75.06%和73.06%,平均精度分别达到了84.16%和82.05%,精确率分别达到了86.18%和85.43%,训练时间分别为10 h和13.8 h,具有较优的网络性能。 Image semantic segmentation is widely used in defect detection,medical diagnosis,and unmanned driving.To address the common problems of existing semantic segmentation models,such as their high training costs,poor target contour segmentation,small target missegmentation and missing segmentation,this study proposes an image semantic segmentation algorithm based on the DeepLabv3+network framework,which combines a multi-attention mechanism and Cross-Feature Fusion(CFF).In this algorithm,the lightweight network MobileNetv2 is selected as the backbone to reduce the training time.The expansion rate of the void convolution in the void space pyramid pool module is optimized,the extraction effects of multiscale semantic features are improved,and the segmentation ability of the model for small targets is improved.A convolution block attention mechanism with both a channel and space is introduced,and more attention is paid to the region that plays a decisive role in segmentation to enhance the extraction of target boundaries.A cross-feature fusion module is designed in the encoder to aggregate the spatial and semantic information of the feature graphs at different levels to thereby improve the feature learning ability of the network.A Coordinate Attention(CA)mechanism is introduced in both the encoding and decoding parts,and the location information is embedded into the channel using global average pooling decomposition to obtain the exact location of the segmented target.The experimental results show that the proposed algorithm F3crc-DeepLabv3+achieves average crossover ratios of 75.06%and 73.06%,average accuracies of 84.16%and 82.05%,and precision rates of 86.18%and 85.43%,respectively,on the PASCAL VOC 2012 enhanced dataset.The training times are only 10 h and 13.8 h,respectively,indicating that the algorithm achieves better network performance.

作者闵莉董冰洁安冬 MIN Li;DONG Bingjie;AN Dong(School of Mechanical Engineering,Shenyang Jianzhu University,Shenyang 110168,Liaoning,China)

机构地区沈阳建筑大学机械工程学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第8期282-289,共8页 Computer Engineering

基金国家自然科学基金面上项目(51975130) 辽宁省教育厅项目(LJKMZ20220915)。

关键词语义分割 DeepLabv3+网络 MobileNetv2网络坐标注意力卷积块注意力模块跨特征融合 semantic segmentation DeepLabv3+network MobileNetv2 network Coordinate Attention(CA) Convolution Block Attention Module(CBAM) Cross-Feature Fusion(CFF)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1徐浩宸,刘满华.基于多层次自注意力网络的人脸特征点检测[J].计算机工程,2024,50(2):239-246. 被引量：1
2苏晓东,李世洲,赵佳圆,亮洪宇,张玉荣,徐红岩.基于多级叠加和注意力机制的图像语义分割[J].计算机工程,2023,49(9):265-271. 被引量：3
3Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：90
4褚张晴晴,钟志强,颜子夜,战荫伟.基于特征融合与注意力机制的脑肿瘤分割算法[J].计算机工程,2023,49(10):154-161. 被引量：4
5叶剑锋,徐轲,熊峻峰,王化明.基于注意力机制和辅助任务的语义分割算法[J].计算机工程,2021,47(9):203-209. 被引量：7

二级参考文献14

1杨雪,范勇,高琳,邱运春.基于纹理基元块识别与合并的图像语义分割[J].计算机工程,2015,41(3):253-257. 被引量：5
2国家卫生健康委员会医政医管局,江涛.脑胶质瘤诊疗规范(2018年版)[J].中华神经外科杂志,2019,35(3):217-239. 被引量：298
3景庄伟,管海燕,彭代峰,于永涛.基于深度神经网络的图像语义分割研究综述[J].计算机工程,2020,46(10):1-17. 被引量：47
4郝华颖,赵昆,苏攀,张辉,赵一天,刘江.一种基于改进ResU-Net的角膜神经分割算法[J].计算机工程,2021,47(1):217-223. 被引量：8
5王磐,强彦,杨晓棠,侯腾璇.基于双注意力3D-UNet的肺结节分割网络模型[J].计算机工程,2021,47(2):307-313. 被引量：22
6王囡,侯志强,赵梦琦,余旺盛,马素刚.结合边缘检测的语义分割算法[J].计算机工程,2021,47(7):257-265. 被引量：8
7叶剑锋,徐轲,熊峻峰,王化明.基于注意力机制和辅助任务的语义分割算法[J].计算机工程,2021,47(9):203-209. 被引量：7
8Meng-Hao Guo,Zheng-Ning Liu,Tai-Jiang Mu,Dun Liang,Ralph R.Martin,Shi-Min Hu.Can attention enable MLPs to catch up with CNNs?[J].Computational Visual Media,2021,7(3):283-288. 被引量：1
9邱云飞,温金燕.基于DeepLabV3+与注意力机制相结合的图像语义分割[J].激光与光电子学进展,2022,59(4):122-131. 被引量：20
10姚燕,胡立坤,郭军.基于改进DeepLabv3+网络的轻量级语义分割算法[J].激光与光电子学进展,2022,59(4):192-199. 被引量：7

共引文献99

1白欢欢.一种融合多注意力机制的服饰分割方法研究[J].国外电子测量技术,2021,40(7):52-58. 被引量：6
2杨阳,王媛青,李石磊,卢立峰.结合LSTM与Attention的高速公路路段旅行时间预测方法[J].交通与运输,2022,38(3):61-64.
3宋晓玲,刘勇,董景楠,黄勇飞.元宇宙中区块链的应用与展望[J].网络与信息安全学报,2022,8(4):45-65. 被引量：6
4周孟然,李学松,朱梓伟,黄凯文.井下矿工多目标检测与跟踪联合算法[J].工矿自动化,2022,48(10):40-47. 被引量：4
5蔡标,葛成,徐晴,陆翼,孔韧,常珊.基于Transformer网络的抗癌肽的预测[J].现代计算机,2022,28(18):9-15. 被引量：1
6王剑,王晓锋.基于VGG-19和Vision Transformer的乳腺超声图像分类方法[J].信息技术与信息化,2022(11):25-28.
7王延军,陈亚男,姚志鹏.基于机器视觉测试高锰酸盐指数的方法研究[J].环境科技,2022,35(6):51-54. 被引量：1
8郑秋梅,徐林康,王风华,林超.基于改进自注意力机制的金字塔场景解析网络[J].计算机工程,2023,49(1):242-249. 被引量：1
9俞钦平,吴振华,王亚蓓.一种耦合进化算法与FLUS模型的土地利用变化模拟模型[J].地球信息科学学报,2023,25(3):510-528. 被引量：5
10戚婧,阮广聪,杨毅,吴毅,曹倩,魏艳玲,粘永健.空间双线性注意力网络识别溃疡性结肠炎与克罗恩病[J].陆军军医大学学报,2023,45(3):227-234.

1侯艳丽,盖锡林.基于注意力机制改进的DeepLabV3+遥感图像分割算法[J].微电子学与计算机,2024,41(8):53-61.
2赵婉秋,张俊虎,李海涛.用于建筑物分割的平行结构特征融合网络[J].计算机工程,2024,50(8):239-248.
3黄浩,国联坤,周先彦,吴远进,王涛,李敏芳.基于机器视觉的微小冲压零件尺寸测量[J].电子技术应用,2024,50(7):59-64.
4邵凯,王明政,王光宇.基于Transformer的多尺度遥感语义分割网络[J].智能系统学报,2024,19(4):920-929.

计算机工程

2024年第8期

浏览历史

内容加载中请稍等...

基于多注意力机制与跨特征融合的语义分割算法

参考文献5

二级参考文献14

共引文献99

相关作者

相关机构

相关主题

浏览历史