轻量化卷积注意力特征融合网络的实时语义分割被引量：1

Lightweight Network with Convolutional Attention Feature Fusion for Real-Time Semantic Segmentation

下载PDF

导出

摘要轻量化卷积神经网络的出现促进了基于深度学习的语义分割技术在低功耗移动设备上的应用.然而,轻量化卷积神经网络一般不考虑融合特征之间的关系,常使用线性方式进行特征融合,网络分割精度有限.针对该问题,提出一种基于编码器-解码器架构的轻量化卷积注意力特征融合网络.在编码器中,基于MobileNetv2给出空洞MobileNet模块,以获得足够大的感受野,提升轻量化主干网络的表征能力;在解码器中,给出卷积注意力特征融合模块,通过学习特征平面通道、高度和宽度3个维度间的关系,获取不同特征平面之间的相对权重,并以此对特征平面进行加权融合,提升特征融合的效果.所提网络仅有0.68×106参数量,在未使用预训练模型、后处理和额外数据的情况下,使用NVIDIA 2080Ti显卡在城市道路场景数据集Cityscapes和CamVid上进行实验的结果表明,该网络的平均交并比分别达到了72.7%和67.9%,运行速度分别为86帧/s和105帧/s,在分割精度、网络规模与运行速度之间达到了较好的平衡. Recently reported lightweight networks have promoted the application of real-time semantic seg-mentation on mobile platforms.However,the linear combination operation performed in lightweight net-works do not consider the relationship between fused features,resulting in limited segmentation accuracy.To solve this dilemma,a lightweight network with convolutional attention feature fusion based on en-coder-decoder architecture is proposed in this paper.In the encoder,a dilated MobileNet block is given based on MobileNetv2 to create sufficient receptive fields and enhance representation ability of the lightweight backbone.In the decoder,convolutional attention feature fusion module is given.Relative attention weights that contain interactions between channel,height and width are used to aggregate feature maps.Specifically,without a pretrained model,postprocessing or extra data,the lightweight network with convolutional atten-tion feature fusion has only 0.68 million parameters and achieves a 72.7%mean intersection over union on the Cityscapes dataset with a speed of 86 frames per second and a 67.9%mean intersection over union on the Camvid dataset with a speed of 105 frames per second on a single 2080Ti GPU.The comprehensive experi-ments demonstrate that our model achieves favorable trade-off between accuracy,model size and speed.

作者董荣胜刘意马雨琪李凤英 Dong Rongsheng;Liu Yi;Ma Yuqi;Li Fengying(Guangxi Key Laboratory of Trusted Software,Guilin University of Electronic Technology,Guilin 541004)

机构地区桂林电子科技大学广西可信软件重点实验室

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第6期935-943,共9页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(62062029,61762024).

关键词实时语义分割轻量化卷积神经网络注意力机制特征融合 real-time semantic segmentation lightweight convolution neural network attention mechanism feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1高翔,李春庚,安居白.基于注意力和多标签分类的图像实时语义分割[J].计算机辅助设计与图形学学报,2021,33(1):59-67. 被引量：19

二级参考文献4

1安喆,徐熙平,杨进华,乔杨,刘洋.结合图像语义分割的增强现实型平视显示系统设计与研究[J].光学学报,2018,38(7):77-83. 被引量：21
2姜思羽,钟晓玲,邱少健,宋恒杰.结合标签相关性和不均衡性的多标签学习模型[J].哈尔滨工业大学学报,2019,51(1):142-149. 被引量：5
3冯兴杰,张乐,曾云泽.基于多注意力CNN的问题相似度计算模型[J].计算机工程,2019,45(9):284-290. 被引量：15
4岳师怡.基于多层级上下文信息的图像语义分割[J].激光与光电子学进展,2019,56(24):107-115. 被引量：6

共引文献18

1夏进军,周方舟,樊真成,黄宝钢,刘礼.基于深度学习的汽车造型设计工具研究[J].包装工程,2021,42(18):42-49. 被引量：5
2邬友朋,赵金龙,贾中营.一种基于KNN/CNN的供热客服音频分类方法[J].电力大数据,2021,24(7):56-66. 被引量：1
3王威,胡亿洋,王新,李骥,李宇涛.针对新型冠状病毒肺炎X射线图像识别的DD-CovidNet模型[J].计算机辅助设计与图形学学报,2021,33(11):1649-1657. 被引量：7
4陈劲宏,陈玮,陈舒曼.单块嵌入式GPU下对街景图像的实时分割研究[J].控制工程,2021,28(11):2165-2173. 被引量：2
5陈孝如.基于注意力机制非静态网络的图像语义分割算法[J].电脑编程技巧与维护,2022(5):143-145.
6周橙旻,黄婷,罗欣,Jake Kaner.基于老年用户感知能力的人机界面视觉匹配研究[J].包装工程,2022,43(20):179-186. 被引量：5
7谢新林,罗臣彦,续欣莹,谢刚.双注意力引导的跨层优化交通场景语义分割[J].交通运输系统工程与信息,2023,23(1):236-244.
8吴琼,瞿绍军.融合注意力机制的端到端的街道场景语义分割[J].小型微型计算机系统,2023,44(7):1514-1520. 被引量：2
9鹿鑫,杜煜,陈泽宇,徐世杰.基于改进BiSeNet的语义分割算法[J].传感器与微系统,2023,42(7):136-139. 被引量：1
10薛薇,张锋,凡静,王博,李娜.基于边缘检测及RBF神经网络的遥感图像帧特征动态识别技术[J].计算机测量与控制,2023,31(7):163-168.

同被引文献14

1张庆港,张向军,余海坤,卢小平,李国清.一种轻量级网络模型的遥感水体提取方法[J].测绘科学,2022,47(11):64-72. 被引量：3
2杨柳,陈延辉,岳德鹏,冯仲科.无人机遥感影像的城市绿地信息提取[J].测绘科学,2017,42(2):59-64. 被引量：50
3董蕴雅,张倩.基于CNN的高分遥感影像深度语义特征提取研究综述[J].遥感技术与应用,2019,34(1):1-11. 被引量：23
4孟琭,徐磊,郭嘉阳.一种基于改进的MobileNetV2网络语义分割算法[J].电子学报,2020,48(9):1769-1776. 被引量：27
5陈周,费鲜芸,高祥伟,王筱雪,赵慧敏.高分辨率遥感影像分割的城市绿地提取研究[J].测绘通报,2020(12):17-20. 被引量：8
6刘钊,赵桐,廖斐凡,李帅,李海洋.基于语义分割网络的高分遥感影像城市建成区提取方法研究与对比分析[J].国土资源遥感,2021,33(1):45-53. 被引量：6
7徐知宇,周艺,王世新,王丽涛,王振庆.面向GF-2遥感影像的U-Net城市绿地分类[J].中国图象图形学报,2021,26(3):700-713. 被引量：29
8林怡,张文豪,宇洁,张翰超.基于无人机影像的城市植被精细分类[J].中国环境科学,2022,42(6):2852-2861. 被引量：7
9蒯宇,王彪,吴艳兰,陈搏涛,陈兴迪,薛维宝.基于多尺度特征感知网络的城市植被无人机遥感分类[J].地球信息科学学报,2022,24(5):962-980. 被引量：16
10袁德宝,王子林,李雪莹,吴子若,袁岳.基于改进U-Net的遥感影像城镇绿地提取[J].遥感信息,2023,38(1):33-39. 被引量：3

引证文献1

1曹乾洋,杨广斌,王仁儒,李蔓,骆耀培,陶倩.一种轻量级网络的城市建成区绿地提取方法[J].测绘科学,2023,48(9):99-109.

1陈小娇,梁鹏科,杨怡萍.基于EfficientNet的癌痛面部表情评估方法的研究[J].临床医学进展,2023,13(7):11934-11942.
2王超,艾晓多,温馨,王思思.常规调水条件下城市河湖易发区域水华预测研究[J].甘肃水利水电技术,2023,59(6):14-18.
3侯卓成,欧阳华,胡鑫,尹洋.基于深度学习的模糊指针式仪表矫正读数方法[J].电子测量技术,2023,46(9):158-165. 被引量：1
4张慧,宋磊军,李娜.不同给药方式氨甲环酸在体外循环心脏手术中有效性与安全性比较[J].临床药物治疗杂志,2023,21(7):11-17.
5徐胜勇,李磊,童辉,王成超,别之龙,黄远.基于RGB-D相机的黄瓜苗3D表型高通量测量系统研究[J].农业机械学报,2023,54(7):204-213. 被引量：6
6李键,陈桂,David Cova,孙永壮,孙宇航,刘洋.一种基于ConvLSTM神经网络的TOC含量地震预测方法[J].地球物理学进展,2023,38(3):1143-1151. 被引量：3
7黎文辉.基于常用结构设计软件的住宅砌体填充墙开裂原因分析及对策[J].广东土木与建筑,2023,30(7):37-41.
8李凯,任炳昱,王佳俊,关涛,余佳.基于CEEMDAN-Transformer的灌浆流量混合预测模型[J].水利学报,2023,54(7):806-817. 被引量：4
9温智成,王蕾,冯锦梁,叶森辉.结合局部增强与反向残差的点云语义分割网络[J].激光与红外,2023,53(7):1131-1136. 被引量：2
10宋歌,韩芳,许景伟,杨志军,穆豪祥,王志勇,王哲.基于LandUSEM模型的山东沿海防护林树种分布适宜性分析[J].南京林业大学学报（自然科学版）,2023,47(4):42-50. 被引量：1

计算机辅助设计与图形学学报

2023年第6期

浏览历史

内容加载中请稍等...

轻量化卷积注意力特征融合网络的实时语义分割被引量：1

参考文献1

二级参考文献4

共引文献18

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

轻量化卷积注意力特征融合网络的实时语义分割 被引量：1

参考文献1

二级参考文献4

共引文献18

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

轻量化卷积注意力特征融合网络的实时语义分割被引量：1