基于Transformer的高效自适应语义分割网络被引量：1

Efficient and adaptive semantic segmentation network based on Transformer

下载PDF

导出

摘要基于Transformer的语义分割网络存在2个问题:分辨率变化引起的分割精度显著下降,自注意力机制计算复杂度过高。为此,利用零值填充的卷积可保留位置信息的特性,提出自适应卷积位置编码模块;利用自注意力计算中特定矩阵的维度可相互抵消的特性,提出降低自注意力计算量的联合重采样自注意力模块;设计用于融合不同阶段特征图的解码器,构造能够自适应不同分辨率输入的高效分割网络EA-Former. EA-Former在数据集ADE20K、Cityscapes上的最优平均交并比分别为51.0%、83.9%.与主流分割算法相比,EA-Former能够以更低的计算复杂度得到具有竞争力的分割精度,由输入分辨率变化引起的分割性能下降问题得以缓解. There are two problems at semantic segmentation network based on Transformer:significant drop of the segmentation accuracy due to the resolution variation and high computational complexity of self-attention.An adaptive convolutional positional encoding module was proposed,using a property of zero-padding convolution to retain positional information.Using the property that the dimensions of specific matrices can cancel each other in the self-attention computation.A joint resampling self-attention module to reduce the computational burden was proposed.A decoder was designed to fuse feature maps from different stages,resulting in the construction of an efficient segmentation network EA-Former which was capable of adapting to different resolution inputs.The mean intersection over union of EA-Former on the ADE20K was 51.0%and on the Cityscapes was 83.9%.Compared with the mainstream segmentation methods,the proposed network could achieve competitive accuracy with lower computational complexity,and the degradation of the segmentation performance caused by the variation of the input resolution was alleviated.

作者张海波蔡磊任俊平王汝言刘富 ZHANG Hai-bo;CAI Lei;REN Jun-ping;WANG Ru-yan;LIU Fu(School of Communications and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Chongqing Key Laboratory of Ubiquitous Sensing and Networking,Chongqing 400065,China;Chongqing Urban Lighting Center,Chongqing 400023,China)

机构地区重庆邮电大学通信与信息工程学院泛在感知与互联重庆市重点实验室重庆市城市照明中心

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2023年第6期1205-1214,共10页 Journal of Zhejiang University：Engineering Science

基金国家自然科学基金资助项目(62271094) 长江学者和创新团队发展计划基金资助项目(IRT16R72) 重庆市留创计划创新类资助项目(cx2020059)。

关键词语义分割 TRANSFORMER 自注意力位置编码神经网络 semantic segmentation Transformer self-attention position encoding neural network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1Wenhai Wang,Enze Xie,Xiang Li,Deng-Ping Fan,Kaitao Song,Ding Liang,Tong Lu,Ping Luo,Ling Shao.PVT v2:Improved baselines with Pyramid Vision Transformer[J].Computational Visual Media,2022,8(3):415-424. 被引量：65

共引文献64

1李敏,乔志远,杨易鑫.基于光学遥感影像的舰船检测研究综述[J].网络安全与数据治理,2023,42(S01):106-114.
2张显杰,张之明.基于卷积神经网络和Transformer的手写体英文文本识别[J].计算机应用,2022,42(8):2394-2400. 被引量：3
3薛相全,庞明宝.基于Transformer-ESIM的高速公路交通状态识别模型[J].物流科技,2022,45(17):71-75.
4单维锋,李志扬,陈俊,刘海军,张秀霞,邢丽莉,胡秀娟,夏庆新,夏金铸.应用卷积神经网络和自注意力机制识别地磁场干扰事件[J].地震地磁观测与研究,2022,43(5):49-63.
5Ge-Peng Ji,Guobao Xiao,Yu-Cheng Chou,Deng-Ping Fan,Kai Zhao,Geng Chen,Luc Van Gool.Video Polyp Segmentation: A Deep Learning Perspective[J].Machine Intelligence Research,2022,19(6):531-549. 被引量：11
6刘洋,李相国,连良秀.基于AIOT的安全生产监管平台关键技术研究[J].网络安全技术与应用,2022(12):7-9. 被引量：2
7李翔,张涛,张哲,魏宏杨,钱育蓉.Transformer在计算机视觉领域的研究综述[J].计算机工程与应用,2023,59(1):1-14. 被引量：14
8冯珺,彭梁英,赵帅,潘司晨,郭雪强.基于孪生神经网络的小样本目标检测综述[J].河北科技大学学报,2022,43(6):643-650. 被引量：2
9王甜甜,史卫亚,张世强,张绍文.采用双支路和Transformer的视杯视盘分割方法[J].科学技术与工程,2023,23(6):2499-2508. 被引量：1
10李清格,杨小冈,卢瑞涛,王思宇,谢学立,张涛.计算机视觉中的Transformer发展综述[J].小型微型计算机系统,2023,44(4):850-861. 被引量：13

同被引文献2

1李琳辉,钱波,连静,郑伟娜,周雅夫.基于卷积神经网络的交通场景语义分割方法研究[J].通信学报,2018,39(4):123-130. 被引量：19
2Zhenyu Li,Zehui Chen,Xianming Liu,Junjun Jiang.DepthFormer:Exploiting Long-range Correlation and Local Information for Accurate Monocular Depth Estimation[J].Machine Intelligence Research,2023,20(6):837-854. 被引量：1

引证文献1

1范康,钟铭恩,谭佳威,詹泽辉,冯妍.联合语义分割和深度估计的交通场景感知算法[J].浙江大学学报（工学版）,2024,58(4):684-695.

1李健,熊琦,胡雅婷,刘孔宇.基于Transformer和隐马尔科夫模型的中文命名实体识别方法[J].吉林大学学报（工学版）,2023,53(5):1427-1434. 被引量：7
2刘炎,袁野,沈红斌.基于图神经网络的固定骨架蛋白质设计方法研究[J].南京理工大学学报,2023,47(3):311-317.
3葛夫勇,雷景生,唐小岚.融合LC-Transformer XL文本分类的集成模型[J].计算机应用与软件,2023,40(6):118-123.
4郑德生,陈继鑫,周静,柯武平,陆超,周永,仇钎.基于输入通道拆分的对抗攻击迁移性增强算法[J].计算机工程,2023,49(1):130-137. 被引量：1
5杨作骞,施威,王景景.基于并联网络的水声信号自动调制识别方法[J].移动通信,2023,47(6):122-130. 被引量：1
6刘卫光,刘东,王璐.可变形卷积网络研究综述[J].计算机科学与探索,2023,17(7):1549-1564. 被引量：5
7仇海涛,徐梦桐,刘伟,马海滨.基于ACO-BP神经网络的光纤陀螺温度补偿方法研究[J].电光与控制,2023,30(7):78-81. 被引量：9
8刘忠洋,周杰,陆加新,缪则林,江凯强,高伟.多分辨率融合密集网络的图像去雨方法[J].电光与控制,2023,30(7):57-62.
9吴育坚,钟立锋,李俊文,马前,尹舵,曾海峰.基于鲸鱼算法改进小波神经网络的GIS局部放电诊断方法研究[J].计算技术与自动化,2023,42(2):25-30.
10李茜,宾帆,周熙朋,张安安,杨超.油气管道动态直流与交流混合干扰分离检测方法[J].电子测量与仪器学报,2023,37(4):192-203.

浙江大学学报（工学版）

2023年第6期

浏览历史

内容加载中请稍等...

基于Transformer的高效自适应语义分割网络被引量：1

参考文献1

共引文献64

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Transformer的高效自适应语义分割网络 被引量：1

参考文献1

共引文献64

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Transformer的高效自适应语义分割网络被引量：1