-
题名多尺度特征金字塔融合的街景图像语义分割
- 1
-
-
作者
曲海成
王莹
董康龙
刘万军
-
机构
辽宁工程技术大学软件学院
-
出处
《计算机系统应用》
2024年第3期73-84,共12页
-
基金
国家自然科学基金面上项目(42271409)
辽宁省高等学校基本科研项目(LIKMZ20220699)。
-
文摘
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率.
-
关键词
语义分割
MDSDC
IDCP-LC
属性注意力
通道扩展上采样
特征融合
-
Keywords
semantic segmentation
mixed depthwise separable dilated convolution(MDSDC)
iterative dilated convolution pyramid with layer cascade(IDCP-LC)
attribute attention
channel expansion upsampling
feature fusion
-
分类号
TU198
[建筑科学—建筑理论]
TP391.41
[自动化与计算机技术—计算机应用技术]
-