针对遥感建筑物图像中建筑物大小不一、边缘模糊导致精度不高的问题,提出一种双分支并行融合注意力机制的网络模型TC-UNet++。针对卷积神经网络擅长提取局部特征,难以捕获全局信息的特点,引入Transformer结构以解决全局信息丢失的问题...针对遥感建筑物图像中建筑物大小不一、边缘模糊导致精度不高的问题,提出一种双分支并行融合注意力机制的网络模型TC-UNet++。针对卷积神经网络擅长提取局部特征,难以捕获全局信息的特点,引入Transformer结构以解决全局信息丢失的问题。对于两种结构的特征维度和通道数不匹配的问题,设计一种TC(Transformer to CNN)模块以交互的方式融合不同分辨率下局部与全局特征。引入坐标注意力机制,根据像素在图像中的位置信息,定位和识别建筑物。实验结果表明,TC-UNet++在WHU数据集上交互比、准确率、总精度分别达到了93.1%、95.9%、98.8%,在不显著增加参数的情况下,展现出良好的有效性。展开更多
文摘针对遥感建筑物图像中建筑物大小不一、边缘模糊导致精度不高的问题,提出一种双分支并行融合注意力机制的网络模型TC-UNet++。针对卷积神经网络擅长提取局部特征,难以捕获全局信息的特点,引入Transformer结构以解决全局信息丢失的问题。对于两种结构的特征维度和通道数不匹配的问题,设计一种TC(Transformer to CNN)模块以交互的方式融合不同分辨率下局部与全局特征。引入坐标注意力机制,根据像素在图像中的位置信息,定位和识别建筑物。实验结果表明,TC-UNet++在WHU数据集上交互比、准确率、总精度分别达到了93.1%、95.9%、98.8%,在不显著增加参数的情况下,展现出良好的有效性。