摘要
本文提出一种结合了卷积神经网络编码器与Swin-Unet编码器解码器的多视角结构。卷积神经网络的优势在于对于局部细节的提取,使用卷积神经网络编码器可以更好的达到对浅层局部特征提取的目的。而Transformer结构更擅长于提取全局信息,在编码器中同时使用卷积神经网络和Swin Transformer结构可以同时提取全局信息和局部信息,将这些提取的局部信息与全局信息特征融合输入到跳跃连接中。在网络结构进入解码器阶段时,将跳跃连接中已融合的浅层特征与Swin Transformer解码器输出的解码特征进行特征融合可以同时兼顾图像分割的细节和整体。这种方法较之Swin-Unet在执行对腹部CT影像多器官分割时,分割精度dice score更高,分割边界效果更好。