本文研究主要针对伪装复杂背景下的图像进行实例分割.由于分割对象的伪装性以及缺少大规模训练集来支撑模型训练,这对于复杂背景下的实例对象分割构成了巨大挑战.受SOTR(Segmenting Objects with Transformer)的启发下,本文设计了一种...本文研究主要针对伪装复杂背景下的图像进行实例分割.由于分割对象的伪装性以及缺少大规模训练集来支撑模型训练,这对于复杂背景下的实例对象分割构成了巨大挑战.受SOTR(Segmenting Objects with Transformer)的启发下,本文设计了一种方法框架,以解决动物野生环境和其他各类复杂伪装背景下的实例分割问题.相较于原始模型在特征目标的检测表现效果不佳,以及分割掩码存在上下文信息丢失的问题,本文提出的框架主要采用以下方法:引入特定的上下文特征金字塔提取网络CEM-FPN,以解决在高分辨率图像与感受野之间的矛盾.具体而言,高分辨率图像需要更大的感受野,但大感受野会导致小目标的检测误判为背景.在多层级融合模块加入通道空间注意力模块(CS Module),以提升对不同尺度上的各个实例对象的关注度,从而提高原型掩码的质量.实验结果表明,本文方法相较于原模型在COD10K-Test数据集上提升了4.1%的精确度,并在NC4K-Test数据集上提升了4.5%的精确度.展开更多
文摘本文研究主要针对伪装复杂背景下的图像进行实例分割.由于分割对象的伪装性以及缺少大规模训练集来支撑模型训练,这对于复杂背景下的实例对象分割构成了巨大挑战.受SOTR(Segmenting Objects with Transformer)的启发下,本文设计了一种方法框架,以解决动物野生环境和其他各类复杂伪装背景下的实例分割问题.相较于原始模型在特征目标的检测表现效果不佳,以及分割掩码存在上下文信息丢失的问题,本文提出的框架主要采用以下方法:引入特定的上下文特征金字塔提取网络CEM-FPN,以解决在高分辨率图像与感受野之间的矛盾.具体而言,高分辨率图像需要更大的感受野,但大感受野会导致小目标的检测误判为背景.在多层级融合模块加入通道空间注意力模块(CS Module),以提升对不同尺度上的各个实例对象的关注度,从而提高原型掩码的质量.实验结果表明,本文方法相较于原模型在COD10K-Test数据集上提升了4.1%的精确度,并在NC4K-Test数据集上提升了4.5%的精确度.