语义分割是指对图像进行像素级的分类并且对图像中的每个像素都给定一个类标记的图像分割技术,是计算机视觉领域的主要研究方向之一。随着深度学习的发展,基于深度神经网络的语义分割方法发展迅速,并实现了超越传统语义分割方法的精度...语义分割是指对图像进行像素级的分类并且对图像中的每个像素都给定一个类标记的图像分割技术,是计算机视觉领域的主要研究方向之一。随着深度学习的发展,基于深度神经网络的语义分割方法发展迅速,并实现了超越传统语义分割方法的精度。然而,基于深度学习的语义分割的实现,需要大量的有标记的训练数据支持。在许多应用场景中,得到大量的标记数据是困难的。因此,基于小样本的语义分割方法被提出,以解决这类问题。当前的小样本语义分割方法主要是通过预训练的分类网络提取高维特征,然后使用高维特征的余弦相似度图为引导,对查询图像的目标区域进行分割。但是这些方法都面临着相似度图不清晰导致分割精度不高的问题。为此,文中设计了一个胶囊模块,用于生成更清晰的余弦相似度图。此外,为更好地利用多个支持图像中包含的语义信息,除了使用交叉熵损失函数外,还使用了一个新的边缘损失函数。在国际计算机视觉竞赛数据集(PASCAL-5^(i))上的试验结果显示:小样本(5个样本)语义分割方法精度平均交并比(mean intersection over union,mIoU)达到61.0%。展开更多
文摘语义分割是指对图像进行像素级的分类并且对图像中的每个像素都给定一个类标记的图像分割技术,是计算机视觉领域的主要研究方向之一。随着深度学习的发展,基于深度神经网络的语义分割方法发展迅速,并实现了超越传统语义分割方法的精度。然而,基于深度学习的语义分割的实现,需要大量的有标记的训练数据支持。在许多应用场景中,得到大量的标记数据是困难的。因此,基于小样本的语义分割方法被提出,以解决这类问题。当前的小样本语义分割方法主要是通过预训练的分类网络提取高维特征,然后使用高维特征的余弦相似度图为引导,对查询图像的目标区域进行分割。但是这些方法都面临着相似度图不清晰导致分割精度不高的问题。为此,文中设计了一个胶囊模块,用于生成更清晰的余弦相似度图。此外,为更好地利用多个支持图像中包含的语义信息,除了使用交叉熵损失函数外,还使用了一个新的边缘损失函数。在国际计算机视觉竞赛数据集(PASCAL-5^(i))上的试验结果显示:小样本(5个样本)语义分割方法精度平均交并比(mean intersection over union,mIoU)达到61.0%。