-
题名基于掩码一致性机制的弱监督图像语义分割研究
- 1
-
-
作者
胡捷
赵海涛
-
机构
华东理工大学信息科学与工程学院
-
出处
《应用光学》
CAS
北大核心
2024年第4期741-750,共10页
-
基金
国家自然科学基金(62173143,61973122)。
-
文摘
语义分割是一项广泛应用于无人驾驶、缺陷检测等场景的计算机视觉技术,但像素级的细粒度标注需要极大的标注成本,所以如何利用易获取的图像级标签进行弱监督语义分割是长期以来的研究重点。相较于仅依靠类激活映射图(class activation maps,CAM)实现像素级分割,提出掩码一致性机制(masked consistency mechanism,MCM)来提供额外的监督信号,以此来缩小全监督和弱监督之间的差距。在全监督语义分割中,网络对图像每一块的掩码预测都具有一致的像素级分割监督,因此在ViT(vision transformer)中屏蔽掉一部分图像块,并要求仅依靠保留的图像块生成的类激活映射图与依靠完整图像生成的类激活映射图一致,以此为网络训练提供额外的自监督信号。在PASCAL VOC 2012和MS COCO上进行的实验表明,本文方法在使用相同监督水平的情况下优于最先进的方法。
-
关键词
语义分割
弱监督
掩码一致性
类激活映射图
-
Keywords
semantic segmentation
weakly supervision
masked consistency
class activation maps
-
分类号
TN911.73
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-