-
题名分心感知的伪装物体分割
- 1
-
-
作者
梅海洋
杨鑫
周运铎
季葛鹏
魏小鹏
范登平
-
机构
大连理工大学社会计算与认知智能教育部重点实验室
School of Computing
南开大学国际先进研究院(深圳福田)
-
出处
《中国科学:信息科学》
CSCD
北大核心
2024年第3期653-673,共21页
-
基金
国家重点研发计划(批准号:2022ZD0210500)
国家自然科学基金(批准号:61972067,U21A20491)
大连市杰出青年科学基金(批准号:2022RJ01)资助项目。
-
文摘
本文致力于设计一个有效且高效的伪装物体分割(camouflaged object segmentation, COS)模型.为此,本文开发了一个生物启发的框架,称为金字塔定位和聚焦网络(pyramid positioning and focus network, PFNet+),其模仿了自然界中的捕食过程.具体地,本文的PFNet+包含3个关键模块,即上下文增强模块(context enrichment, CEn)、金字塔定位模块(pyramid positioning module, PPM)和聚焦模块(focus module, FM). CEn通过整合上下文信息来增强骨干特征的表征能力,从而提供更有辨别性的骨干特征. PPM模仿捕食中的检测过程,以金字塔的方式从全局的角度定位潜在的目标物体.然后FM执行捕食中的识别过程,通过在歧义区域的聚焦逐步细化初始的预测结果.值得注意的是,在FM中,本文开发了一个新颖的分心挖掘策略,用于分心区域的发现和去除,以提高预测的性能.大量的实验证明本文的PFNet+能够实时运行(56 fps),在4个标准度量指标下, PFNet+在3个具有挑战性的数据集上都显著优于现有的20个最新模型,在其他视觉任务(如息肉分割)上的实验进一步证明了PFNet+的泛化能力.
-
关键词
伪装物体
分心
上下文增强
上下文探索
金字塔
分割
-
Keywords
camouflaged object
distraction
context enrichment
context exploration
pyramid
segmentation
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-