空间约束下自相互注意力的RGB-D显著目标检测

RGB-D Salient Object Detection Based on Spatial Constrained and Self-Mutual Attention

下载PDF

导出

摘要针对RGB-D显著目标检测问题,提出空间约束下自相互注意力的RGB-D显著目标检测方法.首先,引入空间约束自相互注意力模块,利用多模态特征的互补性,学习具有空间上下文感知的多模态特征表示,同时计算两种模态查询位置与周围区域的成对关系以集成自注意力和相互注意力,进而聚合两个模态的上下文特征.然后,为了获得更互补的信息,进一步将金字塔结构应用在一组空间约束自相互注意力模块中,适应不同空间约束下感受野不同的特征,学习到局部和全局的特征表示.最后,将多模态融合模块嵌入双分支编码-解码网络中,解决RGB-D显著目标检测问题.在4个公开数据集上的实验表明,文中方法在RGB-D显著目标检测任务上具有较强的竞争性. Aiming at the problem of RGB-D salient object detection,a RGB-D salient object detection method is proposed based on pyramid spatial constrained self-mutual attention.Firstly,a spatial constrained self-mutual attention module is introduced to learn multi-modal feature representations with spatial context awareness by the complementarity of multi-modal features.Meanwhile,the pairwise relationships between the query positions and surrounding areas are calculated to integrate self-attention and mutual attention,and thus the contextual features of the two modalities are aggregated.Then,to obtain more complementary information,the pyramid structure is applied to a set of spatial constrained self-mutual attention modules to adapt to different features of the receptive field under different spatial constraints and learn local and global feature representations.Finally,the multi-modal fusion module is embedded into a two-branch encoder-decoder network model,and the RGB-D salient object detection task is solved.Experiments on four benchmark datasets show strong competitiveness of the proposed me thod in RGB-D salient object detection.

作者袁晓肖云江波汤进 YUAN Xiao;XIAO Yun;JIANG Bo;TANG Jin(Anhui Provincial Key Laboratory of Multimodal Cognitive Computation,School of Computer Science and Technology,Anhui University,Hefei 230601;School of Artificial Intelligence,Anhui University,Hefei 230601;Institute of Artificial Intelligence,Hefei Comprehensive National Science Center,Hefei 230088)

机构地区安徽大学计算机科学与技术学院多模态认知计算安徽省重点实验室安徽大学人工智能学院合肥综合性国家科学中心

出处《模式识别与人工智能》 EI CSCD 北大核心 2022年第6期526-535,共10页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.62076004,62006002) 安徽省自然科学基金青年项目(No.1908085QF264) 安徽高校协同创新项目(No.GXXT-2020-013)资助。

关键词 RGB-D显著目标检测多模态融合自注意力机制卷积神经网络 RGB-D Salient Object Detection Multi-modal Fusion Self-Attention Mechanism Convolution Neural Network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1杨佳信,胡晓,向俊将.基于堆叠边缘感知模块的显著性目标检测[J].模式识别与人工智能,2020,33(10):906-916. 被引量：1
2王延召,彭国华,延伟东.基于流形排序和联合连通性先验的显著性目标检测[J].模式识别与人工智能,2019,32(1):82-93. 被引量：4
3鲍蕾,陆建江,李阳,史艳伟.基于全局和局部信息融合的图像显著性检测[J].模式识别与人工智能,2015,28(3):275-281. 被引量：3
4Tao Zhou,Deng-Ping Fan,Ming-Ming Cheng,Jianbing Shen,Ling Shao.RGB-D salient object detection:A survey[J].Computational Visual Media,2021,7(1):37-69. 被引量：17

二级参考文献4

1LI ZhiQiang,FANG Tao,HUO Hong.A saliency model based on wavelet transform and visual attention[J].Science China(Information Sciences),2010,53(4):738-751. 被引量：2
2鲍蕾,陆建江,李阳,史艳伟.基于全局和局部信息融合的图像显著性检测[J].模式识别与人工智能,2015,28(3):275-281. 被引量：3
3Ali Borji,Ming-Ming Cheng,Qibin Hou,Huaizu Jiang,Jia Li.Salient object detection: A survey[J].Computational Visual Media,2019,5(2):117-150. 被引量：49
4王延召,彭国华,延伟东.基于流形排序和联合连通性先验的显著性目标检测[J].模式识别与人工智能,2019,32(1):82-93. 被引量：4

共引文献20

1许明文,张重阳.基于显著性特征的交通信号灯检测和识别[J].计算机与数字工程,2017,45(7):1397-1401. 被引量：7
2杨佳信,胡晓,向俊将.基于堆叠边缘感知模块的显著性目标检测[J].模式识别与人工智能,2020,33(10):906-916. 被引量：1
3李欣健,张大胜,孙利雷,徐勇.复杂场景下基于CNN的轻量火焰检测方法[J].模式识别与人工智能,2021,34(5):415-422. 被引量：12
4文雅宏,巨琛.基于背景评估的贝叶斯模型显著性检测[J].计算机与现代化,2021(10):63-68.
5Shi-Min Hu.Message from the Editor-in-Chief[J].Computational Visual Media,2022,8(1):1-1.
6王立鹏,张佳鹏,张智,孟浩,肖绍桐,苏丽.基于SLAM定位的多位姿点云拼接与分割方法研究[J].实验技术与管理,2022,39(4):39-44. 被引量：4
7Wujie ZHOU,Chang LIU,Jingsheng LEI,Lu YU.RLLNet:a lightweight remaking learning network for saliency redetection on RGB-D images[J].Science China(Information Sciences),2022,65(6):75-76. 被引量：1
8方新林,方艳红,王迪.基于多模态特征融合的脑瘤图像分割方法[J].中国医学物理学杂志,2022,39(6):682-689. 被引量：6
9刘志宇.基于深度图去噪的RGBD显著性目标检测的研究[J].信息与电脑,2022,34(7):130-134.
10罗卿莉,崔峰志,魏钜杰,明磊.SAR影像变化检测的前景特征流形排序法[J].测绘学报,2022,51(11):2365-2378. 被引量：1

1汤小月,周康,王凯.一种空间上下文感知的提及目标推荐方法[J].软件学报,2020,31(4):1189-1211. 被引量：5
2郭迎春,李雅楠,于洋.基于级联优化策略的视频显著性检测[J].河北工业大学学报,2022,51(3):10-18.
3金辉,赵延杰,光昊.智能汽车换道轨迹的燃油经济性研究[J].北京理工大学学报,2022,42(7):675-681.
4张德华,李俊豪,张静凯,肖启阳.高效通道注意力和特征融合的协同显著性检测算法[J].哈尔滨工业大学学报,2022,54(11):103-111.
5张红晨,牛学利,郭庆方.县域高新技术企业数量增长与因素识别[J].江汉论坛,2022(7):32-39.
6尹恒,游为,范东明,方伟浩,万祥禹,宋梦芝.反演地表质量变化的附有方差约束的径向点质量方法[J].地球物理学报,2022,65(7):2464-2483. 被引量：1

模式识别与人工智能

2022年第6期

浏览历史

内容加载中请稍等...

空间约束下自相互注意力的RGB-D显著目标检测

参考文献4

二级参考文献4

共引文献20

相关作者

相关机构

相关主题

浏览历史