跨模态融合和边界可变形卷积引导的RGB-D显著性目标检测

RGB-D Salient Object Detection Based on Cross-Modal Fusion and Boundary Deformable Convolution Guidance

下载PDF

导出

摘要 RGB-Depth(RGB-D)显著性目标检测是一项有意义且具有挑战性的任务,基于现有卷积神经网络检测方法在简单场景中获得了良好的检测性能,但不能有效应对背景信息混乱,深度图质量低和目标轮廓复杂的情况.为应对上述问题,本文提出了一种跨模态融合和边界可变形卷积引导的RGB-D显著性目标检测方法.首先,本文以Swin-Transformer为特征提取器,分别对RGB模态与深度图模态进行特征提取,并通过跨模态注意力增强特征模块对两种模态特征进行融合以挖掘显著物的共性与互补特征.接着将提出的相邻多尺度特征增强模块嵌入编码器深层,以获得丰富的全局上下文特征信息,更精准地定位显著物的位置.然后通过构建一个边界特征提取解码器(U-Net架构)生成显著物的边界线索图,并重复采用跨模态融合特征确保生成显著物边界的完整性.最后,本文设计了一个边界可变形卷积引导模块,使用边界线索图与可变形卷积引导跨模态融合特征进行解码以得到更加准确的显著图.通过在6个公开基准数据集上与25种主流方法相比较,本文所提模型在多个指标上均有较明显的提升,从而证明了本文方法的有效性. RGB-Depth(RGB-D)salient object detection is a meaningful and challenging task.The current method based on convolutional neural networks has achieved good detection performance in simple scenes,but cannot effectively handle scenes with cluttered background information,low-quality depth maps,and complex object contours.In order to solve the above problems,an RGB-D SOD model based on cross-modal fusion and boundary deformable convolution guidance is proposed in this paper.Firstly,the Swin Transformer is used as an extractor to extract features from the RGB modality and depth modality,respectively,which fuse the two modalities by using a cross-modal attention enhancement feature(CMAEF)module,to explore the common and complementary features of salient objects.Then,the proposed adjacent multi-scale feature enhancement(AMFE)module is embedded deep-level into the encoder to obtain rich global contextual feature information,which can locate the position of salient objects more accurately.Next,the boundary cue maps of salient objects are generated by boundary feature extraction decoder(U-Net architecture)constructed and repeated using crossmodal fusion features to ensure the integrity of the generated salient object boundaries.Finally,we designed a boundary deformable convolution guidance(BDCG)module that uses boundary cue maps with deformable convolution to guide the decoding of cross-modal fusion features to obtain more accurate saliency maps.Comprehensive experiments on six popular benchmark datasets compared with 25 mainstream methods demonstrate that the proposed model shows significant improvement in metrics,which proves the effectiveness of the proposed model.

作者孟令兵袁梦雅时雪涵张乐吴锦华程菲 MENG Ling-bing;YUAN Meng-ya;SHI Xue-han;ZHANG Le;WU Jin-hua;CHENG Fei(School of Computer and Software Engineering,Anhui Institute of Information Technology,Wuhu,Anhui 241000,China;School of Electrical and Electronic Engineering,Anhui Institute of Information Technology,Wuhu,Anhui 241000,China;School of Management,Hangzhou Dianzi University,Hangzhou,Zhejiang 310000,China)

机构地区安徽信息工程学院计算机与软件工程学院安徽信息工程学院电气与电子工程学院杭州电子科技大学管理学院

出处《电子学报》 EI CAS CSCD 北大核心 2023年第11期3155-3166,共12页 Acta Electronica Sinica

基金安徽省自然科学基金(No.2008085MF201) 安徽省教育厅自然科学重点项目(No.2022AH051894,No.2022AH051887) 安徽省高校优秀青年人才支持计划(No.gxyq2022147)。

关键词显著性目标检测跨模态融合边界特征可变形卷积显著图 salient object detection cross-modal fusion boundary features deformable convolution saliency map

分类号 TP751 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1梁大川,李静,刘赛,李东民.基于图和稀疏主成分分析的多目标显著性检测[J].计算机研究与发展,2018,55(5):1078-1089. 被引量：3
2张荣国,贾玉闪,胡静,刘小君,李晓明.超像素内容感知先验的多尺度贝叶斯显著性检测方法[J].电子学报,2020,48(8):1509-1515. 被引量：6

二级参考文献6

1曲延云,郑南宁,李翠华,袁泽剑,叶聪颖.基于支持向量机的显著性建筑物检测[J].计算机研究与发展,2007,44(1):141-147. 被引量：11
2冯松鹤,郎丛妍,须德.一种融合图学习与区域显著性分析的图像检索算法[J].电子学报,2011,39(10):2288-2294. 被引量：17
3郭迎春,袁浩杰,吴鹏.基于Local特征和Regional特征的图像显著性检测[J].自动化学报,2013,39(8):1214-1224. 被引量：29
4钱晓亮,郭雷,韩军伟,程塨,姚西文.一种基于加权稀疏编码的频域视觉显著性检测算法[J].电子学报,2013,41(6):1159-1165. 被引量：8
5姜维,卢朝阳,李静,刘晓佩,姚超.基于视觉显著性与文字置信图的场景文字的背景抑制方法[J].电子学报,2015,43(1):62-68. 被引量：7
6张荣国,刘小君,董磊,李富萍,刘焜.物体轮廓形状超像素图割快速提取方法[J].模式识别与人工智能,2015,28(4):344-353. 被引量：13

共引文献7

1许佳,蒋鹏.视觉和物体显著性检测方法[J].山东大学学报（理学版）,2019,54(3):28-37. 被引量：3
2李晓峰,李东,王妍玮.基于全卷积神经网络的医疗图像弱边缘检测算法[J].哈尔滨理工大学学报,2021,26(3):65-73. 被引量：4
3郑维佳,张荣国,胡静,赵建,刘小君.结构化Krylov-SVD分解的显著性目标检测算法[J].计算机技术与发展,2021,31(8):45-50. 被引量：1
4张荣国,贾玉闪,胡静,刘小君,李晓明.超像素梯度流与元胞机融合的视频显著图检测[J].太原科技大学学报,2021,42(5):341-347.
5马钰.基于深度学习的沉浸式投影系统图像反射补偿问题研究[J].自动化与仪器仪表,2022(12):20-24.
6张彧,汪虹余,季思想,穆楠.基于全局感知和局部细化的夜间显著目标检测[J].计算机工程与设计,2023,44(2):494-503. 被引量：1
7文雅宏.基于背景信息优化的显著性目标检测[J].计算机科学与应用,2021,11(3):534-542.

1杨国威,陈绮帆,刘新月,王校阳.基于三维点云处理的髋臼锉锉齿尺寸分析[J].计算机应用,2024,44(1):285-291.
2鲁清源,马俊鹏,王顺亮,王鹏,刘小林,刘天琪,吴子豪,王若谷.新能源并网逆变器的阻尼互济控制策略[J].电网技术,2024,48(1):238-246.
3王晓兵,张雄伟,曹铁勇,郑云飞,王勇.基于尺度注意知识迁移的自蒸馏目标分割方法[J].计算机应用,2024,44(1):129-137.
4刘广林,孙同文,闫百泉,胡明,张忠义,惠潇.基于测井资料的古地貌-不整合识别及控藏特征研究——以鄂尔多斯盆地三边地区中生界为例[J].地球物理学进展,2023,38(6):2502-2513.

电子学报

2023年第11期

浏览历史

内容加载中请稍等...

跨模态融合和边界可变形卷积引导的RGB-D显著性目标检测

参考文献2

二级参考文献6

共引文献7

相关作者

相关机构

相关主题

浏览历史