RGB-D双模态特征融合语义分割被引量：2

Dual-Modal Feature Fusion Semantic Segmentation of RGB-D

下载PDF

导出

摘要针对复杂室内场景中,现有RGB图像语义分割网络易受颜色、光照等因素影响以及RGB-D图像语义分割网络难以有效融合双模态特征等问题,提出一种基于注意力机制的RGB-D双模态特征融合语义分割网络AMBFNet(attention mechanism bimodal fusion network)。该网络采用编-解码器结构,首先搭建双模态特征融合结构(AMBF)来合理分配编码支路各阶段特征的位置与通道信息,然后设计双注意感知的上下文(DA-context)模块以合并上下文信息,最后通过解码器将多尺度特征图进行跨层融合,以减少预测结果中类间误识别和小尺度目标丢失问题。在SUN RGB-DNYU和NYU Depth v2(NYUDV2)两个公开数据集上的测试结果表明,相较于残差编解码(RedNet)、注意力互补网络(ACNet)、高效场景分析网络(ESANet)等目前较先进的RGB-D语义分割网络,在同等硬件条件下,该网络具有更好的分割性能,平均交并比(MIoU)分别达到了47.9%和50.0%。 The existing RGB image semantic segmentation network for complex indoor scenes is susceptible to factors such as color and lighting,while it is also challenging to integrate dual-modal features effectively.Regarding the issue indicated above,this paper proposes an attention mechanism bimodal fusion network(AMBFNet)that adopts an encoderdecoder structure.In the first phase,building the bimodal fusion network structure(AMBF)is carried out to reasonably allocate the location and channel information of the features at each stage of the encoding branch.And then,designing the DA-context module is implemented to merge the context information.Finally,the multi-scale feature maps are cross-layer fused through the decoder to reduce the problem of misrecognition between classes and the loss of small-scale targets in the prediction results.The test results on the two public datasets of SUN RGB-DNYU and Depth v2(NYUDV2)show the consequence that compared with the more advanced RGB-D semantic segmentation network such as the RedNet,ACNet and ESANet,under the same hardware conditions,the network proposed in this paper has better segmentation performance.At the same time,the MIoU reaches 47.9%and 50.0%,respectively.

作者罗盆琳方艳红李鑫李雪 LUO Penlin;FANG Yanhong;LI Xin;LI Xue(School of Information Engineering,Southwest University of Science and Technology,Mianyang,Sichuan 621010,China;Robot Technology Used for Special Environment Key Laboratory of Sichuan Province,Southwest University of Science and Technology,Mianyang,Sichuan 621010,China)

机构地区西南科技大学信息工程学院西南科技大学特殊环境机器人技术四川省重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2023年第7期222-231,共10页 Computer Engineering and Applications

基金国家重点实验室开放基金(SKLA20200203)。

关键词注意力机制双模态特征融合双重注意感知上下文 RGB-D语义分割 attention mechanism dual modal feature fusion dual attention perception context RGB-D semantic segmentation

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李鑫,张红英,刘汉玉.融合多尺度和边界优化的图像语义分割网络[J].计算机工程与应用,2022,58(21):250-257. 被引量：3

二级参考文献1

1袁铭阳,黄宏博,周长胜.全监督学习的图像语义分割方法研究进展[J].计算机工程与应用,2021,57(4):43-54. 被引量：10

共引文献2

1徐武,陈盈君,汤弘毅,杨昊东,秦浩然.局部特征映射与融合网络的人脸识别优化算法[J].河南科技大学学报（自然科学版）,2023,44(2):59-64. 被引量：6
2陈攀,王绍东.基于轻量级卷积神经网络的多视觉特征图像分割研究[J].现代电子技术,2024,47(15):60-64.

同被引文献14

1王发麟,廖文和,郭宇,王晓飞,高扬.线缆虚拟装配关键技术研究现状及其发展[J].中国机械工程,2016,27(6):839-851. 被引量：33
2汪成龙,陈国壮,马秋立,方浩群,何宣,陈泽涛,孙培宜.基于OpenCV的电线颜色识别系统软件[J].电子测量技术,2018,41(16):91-97. 被引量：10
3梁博,于蕾,李爽.基于卷积神经网络的多任务图像语义分割[J].无线电工程,2019,49(7):575-580. 被引量：11
4李炜,韩永进.飞机现役线缆状态及寿命评估研究[J].电线电缆,2020(6):5-7. 被引量：5
5段立娟,孙启超,乔元华,陈军成,崔国勤.基于注意力感知和语义感知的RGB-D室内图像语义分割算法[J].计算机学报,2021,44(2):275-291. 被引量：16
6贺照蒙,孔广黔,吴云.一种改进的室内场景语义分割网络[J].计算机工程与应用,2021,57(16):197-202. 被引量：2
7张静怡.基于非对称融合和关联上下文的RGBD语义分割算法研究[J].现代计算机,2022,28(1):96-100. 被引量：2
8伏娜娜,许钢,陈玲,胡志锋,郑书展.基于通道特征融合的RGB-D图像语义分割方法[J].四川轻化工大学学报（自然科学版）,2022,35(4):42-48. 被引量：1
9赵经阳,余昌黔,桑农.RGB-D语义分割:深度信息的选择使用[J].中国图象图形学报,2022,27(8):2473-2486. 被引量：2
10罗权,易兵,王杰.带工艺约束柔性体模拟的轨道车辆布线方法[J].铁道科学与工程学报,2022,19(10):3070-3078. 被引量：2

引证文献2

1曹国群,刘桂雄.基于双模态融合的线缆图像语义分割方法研究[J].电子测量技术,2023,46(10):184-188. 被引量：2
2王柳,梁铭炬.融合深度信息的室内场景分割算法[J].计算机系统应用,2024,33(3):111-117.

二级引证文献2

1曹国群,刘桂雄,周善龙.线缆掩膜中心线代数化重建弯曲半径计算方法[J].激光杂志,2024,45(1):59-64.
2杨淼,夏骏,李金亮,王邹俊,李哲.用于配网线缆识别和定位的多传感器引导系统[J].计算机技术与发展,2024,34(9):202-208.

1吴俊贤,何元烈.基于通道注意力的自监督深度估计方法[J].广东工业大学学报,2023,40(2):22-29. 被引量：2
2张卫良,陈秀宏.跨层融合和感受野扩增的SSD目标检测算法[J].计算机科学,2023,50(3):231-237. 被引量：2
3潘浩,郑华,陈清俊,廖晓琦,王泓楷.基于尺度感知的多路径特征融合目标检测[J].计算机系统应用,2022,31(12):251-258.
4厍向阳,马亦骏.改进的遥感图像语义分割算法[J].计算机工程与科学,2023,45(3):504-511. 被引量：2
5茆震,任玉蒙,陈晓艳,任克营,赵昱炜.一种改进YOLOv5s的多尺度目标检测算法[J].传感技术学报,2023,36(2):267-274. 被引量：5
6邱源.我国茶叶加工中的质量安全问题分析[J].福建茶叶,2023,45(4):56-58. 被引量：4
7马浩然,顾先旭,张楠杰,吴东升.改进YOLOv5算法在口罩配戴检测系统中的应用与实现[J].科技创新导报,2022,19(27):103-107. 被引量：1
8杨轲,董兵,吴悦,郝宽公,耿文博.基于改进YOLOv3的机场盲区遥感图像目标检测方法[J].科技和产业,2023,23(4):213-218. 被引量：2
9王彬.“情指勤舆”一体化运行机制分析——以构建与应用为视角[J].河南警察学院学报,2022,31(6):5-12. 被引量：1
10宋怀波,李嵘,王云飞,焦义涛,华志新.基于ECA-YOLO v5s网络的重度遮挡肉牛目标识别方法[J].农业机械学报,2023,54(3):274-281. 被引量：7

计算机工程与应用

2023年第7期

浏览历史

内容加载中请稍等...

RGB-D双模态特征融合语义分割被引量：2

参考文献1

二级参考文献1

共引文献2

同被引文献14

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

RGB-D双模态特征融合语义分割 被引量：2

参考文献1

二级参考文献1

共引文献2

同被引文献14

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

RGB-D双模态特征融合语义分割被引量：2