基于空间结构化推理深度融合网络的RGB-D场景解析被引量：4

RGB-D Scene Parsing Based on Spatial Structured Inference Deep Fusion Networks

下载PDF

导出

摘要为了弥补RGB-D场景解析中卷积神经网络空间结构化学习能力的不足,本文基于深度学习提出空间结构化推理深度融合网络,内嵌的结构化推理层有机地结合条件随机场和空间结构化推理模型,该层能够较为全面而准确地学习物体所处三维空间的物体分布以及物体间的三维空间位置关系.在此基础上,网络的特征融合层巧妙地利用深度置信网络和改进的条件随机场,该层可以根据融合生成的物体综合语义信息和物体间语义相关性信息完成深度结构化学习.实验结果表明,在标准RGB-D数据集NYUDv2和SUNRGBD上,空间结构化推理深度融合网络分别实现最优的平均准确率53.8%和54.6%,从而有助于实现机器人任务规划、车辆自动驾驶等智能计算机视觉任务. In order to make up the drawbacks that convolutional neural networks lack the ability of spatial structured learning in RGB-D scene parsing,we propose spatial structured inference deep fusion networks （SSIDFNs） on the basis of deep learning,the embedded structural inference layer organically combines conditional random fields （CRFs） and spatial structured inference model,which is able to learn the three-dimensional spatial distributions of objects and three-dimensional spatial relationships among objects in a more comprehensive and accurate way.Furthermore,the feature fusion layer takes both advantages of deep belief networks and improved CRFs,which is able to achieve deep structured learning according to the comprehensive semantic information of objects and semantic correlation information among objects.The experimental results demonstrate that the proposed SSIDFNs achieve the best mean accuracy 53.8% and 54.6% on the standard RGB-D datasets NYUDv2 and SUNRGBD respectively,which will be helpful to implement intelligent computer vision tasks,such as robot task planning and self-driving cars.

作者王泽宇吴艳霞张国印布树辉 WANG Ze-yu;WU Yan-xia;ZHANG Guo-yin;BU Shu-hui(College of Computer Science and Technology,Harbin Engineering University,Harbin,Heilongjiang 150001,China;School of Aeronautics,Northwestern Polytechnical University,Xi＇an,Shaanxi 710072,China)

机构地区哈尔滨工程大学计算机科学与技术学院西北工业大学航空学院

出处《电子学报》 EI CAS CSCD 北大核心 2018年第5期1253-1258,共6页 Acta Electronica Sinica

基金国家重点研发计划(No.2016YFB1000400) 哈尔滨市杰出青年人才基金(No.2017RAYXJ016) 中央高校自由探索基金(No.HEUCF170605) 国家自然科学基金(No.61573284)

关键词 RGBD场景解析深度学习卷积神经网络条件随机场空间结构化推理模型深度置信网络计算机视觉机器人任务规划车辆自动驾驶 RGB-D scene parsing deep learning convolutional neural networks conditional random fields spatial structured inference model deep belief networks computer vision robot task planning self-driving cars

分类号 TP391.413 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1王泽宇,吴艳霞,张国印,布树辉.面向RGB-D场景解析的三维空间结构化编码深度网络[J].计算机应用,2017,37(12):3458-3466. 被引量：1

二级参考文献3

1李艳丽,周忠,吴威.一种双层条件随机场的场景解析方法[J].计算机学报,2013,36(9):1898-1907. 被引量：7
2王春波,董红斌,印桂生,刘文杰.基于Hadoop的超像素分割算法[J].计算机应用,2016,36(11):2985-2992. 被引量：3
3徐超,闫胜业.改进的卷积神经网络行人检测方法[J].计算机应用,2017,37(6):1708-1715. 被引量：14

同被引文献15

1高洁,卓汉逵,刘亚松,李磊.基于众包模式的开放式规划问题研究[J].电子学报,2016,44(8):2025-2032. 被引量：2
2徐谦谦.汽车自动驾驶英文信息特征提取优化仿真[J].计算机仿真,2016,33(11):175-178. 被引量：3
3柯圣财,赵永威,李弼程,彭天强.基于卷积神经网络和监督核哈希的图像检索方法[J].电子学报,2017,45(1):157-163. 被引量：36
4戴朝典.5G汽车协会与欧洲汽车电信联盟在网联和自动驾驶上进行合作[J].汽车电器,2017,0(4):28-28. 被引量：1
5李倩玉,蒋建国,齐美彬.基于改进深层网络的人脸识别算法[J].电子学报,2017,45(3):619-625. 被引量：47
6张友梅,常发亮,刘洪彬.基于3D人体骨架的动作识别[J].电子学报,2017,45(4):906-911. 被引量：6
7夏伟,李慧云.基于深度强化学习的自动驾驶策略学习方法[J].集成技术,2017,6(3):29-40. 被引量：19
8朱虎明,罗政,缑水平,田小林,焦李成,张小华.Android平台上基于卷积神经网络的手写数字识别实验[J].计算机教育,2017(11):159-162. 被引量：1
9张胜平.基于改进PID算法的列车自动驾驶控制方法研究[J].铁道通信信号,2017,53(10):27-30. 被引量：8
10李盼,赵文涛,刘强,崔建京,殷建平.机器学习安全性问题及其防御技术研究综述[J].计算机科学与探索,2018,12(2):171-184. 被引量：32

引证文献4

1张嘉丰.5G神经网络在自动驾驶技术中的应用[J].济南职业学院学报,2018(6):122-124. 被引量：1
2郑兴华,孙喜庆,吕嘉欣,鲜征征,李磊.基于深度学习和智能规划的行为识别[J].电子学报,2019,47(8):1661-1668. 被引量：12
3葛疏雨,高子淋,张冰冰,李培华.基于核化双线性卷积网络的细粒度图像分类[J].电子学报,2019,47(10):2134-2141. 被引量：17
4王波,黄冕,刘利军,黄青松,单文琦.基于多层聚焦Inception-V3卷积网络的细粒度图像分类[J].电子学报,2022,50(1):72-78. 被引量：4

二级引证文献34

1王燕玲,王超,赵刚.基于DWI+FLAIR图像的急性缺血性卒中患者发病时间预测[J].生命科学仪器,2022,20(4):65-70. 被引量：1
2孙淑斌.面向无人驾驶产业的5G解决方案分析[J].数字技术与应用,2019,37(10):220-221. 被引量：2
3王传旭,胡小悦,孟唯佳,闫春娟.基于多流架构与长短时记忆网络的组群行为识别方法研究[J].电子学报,2020,48(4):800-807. 被引量：6
4丰艳,张甜甜,王传旭.基于伪3D残差网络与交互关系建模的群组行为识别方法[J].电子学报,2020,48(7):1269-1275. 被引量：12
5钟秋波,郑彩明,朴松昊.时空域融合的骨架动作识别与交互研究[J].智能系统学报,2020,15(3):601-608. 被引量：6
6WU Wei,JING Xiaoyuan,DU Wencai.The Kernel Dynamics of Convolutional Neural Networks in Manifolds[J].Chinese Journal of Electronics,2020,29(6):1185-1192.
7李丽,王大勇.智能规划分解的发展与应用研究[J].计算机科学与探索,2020,14(12):1995-2003.
8李丽,王大勇,张杨,索菲.基于CLIPS语言的智能规划表示方法研究[J].辽宁大学学报（自然科学版）,2020,47(4):325-330.
9职晓晓.基于深度学习的大规模数据库重复记录删除研究[J].现代电子技术,2021,44(5):114-116. 被引量：2
10田佳鹭,邓立国.结合嵌入模块的细粒度图像分类方法[J].现代计算机,2021,27(11):106-110.

1陈惠圻.培养小学生数学逻辑推理能力“三策略”[J].西部素质教育,2018,4(7):87-87. 被引量：6
2王泽宇,吴艳霞,张国印,布树辉.面向RGB-D场景解析的三维空间结构化编码深度网络[J].计算机应用,2017,37(12):3458-3466. 被引量：1
3张国印,王泽宇,吴艳霞,布树辉.面向场景解析的空间结构化编码深度网络[J].哈尔滨工程大学学报,2017,38(12):1928-1936. 被引量：2
4范志文.构造一元二次方程解题[J].中学生数学（初中版）,2018,0(6):27-27.
5袁苏哲,张祥.基于模糊控制的车辆自动驾驶前车跟随控制方法研究[J].装备制造技术,2017(11):168-169. 被引量：3
6李海威,赵霞,刘循,张琼燕.轨交车辆自动驾驶控制关键技术设计[J].传感器与微系统,2018,37(3):72-74. 被引量：5
7代具亭,汤心溢,刘鹏.基于深度学习的语义分割网络[J].红外,2018,39(4):33-38. 被引量：3
8英国电信宣布“融合网络愿景”计划[J].世界广播电视,2018,32(5):69-69.
9先机已得后劲易得由获发FDD牌照谈中国移动的5G坦途与坎坷[J].新潮电子,2018,0(6):82-86.
10何银华.借思维导图,助推数学微课教学[J].数学教学通讯,2018(10):36-37.

电子学报

2018年第5期

浏览历史

内容加载中请稍等...

基于空间结构化推理深度融合网络的RGB-D场景解析被引量：4

参考文献1

二级参考文献3

同被引文献15

引证文献4

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于空间结构化推理深度融合网络的RGB-D场景解析 被引量：4

参考文献1

二级参考文献3

同被引文献15

引证文献4

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于空间结构化推理深度融合网络的RGB-D场景解析被引量：4