基于多尺度特征融合的单目图像深度估计被引量：15

Monocular depth estimation with multi-scale feature fusion

导出

摘要为解决从单目图像中很难恢复出准确、有效深度信息的问题,提出一种多尺度特征融合的单目图像深度估计算法.算法采用端对端训练的卷积神经网络(CNN)结构,引入从图像编码器到解码器的跳层连接来实现在不同尺度上特征的提取和表达,设计了一种多尺度的损失函数来提升卷积神经网络的训练效果.通过在NYU Depth V2室内场景深度数据集和KITTI室外场景深度数据集上的训练、验证和测试,实验结果表明:提出的多尺度特征融合方法得到的深度图边缘清晰、层次分明,且在室内场景和室外场景中均能适用,具有较强的泛化性,可以适应多种实际场景的需求. To solve the problem that it is difficult to recover accurate and effective depth information from monocular images,a monocular image depth estimation algorithm based on multi-scale feature fusion was proposed.End-to-end trained convolutional neural network(CNN)structure was applied to the algorithm,and the skip layer connection from image encoder to decoder was introduced to realize feature extraction and expression on different scales.A multi-scale loss function was designed to improve the training effect of the convolutional neural network.Through training,verification and testing on the NYU Depth V2 indoor scene depth dataset and KITTI outdoor scene depth dataset,experimental results show that the proposed multi-scale feature fusion method can obtain clear,sharp-edged edges in the depth map,and is applicable to both indoor and outdoor scenes with strong generalization,which can adapt to the demands of a variety of actual scenes.

作者王泉德张松涛 WANG Quande;ZHANG Songtao(School of Electrical Information,Wuhan University,Wuhan 430072,China)

机构地区武汉大学电子信息学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2020年第5期7-12,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金青年基金资助项目(61701351)。

关键词计算机视觉深度学习卷积神经网络单目图像深度估计多尺度特征融合 computer vision deep learning convolutional neural network monocular depth estimation multi-scale feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1朱清波,王宏远.使用图像分割的遮挡恢复立体匹配算法[J].华中科技大学学报（自然科学版）,2010,38(1):81-84. 被引量：5
2解则晓,周作琪.基于运动恢复结构的空间点定位方法[J].激光与光电子学进展,2018,55(8):364-371. 被引量：5
3秦磊,谢邦昌.L_1和L_2分位数趋势滤波及其集成方法[J].数理统计与管理,2015,34(3):442-451. 被引量：2

二级参考文献37

1Felzenszwalb P F, Huttenlocher D P. Efficient belief propaggation for early vision[J]. Int'l J Computer Vision, 2006, 70(1): 41-54.
2Wang Z F, Zheng Z G. A region based stereo matching algorithm using cooperative optimization[C]// Proc IEEE CS Conf Comoputer Vision and Pattern Recognition. Anchorage: IEEE, 2008: 1-8.
3Tappen M F, Freeman W T. Comparison of graph cuts with belief propagation for stereo[C]//Proc IEEE Int' l Conf Computer Vision. Nice: IEEE, 2003 : 900-906.
4Kolmogorov V, Zabih R. Graph cut algorithms for binocular stereo with occlusions[M]// Mathematical Models in Computer Vision: The Handbook. New York: Springer-Verlag, 2005.
5Birchfield S, Tomasi C. A pixel dissimilarity measure that is insensitive to image sampling[J]. IEEE Trans Pattern Analysis and Machine Intelligence, 1998, 20(4): 401-406.
6国际立体匹配算法研究社区.所有提交算法的最新性能评估报告[EB/OL].[2009-03-21].http:∥vision.middlebury.edu/stereo/eval,200.
7Zhu Qingbo, Wang Hongyuan, Tian Wen. A practical new approach to 3D scene reeovery[J]. Signal Processing, 2009, 89(11): 2 152-2 158.
8Scharstein D, Szeliski R. A taxonomy and evaluation of dense two-frame stereo correspondence algorithms [J]. Int'l J Computer Vision, 2002, 47(1-3) : 7-42.
9Yoon K J, Kwen I S. Adaptive support-weight approach for correspondence search[J]. IEEE Trans Pattern Analysis and Machine Intelligence, 2006, 28 (4) : 650-656.
10Gerrits M, Bekaert P. Local stereo matching with segmentation-based outlier rejection[C]//Proe IEEE 3rd Canadian Conf Computer and Robot Vision. Quebec: IEEE, 2006: 1-7.

共引文献9

1张永平,楼斌,周文晖,吴卿.融合自适应权重和置信传播的立体匹配算法[J].杭州电子科技大学学报（自然科学版）,2012,32(2):10-13. 被引量：1
2边继龙,门朝光,李香,李金凤.基于多尺度的小基高比立体匹配方法[J].华中科技大学学报（自然科学版）,2012,40(7):62-66.
3符立梅,彭国华.垂直交叉双向搜索策略的自适应窗口匹配算法[J].中国图象图形学报,2015,20(1):104-112.
4符立梅,彭国华.基于自适应极线距离变换的立体匹配[J].计算机辅助设计与图形学学报,2015,27(3):394-399. 被引量：1
5李耀祖,王细洋.基于H-P滤波与VMD的行星齿轮箱故障诊断[J].失效分析与预防,2018,13(1):29-33. 被引量：1
6解则晓,王晓东,宫韩磊.基于双目视觉的薄壁零件圆孔轮廓测量[J].中国激光,2019,46(12):171-178. 被引量：25
7刘强,秦书臻,俞波,刘少山.一种用于SLAM的嵌入式光束平差法加速器设计[J].天津大学学报（自然科学与工程技术版）,2020,53(12):1281-1287. 被引量：3
8方维,杨奎.基于逆深度自适应加权的多视图三角化方法[J].中国激光,2020,47(12):191-198. 被引量：1
9邸臻炜,黄筱佟,宫海晓.激光自混合干涉的三维空间定位方法[J].激光杂志,2021,42(7):147-151.

同被引文献78

1汪辉,高尚兵,周君,周建,张莉雯.基于YOLOv3的多车道车流量统计及车辆跟踪方法[J].国外电子测量技术,2020,39(2):42-46. 被引量：15
2王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：74
3方驰华,杨剑.数字智能化技术在中央型肝癌中的应用腹腔镜肝切除导航系统指导下左半肝切除术[J].肝癌电子杂志,2020(1):65-66. 被引量：3
4Kai LUO Dong-xiao LI Ya-mei FENG Ming ZHANG.Depth-aided inpainting for disocclusion restoration of multi-view images using depth-image-based rendering[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2009,10(12):1738-1749. 被引量：7
5朱江,王耀南,余洪山,王文格,许海霞.未知环境下移动机器人自主感知斜坡地形方法[J].仪器仪表学报,2010,31(8):1916-1920. 被引量：7
6齐咏生,王普,高学金,陈修哲.一种新的多阶段间歇过程在线监控策略[J].仪器仪表学报,2011,32(6):1290-1297. 被引量：25
7廖广兰,张学坤,于龙,史铁林.基于空气耦合超声激励的倒装芯片缺陷检测[J].华中科技大学学报（自然科学版）,2011,39(6):87-90. 被引量：4
8徐忠,刘洪英,皮喜田,余巧,练阳,赵亚雄.医用超细内窥镜系统研究[J].中国生物医学工程学报,2014,31(1):107-111. 被引量：10
9何磊,苏松志,李绍滋.单摄像头下基于样本学习的人体深度估计[J].智能系统学报,2014,9(2):161-167. 被引量：1
10王田苗,张晓会,张学斌,王君臣.腹腔镜增强现实导航的研究进展综述[J].机器人,2019,41(1):124-136. 被引量：11

引证文献15

1吕秀丽,陈帅男.基于卷积神经网络的丹顶鹤定位识别[J].电子测量技术,2020,43(20):104-108. 被引量：4
2辛菁,杜柯楠,王媛媛,刘丁.基于迁移学习的移动机器人单帧图像坡度检测算法[J].智能系统学报,2021,16(1):81-91. 被引量：1
3林金朝,张冲冲,庞宇,王慧倩,陈俊刚.单目内窥镜图像三维显示方法研究[J].生命科学仪器,2021,19(3):55-60.
4王亚群,戴华林,王丽,李国燕.基于密集卷积网络的单目图像深度估计方法[J].计算机工程,2021,47(11):262-267. 被引量：2
5曹政涛,黄文丰,宁志刚,廖祥云,熊雪颖,王琼.基于半稠密COLMAP自监督单目内窥镜深度估计[J].南华大学学报（自然科学版）,2021,35(5):52-62. 被引量：1
6孔慧芳,房亮.基于多尺度特征融合的快速单目图像深度估计[J].合肥工业大学学报（自然科学版）,2022,45(3):332-335. 被引量：2
7王泉德,王奇坤,程凯,刘子航.强化边缘的单目图像深度估计[J].华中科技大学学报（自然科学版）,2022,50(3):36-42. 被引量：3
8陈麒,张杰.基于多光谱图像配准融合的机器人巡检平台[J].计算技术与自动化,2022,41(2):118-124. 被引量：1
9李可,吴忠卿,吉勇,宿磊.改进U-Net芯片X线图像焊缝气泡缺陷检测方法[J].华中科技大学学报（自然科学版）,2022,50(6):104-110. 被引量：4
10方伟立,丁烈云.工人不安全行为智能识别与矫正研究[J].华中科技大学学报（自然科学版）,2022,50(8):131-135. 被引量：6

二级引证文献24

1朱劲松,高鸿壮,李伟,高志刚.基于图像融合的消防机器人火焰识别研究[J].中国安全生产科学技术,2023,19(S02):140-146.
2钱万明,朱红萍,朱泓知,李毅,郭利文.基于自适应加权特征融合的PCB裸板缺陷检测研究[J].电子测量与仪器学报,2022,36(10):92-99. 被引量：6
3牟海维,段朝辉,韩建,曹志民,全星慧.基于多视小波变换融合的医学CT图像增强方法[J].电子测量技术,2021,44(9):122-127. 被引量：8
4高文波,孔慧华,连祥媛.基于多尺度生成对抗网络的低剂量CT去噪算法[J].国外电子测量技术,2021,40(8):1-6. 被引量：5
5温静,杨洁.基于场景对象注意与深度图融合的深度估计[J].计算机工程,2023,49(2):222-230. 被引量：1
6白琳,刘林军,李轩昂,吴沙,刘汝庆.基于自监督学习的单目图像深度估计算法[J].吉林大学学报（工学版）,2023,53(4):1139-1145.
7李恩华,闫梦若,张佃君.基于改进GhostNet模型的快速单目图像深度估计[J].信息记录材料,2023,24(6):137-140.
8李熙莹,叶芝桧,韦世奎,陈泽,陈小彤,田永鸿,党建武,付树军,赵耀.基于图像的自动驾驶3D目标检测综述——基准、制约因素和误差分析[J].中国图象图形学报,2023,28(6):1709-1740. 被引量：2
9刘甲甲,胡旭欣,余萍.聚合多维注意力特征的单目深度估计方法[J].计算机与现代化,2023(6):76-81.
10白宝丁,申坤.建筑工人不安全行为正向干预策略研究[J].安全,2023,44(9):73-80.

1董虎胜,徐建峰,孙浩,吴铭仪.基于注意力机制引导的图像描述生成[J].现代计算机,2019,0(30):30-33.
2徐胜军,欧阳朴衍,郭学源,Taha Muthar Khan,段中兴.多尺度特征融合空洞卷积ResNet遥感图像建筑物分割[J].光学精密工程,2020,28(7):1588-1599. 被引量：42
3李晓颖,杨恒杰,闫铮,连方,巫梅琴.基于颜色恒常性的图像背景虚化算法[J].激光与光电子学进展,2020,57(8):22-28. 被引量：4
4潘峰,安启超,刁奇,王瑞,冯肖雪.基于粒子群算法的多尺度反卷积特征融合的道路提取[J].北京理工大学学报,2020,40(6):640-647. 被引量：3
5王倩倩,赵海涛.基于深度CRF网络的单目红外场景深度估计[J].红外技术,2020,42(6):580-588. 被引量：2
6季利涛.64排螺旋CT鉴别诊断肺孤立小结节结果分析[J].河南医学高等专科学校学报,2020,32(3):244-247.
7陈宇华,张涛,吴飞.蓝牙室内定位共室分系统的设计[J].广东通信技术,2020,40(6):48-51. 被引量：5
8张翠珠,顾建伟,赵秀娜,刘金凤.女性盆腔原发性肿瘤超声、CT检查影像学表现及与病理结果对照研究[J].中国CT和MRI杂志,2020,18(7):127-130. 被引量：24
9王子健,王中元,范立,王阳阳,杨振宇.基于匹配模糊度评价的Wi-Fi/地磁指纹定位算法[J].中国科技论文,2020,15(6):723-728. 被引量：2
10李简,苏雪莲,杨华飞,穆晓琴.川黄连对大鼠化学灼烧型口腔溃疡的抗炎作用观察[J].医学信息,2020,33(11):61-63. 被引量：5

华中科技大学学报（自然科学版）

2020年第5期

浏览历史

内容加载中请稍等...

基于多尺度特征融合的单目图像深度估计被引量：15

参考文献3

二级参考文献37

共引文献9

同被引文献78

引证文献15

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于多尺度特征融合的单目图像深度估计 被引量：15

参考文献3

二级参考文献37

共引文献9

同被引文献78

引证文献15

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于多尺度特征融合的单目图像深度估计被引量：15