基于稠密连接网络的单目深度估计被引量：2

Monocular depth estimation based on dense connected network

下载PDF

导出

摘要单目深度估计作为计算机视觉的基本问题,得到人们的广泛关注。目前的方法多集中在深度卷积神经网络的图像级信息上,训练时收敛速度较慢,精度下降,特别是在图像中拥有不同大小的多目标情况下。为此,本文基于一个编解码框架提出了一个新的卷积神经网络模型结构DCDN(Deep Convolution DenseASPP Network),并将其应用到深度估计中。不同尺度的物体特征需要不同的卷积核去获取,对于多目标的图像,用不同的卷积核去获取他们的特性。本文采用稠密链接的空洞卷积组,利用不同扩张率的空洞卷积去强化多尺度目标的特性学习。实验结果表明,该方法在NYU-Depth-v2数据集上达到了0.823的准确率(阈值<1.25),优于最先进的方法。 As a basic problem of computer vision,monocular depth estimation has been widely concerned.At present,most methods focus on the image-level information of deep convolutional neural network,and the convergence speed is slow and the accuracy drops,especially in the case of multi-objects with different sizes in the image.For this reason,we propose a new DCDN(Deep Convolution DenseASPP Network)model structure based on a codec framework and apply it to depth estimation.We believe that different convolution kernels are needed to obtain the features of objects of different scales.For some multi-object images,different convolution kernels should be used to obtain their characteristics.In this paper,dense linked dilated convolution groups are used to enhance the characteristic learning of multi-scale targets by using the dilated convolution with different dilation rates.The experimental results show that our method achieves the accuracy of 0.823(threshold<1.25)on NYU-Depth-V2 data set,which is better than the most advanced method.

作者张顺然吴克伟洪炎 ZHANG Shunran;WU Kewei;HONG Yan(School of Computer Science and Information Engineering,Hefei University of Technology,Hefei 230601,China)

机构地区合肥工业大学计算机与信息学院

出处《智能计算机与应用》 2020年第6期42-47,50,共7页 Intelligent Computer and Applications

关键词深度估计卷积神经网络空洞卷积多尺度 Depth Prediction Convolutional Neural Network Dilated Convolution Multi-scale

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献11

1王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：51
2王科俊,赵彦东,邢向磊.深度学习在无人驾驶汽车领域应用的研究进展[J].智能系统学报,2018,13(1):55-69. 被引量：79
3姜维,张重生,殷绪成.基于深度学习的场景文字检测综述[J].电子学报,2019,47(5):1152-1161. 被引量：27
4李頔,王艳,马宗庆,张波,罗红,周激流.基于DenseASPP模型的超声图像分割[J].四川大学学报（自然科学版）,2020,57(4):741-748. 被引量：9
5贾瑞明,李彤,李阳,王一丁.轻量金字塔解码结构的单目深度估计网络[J].计算机应用研究,2021,38(1):293-297. 被引量：2
6李益红,陈袁宇.深度学习场景文本检测方法综述[J].计算机工程与应用,2021,57(6):42-48. 被引量：7
7刘崇宇,陈晓雪,罗灿杰,金连文,薛洋,刘禹良.自然场景文本检测与识别的深度学习方法[J].中国图象图形学报,2021,26(6):1330-1367. 被引量：31
8张意,阚子文,邵志敏,周激流.基于注意力机制和感知损失的遥感图像去噪[J].四川大学学报（自然科学版）,2021,58(4):39-49. 被引量：21
9胡坤,陈迟晓,李伟,甘中学.深度估计网络的可学习步长轻量化研究[J].小型微型计算机系统,2022,43(1):50-55. 被引量：1
10郭志涛,苏逸,袁金丽,赵琳琳.基于双注意力机制和复合损失的LDCT去噪方法[J].激光与光电子学进展,2022,59(2):146-157. 被引量：1

引证文献2

1周冲浩,顾勇翔,彭程.基于多尺度特征融合的自然场景文本检测[J].计算机应用,2022,42(S02):31-35. 被引量：2
2周润民,王晓红,王辉,苏靖,刘璐.基于轻量化融合损失网络的单目深度估计[J].智能计算机与应用,2023,13(10):127-132.

二级引证文献2

1张博,徐彦彦,王志恒,闫悦菁.面向自然场景的不规则文本检测方法[J].计算机应用,2023,43(S02):9-17.
2沈世玉,杨超宇.基于边界学习的食用油桶日期检测[J].上海工程技术大学学报,2024,38(2):205-211.

1徐胜舟,程时宇.基于空洞卷积密集连接网络的左心室MR图像分割方法[J].中南民族大学学报（自然科学版）,2020,39(5):524-531. 被引量：3
2李博涵,许敏,王凯,孙翔,谭守标.结合编解码网络的人体解析方法[J].小型微型计算机系统,2020,41(10):2184-2188.
3麦秋君,麦文霞,陈晓婉.细节优化定期维护干预对血液透析患者自体动静脉内瘘并发症发生率的影响[J].中国医学创新,2020,17(28):105-109. 被引量：3
4刘翔羽,杨超宇.多分支卷积块的目标检测算法[J].赤峰学院学报（自然科学版）,2020,36(10):17-22.
5王治兵.输尿管软镜碎石术前留置双J管治疗肾结石患者的疗效分析[J].现代诊断与治疗,2020,31(18):2945-2947. 被引量：3
6周海赟,项学智,翟明亮,张荣芳,王帅.结合注意力机制的深度学习光流网络[J].计算机科学与探索,2020,14(11):1920-1929. 被引量：2
7许丽,周永昊,张帆,罗文宇,刘雪梅.基于光平面约束的水下三维视觉测量系统[J].中国激光,2020,47(9):152-163. 被引量：5

智能计算机与应用

2020年第6期

浏览历史

内容加载中请稍等...

基于稠密连接网络的单目深度估计被引量：2

同被引文献11

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于稠密连接网络的单目深度估计 被引量：2

同被引文献11

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于稠密连接网络的单目深度估计被引量：2