基于场景对象注意与深度图融合的深度估计被引量：1

Depth Estimation Based on Scene Object Attention and Depth Map Fusion

下载PDF

导出

摘要现有单目深度估计算法主要从单幅图像中获取立体信息,存在相邻深度边缘细节模糊、明显的对象缺失问题。提出一种基于场景对象注意机制与加权深度图融合的单目深度估计算法。通过特征矩阵相乘的方式计算特征图任意两个位置之间的相似特征向量,以快速捕获长距离依赖关系,增强用于估计相似深度区域的上下文信息,从而解决自然场景中对象深度信息不完整的问题。基于多尺度特征图融合的优点,设计加权深度图融合模块,为具有不同深度信息的多视觉粒度的深度图赋予不同的权值并进行融合,融合后的深度图包含深度信息和丰富的场景对象信息,有效地解决细节模糊问题。在KITTI数据集上的实验结果表明,该算法对目标图像预估时σ<1.25的准确率为0.879,绝对相对误差、平方相对误差和对数均方根误差分别为0.110、0.765和0.185,预测得到的深度图具有更加完整的场景对象轮廓和精确的深度信息。 The existing monocular depth estimation algorithm mainly obtains stereo information from a single image.This approach leads to blurred details of adjacent depth edges and apparent missing objects.A monocular depth estimation algorithm based on scene object attention mechanism and weighted depth map fusion is proposed.The similarity feature vector between any two positions of feature map is calculated by multiplying the feature matrix to rapidly capture the long-distance dependency relationship.The dependency between any two positions in the image can enhance the context information used to estimate the similar depth area,thus,solving the incomplete object depth information in the natural scene.Based on the advantages of multi-scale feature map fusion,weighted depth map fusion module is designed.The multi-vision granularity depth map with different depth information data is assigned different weights for fusion.The fused depth map contains depth information and rich-scene object information for effectively solving the problem of fuzzy details.The experimental results on the KITTI dataset show that an accuracy rate of the proposed algorithm for target image prediction is 0.879 atσ<1.25,and the absolute relative error,square relative error,and logarithmic root mean square error are 0.110,0.765,and 0.185,respectively.The predicted depth map has a complete scene object contour and accurate depth information.

作者温静杨洁 WEN Jing;YANG Jie(School of Computer and Information Technology,Shanxi University,Taiyuan 030006,China)

机构地区山西大学计算机与信息技术学院

出处《计算机工程》 CAS CSCD 北大核心 2023年第2期222-230,共9页 Computer Engineering

基金山西省基础性研究计划(201901D211176)。

关键词场景对象注意加权深度图融合上下文信息深度估计三维重建 scene object attention weighted depth map fusion context information depth estimation three-dimensional reconstruction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1朱照飞,刘伟.基于改进的SURF特征点的双目测距[J].电子测量技术,2018,41(12):133-138. 被引量：9
2龙霄潇,程新景,朱昊,张朋举,刘浩敏,李俊,郑林涛,胡庆拥,刘浩,曹汛,杨睿刚,吴毅红,章国锋,刘烨斌,徐凯,郭裕兰,陈宝权.三维视觉前沿进展[J].中国图象图形学报,2021,26(6):1389-1428. 被引量：28
3王子,吴振宇.SFM算法在无人机航拍影像中的应用研究[J].科技创新与生产力,2021(8):104-107. 被引量：5
4王亚群,戴华林,王丽,李国燕.基于密集卷积网络的单目图像深度估计方法[J].计算机工程,2021,47(11):262-267. 被引量：2

二级参考文献29

1于乃功,马春燕,林佳.基于双目视觉的关键点的检测方法及定位研究[J].计算机测量与控制,2011,19(7):1565-1568. 被引量：8
2姜宏志,赵慧洁,梁宵月,李冬.基于极线校正的快速相位立体匹配[J].光学精密工程,2011,19(10):2520-2525. 被引量：36
3姜雨彤,杨进华,刘钊,张丽娟,姜成昊.双目CCD测距系统的高精度标定[J].计算机工程,2013,39(7):228-232. 被引量：16
4李晓飞,宋亚男,徐荣华,陈君.基于双目视觉的船舶跟踪与定位[J].南京信息工程大学学报（自然科学版）,2015,7(1):46-52. 被引量：5
5沈彤,刘文波,王京.基于双目立体视觉的目标测距系统[J].电子测量技术,2015,38(4):52-54. 被引量：76
6许志华,吴立新,刘军,沈永林,李发帅,王然.顾及影像拓扑的SfM算法改进及其在灾场三维重建中的应用[J].武汉大学学报（信息科学版）,2015,40(5):599-606. 被引量：33
7冯亦东,孙跃.基于SURF特征提取和FLANN搜索的图像匹配算法[J].图学学报,2015,36(4):650-654. 被引量：49
8张平,王山东,黄瑾娉,周明明.基于SFM和CMVS/PMVS的建筑物点云重构方法研究[J].苏州科技学院学报（自然科学版）,2015,32(3):60-64. 被引量：12
9韩峰,李晓斌.基于改进SURF算法的双目视觉定位[J].电视技术,2015,39(23):22-25. 被引量：7
10王凌云,尹海波,王琪.SURF和RANSAC在图像拼接中的应用[J].电子测量技术,2016,39(4):71-75. 被引量：15

共引文献40

1廖小烽,谢艳,田书函,蔡硕累.基于计算机视觉的施工进度自动监控方法[J].重庆大学学报,2022,45(S01):70-73. 被引量：1
2王瑞,薛慰慈.基于Unity 3D的增强现实动画展示窗[J].电子测量技术,2019,42(12):100-105. 被引量：4
3周玉成,陈业明,程新蕾,张梦雨,汪沛.飞鸟视频跟踪的局部特征点融合Meanshift方法[J].电子技术与软件工程,2019,0(18):64-68. 被引量：1
4王吉岱,郭帅,孙爱芹,付恩鹏,梁茂轩,杨帅,侯建国.基于双目视觉技术的高压输电线路巡检机器人在线测距[J].科学技术与工程,2020,20(15):6130-6134. 被引量：20
5孙鹏,马鹏博,郎宇博,单大国,赖伟,赵祎明.结合SURF算法的双目视觉测距方法[J].中国刑警学院学报,2020(5):110-116. 被引量：2
6翁振杰,廖华丽,周泽霖,徐铭泽.涂胶压力控制及视觉检测[J].电子测量技术,2020,43(24):93-98. 被引量：2
7王荣超,张力,张涛,慕晓冬.基于视觉的三维重建技术分析及其军事应用研究[J].信息与电脑,2021,33(16):13-16. 被引量：4
8袁斌,王辉,王伟博,吴瑞明.视觉机械手的抓取方法研究[J].机床与液压,2021,49(23):43-47. 被引量：6
9高瑞琪,唐妙奇,兰锋.基于3D视觉的车载雷达PCB焊点缺陷检测系统研究[J].内燃机与配件,2022(3):136-138.
10宋巍,朱孟飞,张明华,赵丹枫,贺琪.基于深度学习的单目深度估计技术综述[J].中国图象图形学报,2022,27(2):292-328. 被引量：6

同被引文献5

1郑德华.ICP算法及其在建筑物扫描点云数据配准中的应用[J].测绘科学,2007,32(2):31-32. 被引量：60
2胡天策,蔡俊锋,徐榕,赵强.基于内窥镜单目视觉手术导航的测距方法[J].中国组织工程研究与临床康复,2008,12(22):4241-4245. 被引量：4
3黄鹏程,江剑宇,杨波.双目立体视觉的研究现状及进展[J].光学仪器,2018,40(4):81-86. 被引量：39
4崔曦雯,陈芳,韩博轩,马聪,马龙飞,廖洪恩.虚拟内窥镜图像增强膝关节镜手术导航系统[J].中国生物医学工程学报,2019,38(5):558-565. 被引量：5
5ZHAO ChaoQiang,SUN QiYu,ZHANG ChongZhen,TANG Yang,QIAN Feng.Monocular depth estimation based on deep learning: An overview[J].Science China(Technological Sciences),2020,63(9):1612-1627. 被引量：20

引证文献1

1林飞凡,李凌,徐强.结合改进注意力的肠胃镜图像深度估计[J].计算机系统应用,2024,33(1):58-67.

1张雪峰.基于ISM-MICMAC的大学生课堂出勤率的影响因素研究[J].山西能源学院学报,2022,35(5):30-32. 被引量：2
2伍永豪,李聪,余正红.基于融合多注意网络的网约车接客区域推荐研究[J].计算机与数字工程,2022,50(11):2411-2417.
3赵彩霞.高职院校创新创业教育助力乡村振兴策略研究[J].小小说月刊（下半月）,2022(22):238-240.
4邓盛双.邻近公路深基坑围护结构设计与应用分析[J].安徽建筑,2023,30(1):165-167.
5陈建,向露,徐晶,陆存豪.基于特征词的教学综合评语量化研究[J].软件导刊,2023,22(1):123-127.
6戴尧,王睿,余明昊,宋立琴.基于VSG的风光火打捆系统暂态稳定性分析[J].河北电力技术,2022,41(6):36-40.
7刘婉春,景明利,王子昭,陈腾飞,樊锐博.基于Transformer和双残差网络的图像去模糊算法研究[J].信息技术与信息化,2023(1):217-220.
8任晓丽.注意力机制及其在医学视觉任务中的作用研究[J].影像技术,2023,35(1):76-80. 被引量：1
9李轩,刘立柱.多分支残差特征蒸馏网络的图像超分辨重建[J].小型微型计算机系统,2023,44(2):363-369. 被引量：1

计算机工程

2023年第2期

浏览历史

内容加载中请稍等...

基于场景对象注意与深度图融合的深度估计被引量：1

参考文献4

二级参考文献29

共引文献40

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于场景对象注意与深度图融合的深度估计 被引量：1

参考文献4

二级参考文献29

共引文献40

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于场景对象注意与深度图融合的深度估计被引量：1