基于深度学习的双目立体匹配方法综述被引量：11

Survey of Binocular Stereo-matching Methods Based on Deep Learning

下载PDF

导出

摘要双目立体匹配是计算机视觉领域的经典问题,在自动驾驶、遥感、机器人感知等诸多任务中得到广泛应用。双目立体匹配的主要目标是寻找双目图像对中同名点的对应关系,并利用三角测量原理恢复图像深度信息。近年来,基于深度学习的立体匹配方法在匹配精度和匹配效率上均取得了远超传统方法的性能表现。将现有基于深度学习的立体匹配方法分为非端到端方法和端到端方法。基于深度学习的非端到端方法利用深度神经网络取代传统立体匹配方法中的某一步骤,根据被取代步骤的不同,该类方法被分为基于代价计算网络、基于代价聚合网络和基于视差优化网络的3类方法。基于深度学习的端到端方法根据代价体维度的不同可分为基于3D代价体和基于4D代价体的方法。从匹配精度、时间复杂度、应用场景等多个角度对非端到端和端到端方法中的代表性成果进行分析,并归纳各类方法的优点以及存在的局限性。在此基础上,总结基于深度学习的立体匹配方法当前面临的主要挑战并展望该领域未来的研究方向。 Binocular stereo matching is a classical problem in the field of computer vision and has been widely used in many tasks such as automated driving,remote sensing,and robot perception.The main goal of binocular stereo matching is to identify the corresponding relationship of same-named points in a binocular image pair and to recover image depth information based on the triangulation principle.In recent years,stereo-matching methods based on deep learning have achieved much better performance than traditional methods in terms of matching accuracy and efficiency.Existing stereo-matching methods based on deep learning are divided into non-end-to-end and end-to-end methods.The non-end-to-end methods based on deep learning use deep neural networks to replace steps in traditional stereo-matching methods.Based on these different steps,these methods can be divided into three types of networks:cost-based computing,cost-based aggregation,and disparity-based optimization.The end-to-end methods based on deep learning can be divided into 3D and 4D cost-volume-based methods according to different cost-volume dimensions.The representative methods of non-and end-to-end methods are analyzed in terms of matching accuracy,time complexity,and application scenarios,and the advantages and limitations of various methods are summarized.Accordingly,the main challenges of stereo-matching methods based on deep learning are summarized and future research directions in the field are prospected.

作者尹晨阳职恒辉李慧斌 YIN Chenyang;ZHI Henghui;LI Huibin(School of Mathematics and Statistics,Xi’an Jiaotong University,Xi’an 710049,China)

机构地区西安交通大学数学与统计学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第10期1-12,共12页 Computer Engineering

基金国家自然科学基金面上项目(61976173) 教育部-中国移动人工智能建设项目(MCM20190701)。

关键词计算机视觉深度学习双目图像立体匹配方法图像深度 computer vision deep learning binocular images stereo-matching method image depth

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1童欣,殷晨波,杜雪雪,马伟.基于改进SIFT立体匹配算法的双目三维重建研究[J].机械工程与自动化,2020(5):4-6. 被引量：3
2周秀芝,文贡坚,王润生.自适应窗口快速立体匹配[J].计算机学报,2006,29(3):473-479. 被引量：32
3陈炎,杨丽丽,王振鹏.双目视觉的匹配算法综述[J].图学学报,2020,41(5):702-708. 被引量：34
4赵晨园,李文新,张庆熙.一种改进的实时半全局立体匹配算法及硬件实现[J].计算机工程,2021,47(9):162-170. 被引量：8

二级参考文献22

1吴翊李永乐等.应用数理统计[M].长沙:国防科技大学出版社,1997.135-144.
2Kanade T.,Okutomi M..A stereo matching algorithm with an adaptive window:Theory and experiment.IEEE Transactions on Pattern Analysis and Machine Intelligence,1994,16(9):920～932
3Veksler O..Fast variable window for stereo correspondence using integral images.In:Proceedings of the 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,Madison,WI,USA,2003,556～561
4Daniel S.,Szeliski R..Stereo matching with nonlinear diffusion.International Journal of Computer Vision,1998,28(2):155～174
5Veksler O..Stereo matching by compact windows via minimum ratio cycle.In:Proceedings of the International Conference on Computer Vision,Vancouver,Canada,2001,540 ～547
6Scharstein D.,Szeliski R..A taxonomy and evaluation of dense two-frame stereo correspondence algorithms.International Journal of Computer Vision,2002,47(1):7～42
7Boykov Y.,Veksler O.,Zabih R..Fast approximate energy minimization via graph cuts.IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(11):1222～ 1239
8Sun J.,Zheng N.-N.,Shum H.-Y..Stereo matching using belief propagation.IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(7):787～800
9狄红卫,柴颖,李逵.一种快速双目视觉立体匹配算法[J].光学学报,2009,29(8):2180-2184. 被引量：39
10徐彦君,杜利民,侯自强,金贵昌.基于相位的尺度自适应立体匹配方法[J].电子学报,1999,27(7):38-41. 被引量：15

共引文献72

1李振波,赵远洋,杨普,吴宇峰,李一鸣,郭若皓.基于机器视觉的鱼体长度测量研究综述[J].农业机械学报,2021,52(S01):207-218. 被引量：4
2葛亮,朱庆生,傅思思.基于LBP/C纹理分析的立体匹配算法[J].计算机应用,2009,29(2):447-449. 被引量：1
3马力妮,郑志辉,杜小钰.立体视频点播系统设计与实现[J].计算机与现代化,2008(10):21-23.
4李淳,马力妮.多视点视频编码技术研究[J].计算机与现代化,2009(1):105-108. 被引量：1
5夏永泉,黄敏,郭龙源,杨静宇.基于相关窗口匹配的费用函数计算优化方法[J].计算机工程,2009,35(4):83-84. 被引量：1
6邵泽明,朱剑英.自适应分层粒子群稠密视差图估计[J].中国图象图形学报,2009,14(4):725-730. 被引量：1
7郭大波,卢朝阳,焦卫东,崔玲玲.遮挡检测/立体匹配中的分段动态规划法[J].电子学报,2009,37(7):1516-1521. 被引量：2
8葛亮,朱庆生,傅思思.Laws纹理模板在立体匹配中的应用[J].光学学报,2009,29(9):2506-2510. 被引量：4
9卢阿丽,唐振民.利用自适应窗口实现不连续保护立体匹配[J].光学精密工程,2009,17(9):2328-2335. 被引量：4
10葛亮,朱庆生,傅思思.基于纹理分析的视差估计算法[J].计算机工程,2009,35(20):7-9.

同被引文献64

1刘志颖,缪希仁,陈静,江灏.电力架空线路巡检可见光图像智能处理研究综述[J].电网技术,2020,44(3):1057-1069. 被引量：95
2谢鑫,张博,张美灵,朱磊.融合注意力和多尺度的优化立体匹配算法研究[J].国外电子测量技术,2023,42(1):89-99. 被引量：3
3胡涛,胡毅,李景禄,龙立宏.输电线路带电作业的安全防护[J].高电压技术,2006,32(5):22-25. 被引量：82
4胡毅,刘凯,彭勇,苏梓铭,吴田.带电作业关键技术研究进展与趋势[J].高电压技术,2014,40(7):1921-1931. 被引量：188
5翟敬梅,董鹏飞,张铁.基于视觉引导的工业机器人定位抓取系统设计[J].机械设计与研究,2014,30(5):45-49. 被引量：87
6韩剑辉,吴振,李兰英.双目立体匹配算法的FPGA实现[J].哈尔滨理工大学学报,2016,21(4):25-29. 被引量：3
7陈驰,彭向阳,宋爽,王柯,钱金菊,杨必胜.大型无人机电力巡检LiDAR点云安全距离诊断方法[J].电网技术,2017,41(8):2723-2730. 被引量：90
8林森,殷新勇,唐延东.双目视觉立体匹配技术研究现状和展望[J].科学技术与工程,2017,17(30):135-147. 被引量：24
9龚健雅,季顺平.摄影测量与深度学习[J].测绘学报,2018,47(6):693-704. 被引量：73
10王杰,管声启,曹帅.基于MATLAB的主操作手运动学分析及仿真[J].西安工程大学学报,2018,32(2):222-229. 被引量：8

引证文献11

1戴激光,罗方泽.一种用于双目立体视觉的立体匹配网络[J].测绘科学,2023,48(12):234-242.
2王雷雄,王波,马富齐,董旭柱,姚良忠.基于双目立体匹配和场景元素识别的变电人员近电安全距离检测方法研究[J].电网技术,2023,47(3):1010-1021. 被引量：6
3王西志,管声启,张理博,刘通,郝振虎.基于视觉引导的工业棒材上料系统研究[J].机械与电子,2023,41(5):19-23.
4党宏社,许怀彪,张选德.融合结构信息的深度学习立体匹配算法[J].图学学报,2023,44(5):899-906.
5韩坤昊,贾振堂.融合多层次特征及互注意力机制的视差估计[J].国外电子测量技术,2023,42(10):35-42. 被引量：1
6张博,张美灵,李雪,朱磊.一种密集多尺度特征引导代价聚合的改进立体匹配网络[J].西安工程大学学报,2024,38(1):121-130.
7陶洋,欧双江,唐函,周婉怡.融合梯度先验与全局聚合的立体匹配算法[J].小型微型计算机系统,2024,45(4):865-872.
8刘少杰,李建华,毛润好,匡钟慧,杨洪钦.基于机器视觉的智能导盲系统[J].福光技术,2023,45(1):38-45.
9叶彬,朱兴帅,姚康,丁上上,付威威.面向桌面交互场景的双目深度测量方法[J].计算机工程与应用,2024,60(9):283-291. 被引量：1
10赵业涛,郭龙源,曾毅,姜举,周晨明,彭怡书.结合分组相关性和注意力机制的立体匹配算法[J].成都工业学院学报,2024,27(4):39-45.

二级引证文献8

1王波,张迎晨,齐冬莲,马富齐,董旭柱.数字化安全管控视角下的全息影像:定义、基本框架及关键技术[J].高电压技术,2023,49(8):3335-3345. 被引量：1
2刘现涛,张思怡.电力系统变电运行的现场安全与设备维护方法研究[J].中国高新科技,2023(24):41-43.
3刘宇航,于雅雯,皮谭昕,武昕.基于多视图前景分割的电网设施三维数字化重建[J].电网技术,2024,48(2):710-720.
4阳林,刘子其,孙夏青,朱俊霖,郝艳捧.电力变压器关键尺寸视觉检测方法及其缩比模型验证[J].电子测量技术,2024,47(4):147-155.
5郑海霖,崔亚奇.基于双目系统的海面远距离测距研究[J].现代电子技术,2024,47(15):151-156.
6秦若锋,赵勇,周迎超,邱凯义,方梦然.基于改进蚁群算法的记录仪现场采集路径规划模型[J].粘接,2024,51(8):150-153.
7文贞慧,郝友胜,白鑫,朱蔚健,冯小溪.基于手眼系统的喷涂机标定方法[J].自动化应用,2024,65(18):1-3.
8李振兴,胡聪,朱益,崔晓琳,翁汉琍.基于双目视觉的应用于行波故障定位的高压输电线长修正方法[J].电网技术,2024,48(10):4387-4396.

1郝贵举,杨洪臣,颜瑞彬.基于双目视差机制的视频图像超分辨率重建[J].刑事技术,2022,47(5):458-464. 被引量：1
2《南通大学学报(自然科学版)》征稿简则[J].南通大学学报（自然科学版）,2022,21(3).
3唐笑虎,胡丹,刘凯.一种极线近似的双目结构光相位立体匹配方法[J].强激光与粒子束,2022,34(11):12-17. 被引量：2
4吴清缘,陈蕾,刘超,伍海燕.心脑间电信号的功能耦合及信息传递方法综述[J].生物医学工程研究,2022,41(3):315-323. 被引量：1
5王立,封颖.国际货币基金组织定量估算中美“科技脱钩”研究及对我国的启示[J].全球科技经济瞭望,2022,37(6):71-76.
6崔政,胡永利,孙艳丰,尹宝才.面向跨模态数据协同分析的视觉问答方法综述[J].北京工业大学学报,2022,48(10):1088-1099. 被引量：1
7李聪.侧信道攻击方法综述[J].现代信息科技,2022,6(14):82-85. 被引量：2
8吴梓龙,徐炳权,邓炫烨.基于深度学习的虚拟角色制作系统设计与实现[J].现代信息科技,2022,6(16):100-103.
9Fundamental Research征稿[J].中国科学基金,2022,36(4):672-672.
10朱炳聿.马克思《资本论》在西班牙的传播历程研究[J].国外理论动态,2022(4):23-33.

计算机工程

2022年第10期

浏览历史

内容加载中请稍等...

基于深度学习的双目立体匹配方法综述被引量：11

参考文献4

二级参考文献22

共引文献72

同被引文献64

引证文献11

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于深度学习的双目立体匹配方法综述 被引量：11

参考文献4

二级参考文献22

共引文献72

同被引文献64

引证文献11

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于深度学习的双目立体匹配方法综述被引量：11