基于小波变换网络的自监督单目深度与位姿估计

Self-Supervised Monocular Depth and Pose Estimation Based on WaveletTransform Network

导出

摘要基于小波变换与运动恢复结构的自监督学习范式,将二维离散小波变换嵌入神经网络并实现梯度传播,提出了一种新的单目深度与位姿估计算法。传统的神经网络在降采样过程中会造成信息丢失,且丢失的信息在后续阶段无法复原,对于深度估计任务,结构信息的丢失会降低模型性能。本文使用二维离散小波变换层替代传统的降采样操作,更好地保留图像中的结构细节并避免噪声累积。在上采样解码深度图的阶段,采用小波逆变换层取代传统的插值上采样方法,更有效地恢复图像信息,得到更精确的深度图。提出的算法相比传统的神经网络对噪声更有鲁棒性。在KITTI数据集上进行实验,证明了所提出的算法在自监督单目深度与位姿估计任务中有优异的性能表现。 This paper proposes a novel depth and pose estimation framework,leveraging the wavelet transform and the self-supervised structure from the motion paradigm.The approach involves embedding 2D discrete wavelet transform into neural networks and im⁃plementing gradient propagation.Traditional convolutional neural networks(CNN)face a challenge during the down-sampling stage,as structural information is lost,and becomes irrecoverable in subsequent phases.This loss of information impacts the performance of depth estimation tasks,where complete structural information is crucial.This paper uses a 2D discrete wavelet transform layer to replace the down-sampling process of traditional neural networks,which can better preserve the structural details and avoid the accumulation of noise.In the up-sampling stage of the decoder,the inverse wavelet transform layer is used to replace the conventional interpolation method,which can effectively restore detailed information and promote the accuracy of the depth map.In addition,the proposed method has noise robustness compared to traditional neural networks.Experiments on the KITTI dataset demonstrate that the proposed algorithm performs excellently in the self-supervised depth and pose estimation tasks.

作者乔善宝高永彬黄勃余文俊 QIAO Shanbao;GAO Yongbin;HUANG Bo;YU Wenjun(School of Electronic and Electrical Engineering,Shanghai University of Engineering Science,Shanghai 201600,China)

机构地区上海工程技术大学电子电气工程学院

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2023年第6期777-786,共10页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金(61802253,U2033218) 科技创新2030—“新一代人工智能”重大项目(2020AAA0109302,2020AAA0109300) 上海晨光人才计划(17CG59)。

关键词小波变换自监督学习单目深度估计位姿估计三维感知 wavelet transform self-supervised learning monocular depth estimation pose estimation 3D perception

分类号 TN391 [电子电信—物理电子学]

引文网络
相关文献

参考文献2

1詹雁,张娟,金昌基.联合语义感知与域适应方法的单目深度估计[J].传感器与微系统,2021,40(5):60-63. 被引量：4
2叶星余,何元烈,汝少楠.基于生成式对抗网络及自注意力机制的无监督单目深度估计和视觉里程计[J].机器人,2021,43(2):203-213. 被引量：7

二级参考文献5

1高云峰,李伟超,李建辉.室内移动机器人视觉里程计研究[J].传感器与微系统,2012,31(2):26-29. 被引量：8
2邓小玲,倪江群,代芬,李震.基于LLOM的单目图像深度图估计算法[J].计算机应用研究,2012,29(11):4357-4359. 被引量：2
3华旭奋,孙俊.基于深度信息的手势识别算法研究[J].传感器与微系统,2017,36(12):122-125. 被引量：11
4张兆博,伍新华,刘刚.基于图优化的Kinect三维视觉里程计设计[J].传感器与微系统,2019,38(3):106-109. 被引量：5
5陈宗海,洪洋,王纪凯,葛振华.基于循环卷积神经网络的单目视觉里程计[J].机器人,2019,41(2):147-155. 被引量：15

共引文献8

1刘安旭,黎向锋,刘晋川,赵康,李高扬,左敦稳.融合残差上采样结构的P^(2)Net无监督单目深度估计[J].计算机系统应用,2022,31(11):365-372.
2乔善宝,高永彬,黄勃,余文俊.基于条件卷积与极化自注意力的单目深度与位姿估计[J].计算机与现代化,2023(2):34-39. 被引量：2
3彭道刚,欧阳海林,戚尔江,王丹豪.结合改进密集模块深度估计网络和多视几何的视觉里程计[J].控制与决策,2023,38(4):980-988. 被引量：2
4周颖,袁梓桐,陈海永,王世杰.融合元学习和双路径注意力的太阳电池缺陷生成[J].太阳能学报,2023,44(9):85-93.
5曲熠,陈莹.基于边缘强化的无监督单目深度估计[J].系统工程与电子技术,2024,46(1):71-79.
6郑宇航,曹雏清.基于多尺度特征混合注意力的连续帧深度估计[J].重庆工商大学学报（自然科学版）,2024,41(4):104-111. 被引量：1
7李颀,李煜哲.基于语义信息的无监督单目深度估计[J].传感器与微系统,2024,43(9):157-160.
8吴冰源,王永雄.面向全局特征Transformer架构的单目深度估计[J].控制工程,2024,31(9):1619-1625.

1黄铝文,关非凡,谦博,侯闳耀,刘迎庆,李雯敏.基于2D DWT与MobileNetV3融合的轻量级茶叶病害识别[J].农业工程学报,2023,39(24):207-214. 被引量：2
2孙水发,汤永恒,王奔,董方敏,李小龙,蔡嘉诚,吴义熔.动态场景的三维重建研究综述[J].计算机科学与探索,2024,18(4):831-860. 被引量：1
3夏晓华,刘希恒,岳鹏举,邹易清,蒋立军.细节增强的多曝光图像融合方法[J].图学学报,2023,44(6):1130-1139. 被引量：1
4马昭军,胡治权,张剑飞.基于谐波分解恢复弱势信号的高分辨率处理技术[J].新疆石油地质,2024,45(2):235-243. 被引量：1

武汉大学学报（理学版）

2023年第6期

浏览历史

内容加载中请稍等...

基于小波变换网络的自监督单目深度与位姿估计

参考文献2

二级参考文献5

共引文献8

相关作者

相关机构

相关主题

浏览历史