基于全卷积编解码网络的视觉定位方法

Visual Localization with a Fully Convolutional Encoder-Decoder Network

导出

摘要针对目前视觉定位方法中使用人工特征的限制,提出了一种基于全卷积编解码网络的视觉定位方法。该方法将场景点3D坐标映射到图像的BGR(blue-green-red)通道,建立了图像到场景的直接联系,并通过全卷积编解码网络学习图像与场景结构的关系。给出一张图像,网络可以预测其每个像素点对应的3D点在当前场景世界坐标系的坐标;然后结合RANSAC(random sample consensus)和PnP(perspective-n-point)算法求解位姿并优化,得到最终的相对位姿。在7-Scenes数据集上的实验结果表明本文方法可实现厘米级的高精度定位,并且相比其他基于深度学习的方法,该方法在保证精度的同时,模型尺寸更小。 To address the limitations of using the hand-crafted feature in present visual localization methods,a method is proposed in this paper based on a fully convolutional encoderdecoder network for visual localization.Different from the previous approaches of scene construction,this method maps 3D scene coordinates to the BGR cube,thus directly establishes the connection between images and the structure of scene,and learns their conncection through the fully convolutional encoder-decoder network.Given an image,for each pixel in it,the network can infer the corresponding scene coordinate under the current scene′s world coordinate system.Then the final camera pose is obtained with RANSAC and PnP algorithm.Lastly,results on the 7-Scenes dataset indicate that the method can achieve highly accurate visual localization at centimeter-level.Besides,compared with other methods based on deep learning,the network has a smaller size model while ensuring accuracy.

作者李晨旻姚剑龚烨刘欣怡 LI Chenmin;YAO Jian;GONG Ye;LIU Xinyi(School of Remote Sensing and Information Engineering,Wuhan University,Wuhan 430079,China)

机构地区武汉大学遥感信息工程学院

出处《测绘地理信息》 CSCD 2022年第6期46-49,共4页 Journal of Geomatics

基金国家自然科学基金(41571436)。

关键词视觉定位场景构建姿态估计深度学习 visual localization scene construction pose estimation deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术] P237 [天文地球—摄影测量与遥感]

引文网络
相关文献

参考文献3

1吴毅红.基于图像的相机定位技术综述[J].人工智能,2019,0(2):50-64. 被引量：3
2朱永丰,朱述龙,张静静,朱永康.基于ORB特征的单目视觉定位算法研究[J].计算机科学,2016,43(S1):198-202 254. 被引量：9
3涂金戈,谢仁平,赵鹏程.一种双目直接法视觉里程计[J].测绘地理信息,2020,45(2):111-115. 被引量：7

二级参考文献2

1龚健雅,崔婷婷,单杰普度大学土木工程学院,季顺平,黄玉春.利用车载移动测量数据的建筑物立面建模方法[J].武汉大学学报（信息科学版）,2015,40(9):1137-1143. 被引量：41
2郭强,尹业宏,宣扬.超紧组合中不同精度IMU对GNSS信号跟踪性能的提升[J].测绘地理信息,2016,41(6):9-11. 被引量：3

共引文献16

1罗磊,谈彬,姚剑,李礼.基于2D旋转激光的室内3D-SLAM[J].测绘地理信息,2022,47(4):56-60.
2田威,董颖.企业女职工生育费用浅析[J].中国卫生经济,2000,19(6):36-39.
3程庆,魏利胜,甘泉.基于单目视觉的目标定位算法研究[J].安徽工程大学学报,2017,32(2):37-42. 被引量：3
4钱卫星,黄丽亚.机器人视觉定位精度的灰色评定方法研究[J].组合机床与自动化加工技术,2017(6):30-33. 被引量：4
5王尧山,朱毅,卢军,谭云籍.一种基于系统稳定性和正确性的定位导航方法研究[J].成都信息工程大学学报,2019,34(2):105-111. 被引量：1
6陶浩,李笑,陈敏.基于改进ORB特征的遥操作工程机器人双目视觉定位[J].测控技术,2019,38(7):19-23. 被引量：11
7章弘,胡士强.基于空间约束ICP的改进视觉里程计[J].计算机仿真,2019,36(8):222-226.
8黄昱歆,陈亮,陈宏基,杜小甫.基于人脸识别的视觉定位原型系统设计[J].电子测试,2019,0(21):109-110. 被引量：1
9赵伟,王正平,张晓辉,向乾,贺云涛.面向疫情防控的无人机关键技术综述[J].无人系统技术,2020,3(3):8-18. 被引量：9
10吴玉,董超群,陈嘉杰,董俊杰,温浩,段星光.基于Halcon的蒸汽发生器堵板操作机器人视觉定位算法[J].科学技术与工程,2020,20(28):11626-11631. 被引量：4

1李明臻,姜梦炜,陈仕旗.基于ORB特征点的道路图像拼接方法[J].现代制造技术与装备,2022,58(11):56-58.
2谷学静,周士兵,马冠征,刘秋月.基于CenSurE-star改进BRISK图像匹配算法[J].激光杂志,2023,44(1):143-147. 被引量：1
3连耿雄.基于改进Bi-LSTM-CRF的网络安全领域知识图谱构建[J].信息技术,2022,46(12):130-135. 被引量：1
4邓磊,刘桂华,邓豪,周炳宏.三维点云分割的交联聚乙烯电缆接头参数测量[J].电子测量与仪器学报,2022,36(9):197-207. 被引量：2
5刘聪,韩东,李宁,张埂铭.基于深度学习的常规调制信号与跳频调制信号识别[J].电声技术,2022,46(8):59-64.
6郑宇,张晓燕.基于改进特征点检测的全景图像拼接方法[J].信息记录材料,2022,23(12):162-164.
7刘威.基于最小生成树的无人机影像快速拼接方法[J].测绘技术装备,2022,24(4):72-77.
8《电工技术学报》投稿须知[J].电工技术学报,2023,38(2).
9《电工技术学报》投稿须知[J].电工技术学报,2023,38(3).
10牛彤,刘立东,武忆涵.基于CUDA加速的图像配准算法[J].计算机系统应用,2023,32(1):146-155.

测绘地理信息

2022年第6期

浏览历史

内容加载中请稍等...

基于全卷积编解码网络的视觉定位方法

参考文献3

二级参考文献2

共引文献16

相关作者

相关机构

相关主题

浏览历史