基于自注意力机制的多视图三维重建方法被引量：1

Multi-View 3D Reconstruction Method Based on Self-Attention Mechanism

导出

摘要多视图立体匹配是计算机视觉领域的一大研究热点,针对目前多视图立体重建完整性差、无法处理高分辨率图像和GPU内存消耗巨大、运行时间长等问题,提出一种基于自注意力机制的深度学习网络(SA-PatchmatchNet)。首先通过特征提取模块提取图像特征,再将其送入可学习的Patchmatch模块中,得到深度图,并对深度图进行优化,生成最终的深度图。为了捕捉深度推理任务中的重要信息,将自注意力机制融入到特征提取模块,提高了网络的特征提取能力。实验结果表明,SA-PatchmatchNet在Technical University of Denmark(DTU)数据集上进行测试,与PatchmatchNet相比,重建的完整性提升5.8%,整体性提升2.3%,与其他的state-of-the-art(SOTA)方法相比,完整性和整体性都得到了较大的提升。 Multi-view stereo matching is a major hotspot in the field of computer vision.We propose a self-attentionbased deep learning network(SA-PatchmatchNet)to address the issues of poor completeness of multi-view stereo reconstruction,inability to process high-resolution images,huge GPU memory consumption,and long running time.First,the feature extraction module extracted the image features and sent them to the learnable Patchmatch module to obtain the depth map,and then the depth map was optimized to generate the final depth map.Moreover,the self-attention mechanism was integrated into the feature extraction module to capture the important information in the deep reasoning task,thereby enhancing the network feature extraction ability.The experimental results show that the reconstruction completeness is improved by 5.8%and the entirety is improved by 2.3%compared with that of the PatchmatchNet when the SA-PatchmatchNet is tested on the Technical University of Denmark(DTU)dataset.The completeness and entirety of the proposed network are significantly improved compared with that of the other state-of-the-art(SOTA)methods.

作者朱光照韦博杨阿峰徐欣 Zhu Guangzhao;Wei Bo;Yang Afeng;Xu Xin(School of Communication Engineering,Hangzhou Dianzi University,Hangzhou 310037,Zhejiang,China)

机构地区杭州电子科技大学通信工程学院

出处《激光与光电子学进展》 CSCD 北大核心 2023年第16期315-322,共8页 Laser & Optoelectronics Progress

关键词深度学习三维重建多视图立体自注意力机制 deep learning 3D reconstruction multi-view stereo self-attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张彦雯,胡凯,王鹏盛.三维重建算法研究综述[J].南京信息工程大学学报（自然科学版）,2020,12(5):591-602. 被引量：30
2苗兰芳.一个基于多视图立体视觉的三维重建方法[J].浙江师范大学学报（自然科学版）,2013,36(3):241-246. 被引量：4

二级参考文献30

1Goesele M, Curless B, Seitz S M. Multi-view stereo revisited [ C ]//IEEE CVPR. New York : IEEE, 2006 : 2402 -2409.
2Curless B, Levoy M. A volumetric method for building complex models from range images C 1//ACM SIGGRAPH. New Orleans:IEEE, 1996: 303-312.
3Bradley D, Boubekeur T, Heidrich W. Accurate multi-view reconstruction using robust binocular stereo and surface meshing[ C ]//IEEE CVPR. Anchorage : IEEE ,2008 : 1-8.
4Campbell N D,Vogiatzis G, Hernmdez C, et al. Using multiple hypotheses to improve depth-maps for multi-view stereo [ C ]//ECCV. Berlin: Springer-Verlag, 2008 : 766 -779.
5Furukawa Y,Ponce J. Accurate, dense, and robust multi-view stereopsis [ J ]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2010,32 (8) : 1362-1376.
6Lhuillier M, Quan Long. A quasi-delse approach to surface reconstruction from uncalibrated images [ J]. IEEE PAM1,2005,27 (3) :418-433.
7Wu Taipang, Yeung S K, Jia Jiaya, et al. Quasi-dense 3 D reconstruction using tensor-based multi-view stereo [ C ]//2010 IEEE Computer Socie- ty Conference on Computer Vision and Pattern Recognition. San Francisco:IEEE,2010:1482-1489.
8Habbecke M, Kobbelt L. A surface-growing approach to multi-view stereo reconstruction [ C ]//IEEE CVPR Minneapolis. Minnesota: IEEE, 2007:18-23.
9Seitz S M, Dyer C R. Potorealistic scene reconstruction by voxel coloring [ J ]. International Journal of Computer Vision, 1999,35 (2) : 151-173.
10Vogiatzis G, Torr P H S, Cipolla R. Multi-view stereo via volumetric graph-cuts [ C ]//IEEE CVPR. Sandiego : IEEE,2005:391-398.

共引文献32

1邓彬,张宗包.基于变电站机房室内外一体的建模技术研究[J].中国测试,2023,49(S01):158-162.
2王颖,龚烨,尹泓澈,李礼,姚剑.多尺度联合特征点检测和描述网络[J].测绘地理信息,2022,47(S01):167-171.
3尹晓艮,张晓芳,张伟超,李硕丰,贾纪元,臧华平,田勇志,梁二军,刘晓旻.基于光场数字重聚焦的三维重建方法研究[J].光电子．激光,2015,26(5):986-991. 被引量：16
4林思,左小清,张建柱,李勇发,李海强.基于无人机序列图像的三维场景重建[J].河南科学,2016,34(9):1531-1535. 被引量：2
5汤念,余建军,徐红波,郑亮,彭瑞.基于影像匹配的点云模型重建技术对比[J].工程勘察,2021,49(6):62-67.
6王巧丽,徐增波,张玲.基于运动恢复结构三维重建的应用与研究进展[J].毛纺科技,2021,49(7):95-98. 被引量：10
7肖凡.基于多视图立体视觉技术的三维数字岩矿石手标本数据库建设及其在实验教学中的应用[J].中国地质教育,2021,30(3):80-86. 被引量：1
8李志鹏,臧晓敏,胡家昕.基于改进Census变换和引导滤波的立体匹配算法[J].信息与电脑,2021,33(19):68-71.
9牟金震,郝晓龙,朱文山,李爽.非合作目标智能感知技术研究进展与展望[J].中国空间科学技术,2021,41(6):1-16. 被引量：12
10李修华,魏鹏,何嘉西,李民赞,张木清,温标堂.基于Kinect V3深度传感器的田间植株点云配准方法[J].农业工程学报,2021,37(21):45-52. 被引量：6

同被引文献14

1李义双,冯成志,史新广.虚拟三维场景下视听觉地标导航作用差异[J].人类工效学,2021,27(2):27-32. 被引量：2
2张香玉,金晖.VR环境下基于特征并行匹配的多视图三维重建[J].计算机仿真,2021,38(5):307-311. 被引量：3
3朱育正,张亚萍,冯乔生.基于深度学习的单视图彩色三维重建[J].激光与光电子学进展,2021,58(14):199-207. 被引量：8
4霍占强,王勇杰,雒芬,乔应旭.基于超点图网络的三维点云室内场景分割模型[J].计算机工程,2021,47(12):308-315. 被引量：5
5刘青青,毋涛.基于RealSense人体多视角三维重建方法的研究[J].国外电子测量技术,2021,40(10):77-83. 被引量：7
6陈鑫祥,蒲冰鑫,俞建,王瑞胜,钟若飞.基于多视图像点云的建筑物屋顶分割算法研究[J].地理空间信息,2022,20(5):33-37. 被引量：4
7杨硕,谢晓尧,刘嵩.多视图几何轻量级三维重建算法[J].重庆邮电大学学报（自然科学版）,2022,34(6):1005-1012. 被引量：5
8高银花,陈进,季霞.基于虚拟现实技术的光照变化场景三维建模研究[J].激光杂志,2022,43(11):204-209. 被引量：1
9刘国柱,于新.基于深度学习的单视图三维重建方法的研究进展[J].青岛科技大学学报（自然科学版）,2022,43(6):98-108. 被引量：3
10董景,杨仲超,杨雪纯,许丽,张可抒.基于VR虚拟现实技术的变电站智能巡检多场景识别模型研究[J].微型电脑应用,2022,38(12):199-203. 被引量：2

引证文献1

1陈金娥.基于AISI网络的虚拟场景多视图三维重建模型研究[J].桂林航天工业学院学报,2023,28(4):585-591. 被引量：1

二级引证文献1

1刘嘉琪,陈刚.基于多媒体智能三维图像处理系统的设计与实现[J].电脑编程技巧与维护,2024(8):142-144.

1张晓燕,陈祥,郭颖.自适应聚合和代价自学习的多视图立体重建[J].探测与控制学报,2023,45(4):142-149.
2王诗杰,鄢和平,袁嫣红.基于双目立体视觉的电解阴极铜板三维重建研究[J].建模与仿真,2023,12(5):4379-4392.
3郑晓美,王勇青,杜国红,殷少帅.基于希尔伯特变换的三频三步相移结构光三维重建方法[J].建模与仿真,2023,12(5):4437-4448.
4周志强,吴桐,张严辞.基于透视网格的自适应窄带表面粒子提取方法[J].计算机应用研究,2023,40(10):3155-3161.
5鲍国,张书毕,陈强,郑有雷,陈春.基于地面LiDAR的建筑物精细化三维重建及精度分析[J].金属矿山,2023(9):140-144.
6孙伟伦,徐文,胡丹,刘凯.改进的双向结构光编解码算法[J].激光与光电子学进展,2023,60(16):290-295.
7杨阳蕊,朱亚萍,陈思思,刘雪梅,李慧敏.融合群体智能策略的AI链在大坝防汛抢险知识推理中的应用[J].水利学报,2023,54(9):1122-1132. 被引量：1

激光与光电子学进展

2023年第16期

浏览历史

内容加载中请稍等...

基于自注意力机制的多视图三维重建方法被引量：1

参考文献2

二级参考文献30

共引文献32

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制的多视图三维重建方法 被引量：1

参考文献2

二级参考文献30

共引文献32

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制的多视图三维重建方法被引量：1