期刊文献+

基于自注意力网络的多视角立体重建

Multi-view Stereo Reconstruction Based on Self-attention Network
下载PDF
导出
摘要 为了缓解多视图立体(multi-view stereo,MVS)重建模型缺乏对图像的整体理解以及深度信息的关联未有效利用,而只关注图像局部相关性的信息,本文提出一个动态尺度特征提取网络,该网络由粗到细的级联结构输出特征以及Transformer注意力机制的方法有效地建立多视图深度相关性,适用于场景深度推断及三维重建。模型在DTU(Technical University of Denmark)公开数据集上测试,与CasMVSNet相比,重建的整体性提升6.6%。实验表明,其模型在完整性和准确性指标上较其他基于深度学习方法有一定的提升,取得较好的三维重建效果。 In order to alleviate the lack of overall understanding of the image and the ineffective use of the depth information in the MVS(multi-view stereo)reconstruction model,only the local correlation information of the image is concerned.A dynamic scale feature extraction network is used to effectively establish multi-view depth correlation by coarse-to-fine cascade structure output features and Transformer attention mechanism.The model is used for scene depth inference and 3D reconstruction.The overall of the model in the DTU(Technical University of Denmark)public data set can increase by 6.6%,which is better than the CasMVSNet reconstruction models.Experiments show that the integrity and accuracy of the model are improved compared with other methods,and better 3D reconstruction results are obtained.
作者 李秋怡 徐长波 赵梓平 LI Qiuyi;XU Changbo;ZHAO Ziping(Beijing Institute of Graphic Communication,Beijing 102600,China)
机构地区 北京印刷学院
出处 《北京印刷学院学报》 2023年第12期48-53,共6页 Journal of Beijing Institute of Graphic Communication
基金 北京市教育委员会科学研究计划项目资助(KM202210015001) 北京市教育委员会科学研究计划项目资助(KM201710015006)研究成果。
关键词 三维重建 深度学习 特征提取 自注意力网络 three-dimensional reconstruction deep learning feature extraction self-attention network
  • 相关文献

参考文献1

二级参考文献9

共引文献34

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部