期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
Line Matching Across Views Based on Multiple View Stereo 被引量:4
1
作者 FU Kang-Ping SHEN Shu-Han HU Zhan-Yi 《自动化学报》 EI CSCD 北大核心 2014年第8期1680-1689,共10页
关键词 多视点 立体 DBSCAN算法 配基 线路 浏览 图形匹配 匹配方法
下载PDF
基于自适应聚合循环递归的稠密点云重建网络
2
作者 王江安 黄乐 +2 位作者 庞大为 秦林珍 梁温茜 《图学学报》 CSCD 北大核心 2024年第1期230-239,共10页
为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多... 为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多尺度循环递归残差的特征提取模块,聚合上下文语义信息,以解决弱纹理或无纹理区域特征提取难的问题。在代价体正则化部分,提出一种残差正则化模块,该模块在略微增加内存消耗的前提下,提高了3D CNN提取和聚合上下文语意的能力。实验结果表明,提出的方法在DTU数据集上的综合指标排名靠前,在重建细节上有着更好的体现,且在BlendedMVS数据集上生成了不错的深度图和点云结果,此外网络还在自采集的大规模高分辨率数据集上进行了泛化测试。归功于由粗到细的多阶段思想和我们提出的模块,网络在生成高准确性和完整性深度图的同时,还能进行高分辨率重建以适用于实际问题。 展开更多
关键词 深度学习 计算机视觉 三维重建 稠密重建 多视图立体 递归神经网络
下载PDF
注意力机制与神经渲染的多视图三维重建算法
3
作者 朱代先 孔浩然 +2 位作者 秋强 刘树林 张亚莉 《电子测量技术》 北大核心 2024年第5期158-166,共9页
针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在... 针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在挑战性区域特征的表征能力以进行鲁棒的特征匹配。其次在代价体正则化3D CNN部分引入注意力机制,使网络注意于代价体中的重要区域以进行平滑处理。另外建立一个神经渲染网络,该网络利用渲染参考损失精确地解析辐射场景表达的几何外观信息,并引入深度一致性损失保持多视图立体网络与神经渲染网络之间的几何一致性,有效地缓解有噪声代价体对多视图立体网络的不利影响。该算法在室内DTU数据集中测试,点云重建的完整性和整体性指标分别为0.289和0.326,与基准方法CasMVSNet相比,分别提升24.9%和8.2%,即使在挑战性区域也得到高质量的重建效果;在室外Tanks and Temples中级数据集中,点云重建的平均F-score为60.31,与方法UCS-Net相比提升9.9%,体现出较强的泛化能力。 展开更多
关键词 多视图立体网络 三维重建 注意力机制 神经渲染
下载PDF
语义增强的多视立体视觉方法
4
作者 韩燮 王若蓝 赵融 《计算机技术与发展》 2024年第3期41-48,共8页
针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvL... 针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvLSTM网络结构,对多个卷积层提取的特征图进行预测,得到融合每层语义信息的特征图,有助于在空间上层层抽取图像的高级特征时,利用长短期记忆神经网络结构的记忆功能来增强高层特征图中的低级语义信息,提高了弱纹理区域的重建效果,提高了3D重建的鲁棒性和完整性;其次,提出了一种可见性网络,在灰度图的基础上,通过突出特征图上可见区域的特征,加深了可见区域在特征图中的影响,有助于提高三维重建效果;最后,提取图像的纹理信息,并进入ConvLSTM语义聚合网络提取深层次特征,提高了弱纹理区域的重建效果。与主流的多视立体视觉重建方法相比,重建效果较好。 展开更多
关键词 三维重建 深度学习 多视立体视觉 特征提取 语义聚合网络
下载PDF
基于混合结构的多视图三维场景重建
5
作者 周婧怡 张栖桐 冯结青 《图学学报》 CSCD 北大核心 2024年第1期199-208,共10页
基于PatchMatch的多视图高效和高精度三维重建一直是一个挑战性问题。红黑棋盘格模式的传播方式并行计算效率高,但对应的视图选择策略精度较差;基于马尔可夫链的视图选择策略能获取更为准确的匹配结果,但算法并行度较低。为了达成场景... 基于PatchMatch的多视图高效和高精度三维重建一直是一个挑战性问题。红黑棋盘格模式的传播方式并行计算效率高,但对应的视图选择策略精度较差;基于马尔可夫链的视图选择策略能获取更为准确的匹配结果,但算法并行度较低。为了达成场景重建质量与重建时间的平衡,本文提出了一种基于混合结构的多视图三维重建算法,在第一阶段采用沿行/列并行的传播策略和马尔可夫链式的视图选择策略,得到质量较高的初始深度图,并通过引入多层次处理提升弱纹理区域的重建质量;在第二阶段采用棋盘格式传播方式和基于投票的视图选择策略提高计算效率,缩短重建所需时间。通过在Strecha和ETH3D数据集上进行了大量实验和对比表明,本文算法在不降低计算精度的前提下,计算效率提高2.5倍以上。 展开更多
关键词 三维重建 多视图立体匹配 视图选择 传播策略 多层次处理
下载PDF
基于注意力权重机制和引导成本体积激励的三维重建多视图立体网络算法研究
6
作者 郭晓栋 贺平安 代琦 《软件工程》 2024年第8期30-36,共7页
针对基于成本体积金字塔的多视图立体网络在初始构建成本体积时存在深度预测误差大的问题,提出了一种利用注意力权重特征图补充三维卷积的方法。该方法引入注意力机制关注感受野空间特征,计算源视角图像特征金字塔的注意力权重,将其加... 针对基于成本体积金字塔的多视图立体网络在初始构建成本体积时存在深度预测误差大的问题,提出了一种利用注意力权重特征图补充三维卷积的方法。该方法引入注意力机制关注感受野空间特征,计算源视角图像特征金字塔的注意力权重,将其加权到原始特征图中,同时设计引导成本体积激励模块,通过特征图丰富三维卷积。在DTU(Danish Test of Urban Competencies)基准数据集上的结果显示,该方法表现很好,准确度达到了0.291,相较于CVPMVSNET(Cost Volume Pyramid Based Depth Inference for Multi-View Stereo),整体精度提高了6.55%,表明该模型的改进有效。 展开更多
关键词 多视图立体 三维重建 注意力机制 成本体积
下载PDF
结合局部自注意力和深度优化的多视图重建
7
作者 叶森辉 王蕾 《计算机与现代化》 2024年第5期92-98,共7页
针对多视图三维重建中存在的内存和时间消耗过大、高分辨率重建完整性差等问题,提出一种基于深度学习的多视图重建网络。网络由特征提取模块、级联的Patchmatch模块和深度图优化模块组成。首先,设计U型的特征提取模块,提取多阶段特征图... 针对多视图三维重建中存在的内存和时间消耗过大、高分辨率重建完整性差等问题,提出一种基于深度学习的多视图重建网络。网络由特征提取模块、级联的Patchmatch模块和深度图优化模块组成。首先,设计U型的特征提取模块,提取多阶段特征图,并在每个阶段引入相对位置编码的局部自注意力层,捕捉图像中的局部细节和全局上下文,提升网络特征提取性能。其次,设计深度残差网络,通过密集连接和残差结构对特征进行融合,充分利用彩色图像先验知识来约束深度图,提升深度估计的准确性。在公开数据集DTU(Technical University of Denmark)上进行测试,实验结果表明,三维重建质量到了有效的提升,与PatchmatchNet相比在完整性上提升了6.1%,在整体性上提升了2.5%,与其他的SOTA(State-Of-The-Art)方法相比,在完整性和整体性上都得到了较大提升。 展开更多
关键词 深度学习 三维重建 局部自注意力 多视图立体 深度估计
下载PDF
融合隐式渲染与显式建模的三维重建方法 被引量:1
8
作者 唐天俊 《电脑与信息技术》 2024年第1期78-81,85,共5页
针对多视图三维重建易出现纹理缺失、大面积空洞的挑战,提出了融合隐式渲染与显式建模的三维重建方法。首先输入多视图,以增量式运动重建算法恢复相机参数,生成精密稀疏点云;随后,以融合自注意力机制的深度全连接网络预测体渲染密度及RG... 针对多视图三维重建易出现纹理缺失、大面积空洞的挑战,提出了融合隐式渲染与显式建模的三维重建方法。首先输入多视图,以增量式运动重建算法恢复相机参数,生成精密稀疏点云;随后,以融合自注意力机制的深度全连接网络预测体渲染密度及RGB颜色;然后,分层采样光线样本点以求解其体渲染积分,以积分结果构建损失函数进行参数优化,体渲染生成三维隐式表达,存储于神经网络中;最后,以显式重建等值面提取算法实现三维重建。以DTU数据集进行实验验证,结果表明:在DTU数据集Scan16与Scan19中,该方法平均整体精度达到0.403 mm,相较于经典显式重建模型,所建模型空洞更小,细节更突出,对实景三维、虚拟现实具有一定的参考价值。 展开更多
关键词 三维重建 多视图立体 显式重建 隐式渲染 全连接网络
下载PDF
基于深度学习的多视图立体重建方法综述 被引量:4
9
作者 鄢化彪 徐方奇 +2 位作者 黄绿娥 刘词波 林初欣 《光学精密工程》 EI CAS CSCD 北大核心 2023年第16期2444-2464,共21页
多视图立体重建(Multi-view stereo Reconstruction,MVS Reconstruction)的目标是根据一组已知摄像机参数的多视角图像来重建场景的三维模型,是近年来三维重建的一类主流方法。本文针对最新的近百个基于深度学习的MVS方法做了较为系统... 多视图立体重建(Multi-view stereo Reconstruction,MVS Reconstruction)的目标是根据一组已知摄像机参数的多视角图像来重建场景的三维模型,是近年来三维重建的一类主流方法。本文针对最新的近百个基于深度学习的MVS方法做了较为系统的算法评估对比。首先,对现有的基于监督学习的MVS方法,按照特征提取、代价体构建、代价体正则化和深度回归的重建流程对各算法进行梳理,重点对代价体构建和正则化这两阶段的改进策略进行归纳总结,对于无监督的MVS方法,主要分析各算法损失项的设计,并按照其训练方式进行分类;其次,总结了MVS方法常用的实验数据集及其对应的性能评价指标,进一步研究特征金字塔结构、注意力机制、由粗到精等策略的引入对MVS网络性能的影响;此外,介绍了MVS方法的具体应用场景,包括数字孪生、自动驾驶、机器人技术、遗产保护、生物科学等领域;最后,提出关于MVS改进方向的建议,并对多视图三维重建未来的技术难点与研究方向进行探讨。 展开更多
关键词 多视图立体 三维重建 深度学习 深度估计 单应性变换
下载PDF
室外动态场景图的构建及其三维重建方法研究 被引量:1
10
作者 李健 康景尧 +1 位作者 杨钧 何斌 《陕西科技大学学报》 北大核心 2023年第2期147-154,共8页
合理有效的表示空间和场景语义信息是计算机视觉高级任务的基础之一.目前多数场景表示工作都是基于室内静态环境展开的,对室外场景表示时,存在三维建模结果易受到光照等干扰以及分层表示的属性、结构不适用的问题.故提出了一种针对室外... 合理有效的表示空间和场景语义信息是计算机视觉高级任务的基础之一.目前多数场景表示工作都是基于室内静态环境展开的,对室外场景表示时,存在三维建模结果易受到光照等干扰以及分层表示的属性、结构不适用的问题.故提出了一种针对室外环境的空间感知统一表示——室外3D动态场景图,根据室外场景中对象的不同尺度、种类等,对分层的属性及逻辑进行改进.特别针对现有三维重建方法易受到室外环境干扰的问题,结合深度特征度量改进稀疏重建中关键点调整和束调整步骤,通过改进后的关键点位置和相机位姿提高稠密重建的结果.在ETH3D数据集与自采室外图像上进行三维重建实验,并从准确率、完整率以及F1分数等指标上与其他多视几何方法进行了对比.实验结果表明,所提方法能够更精确的重建室外场景,并且在光照等室外条件不理想情况下重建效果更好. 展开更多
关键词 场景理解 室外3D动态场景图 室外三维重建 运动恢复结构 多视图立体
下载PDF
结合注意力机制与路径聚合的多视图三维重建 被引量:1
11
作者 王云艳 朱镇中 熊超 《重庆理工大学学报(自然科学)》 北大核心 2023年第10期127-135,共9页
目前基于学习的多视图三维重建研究已经取得了显著成果,但依然存在特征提取不完全和成本代价体之间相关性差的问题,从而导致重建精度不高。针对这一问题,设计了一种级联网络PAA-MVSNet。为了获得输入图像更加完整和准确的特征信息,该模... 目前基于学习的多视图三维重建研究已经取得了显著成果,但依然存在特征提取不完全和成本代价体之间相关性差的问题,从而导致重建精度不高。针对这一问题,设计了一种级联网络PAA-MVSNet。为了获得输入图像更加完整和准确的特征信息,该模型采用了“自顶向下”的特征提取方法,在不同尺度上进行特征提取,并将这些特征进行拼接,最后输出3个不同尺度的特征层;此外,引入改进的SE注意力模块优化三维代价体正则化过程,增强了代价体成本体积之间的相关性,提高了重建的精度和完整性。在DTU数据集上和基准网络CasMVSNet相比,该模型的准确性误差和完整性误差指标分别降低了5%和1.4%,且相较于其他模型均有不同程度提升。此外Tanks and Temples数据集上的实验结果表明,该模型有很好的泛化性。提出的基于路径聚合的特征提取模块和注意力优化代价体正则化模块均取得了效果,在重建精度上相比于其他模型都有一定的提升,验证了该模型的有效性。 展开更多
关键词 深度学习 多视图立体匹配 路径聚合 SE+模块
下载PDF
基于MVSNet多视角立体深度学习的储罐在位体积测量方法研究
12
作者 刘桂雄 肖天歌 +1 位作者 陈国宇 黄坚 《中国测试》 CAS 北大核心 2023年第1期26-30,49,共6页
针对目前储罐在位体积测量需求大、移位测量困难的问题,该文提出一种基于MVSNet多视角立体深度学习的储罐在位体积测量方法。首先,提出面向在位储罐体积测量的MVSNet深度预测改进多视图立体视觉方法,结合基于增量式运动恢复结构的储罐... 针对目前储罐在位体积测量需求大、移位测量困难的问题,该文提出一种基于MVSNet多视角立体深度学习的储罐在位体积测量方法。首先,提出面向在位储罐体积测量的MVSNet深度预测改进多视图立体视觉方法,结合基于增量式运动恢复结构的储罐显著特征稀疏重建与相机姿态计算技术、基于MVSNet深度学习深度预测技术,获得储罐体积测量关键结构的稠密三维点云;然后,提出基于立体几何拟合在位储罐体积测量方法,旋转储罐点云与地面配准,并基于法线信息双阈值约束点云拟合储罐圆形拓扑结构,实现储罐体积测量。在2种储罐上进行初步实验,结果表明:该文方法提取到的高质量储罐点云数量比经典COLMAP框架分别增加15.6%、13.2%,点云提取时间分别缩短34.7%、39.2%,满足储罐在位体积测量需求。 展开更多
关键词 储罐 体积测量 深度学习 多视图立体视觉 MVSNet
下载PDF
基于多视角自动成像系统的作物三维点云重建策略优化 被引量:3
13
作者 李百明 吴茜 +7 位作者 吴劼 张美娜 李华勇 于堃 曹静 张伟欣 曹宏鑫 张文宇 《农业工程学报》 EI CAS CSCD 北大核心 2023年第9期161-171,共11页
为满足高通量作物表型分析需求,提升三维点云重建效率和精度,该研究针对不同作物、不同生育时期、不同植株部位(地上部和根系),基于研发的多视角自动成像系统和SFM(structure from motion)-MVS(multi-view stereo)算法,采用不同视角和... 为满足高通量作物表型分析需求,提升三维点云重建效率和精度,该研究针对不同作物、不同生育时期、不同植株部位(地上部和根系),基于研发的多视角自动成像系统和SFM(structure from motion)-MVS(multi-view stereo)算法,采用不同视角和不同相机数获取的图像重建作物三维点云,通过重建效率和精度(Hausdorff距离)评估,以及基于点云提取表型参数(株高、幅宽、凸包体积和总表面积)的可靠性评价,优化作物三维点云重建策略。结果显示,对于结构相对稀松、遮挡较少的盆栽植株(苗期、蕾薹期、盛花期、成熟期油菜)、结构相对紧凑、遮挡较多的植株地上部(花铃期棉花、抽穗期水稻、拔节期和灌浆期小麦)以及器官密集、遮挡严重且有较多细长结构的地上部和根系(分蘖期小麦和成熟期水稻地上部、成熟期玉米和油菜根系),分别采用3~4、6和10个相机为其最优重建策略(Hausdorff距离小于或接近0.20 cm,且重建时长和Hausdorff距离归一化值之和最小)。采用不少于4个相机获取的图像重建作物三维点云,可提取较为可靠的表型参数(决定系数R2>0.90,相对均方根误差RRMSE≤9%)。该研究提出的最优重建策略平衡了自动成像系统构建成本、三维重建效率和精度以及适用植株复杂程度,为实现多种作物高效、低成本、高精度三维重建和表型参数提取提供了重要依据。 展开更多
关键词 植物 表型 多视角立体视觉 图像自动采集 三维重建 点云模型
下载PDF
融合粗粒度代价体及双边网格的轻量级多视图三维重建 被引量:1
14
作者 张啸 董红斌 《计算机科学》 CSCD 北大核心 2023年第8期125-132,共8页
针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法内存消耗过大、推理速度慢,以及对病态区域重建效果不佳的问题,提出了一种基于双边网格和融合代价体的轻量级级联的MVS重建网络。首先利用基于双边网格的代价体上采样模块... 针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法内存消耗过大、推理速度慢,以及对病态区域重建效果不佳的问题,提出了一种基于双边网格和融合代价体的轻量级级联的MVS重建网络。首先利用基于双边网格的代价体上采样模块将较低分辨率代价体高效地恢复成高分辨率代价体。随着采用轻量级的动态区域卷积和粗粒度代价体融合模块,提升网络对病态区域特征的表示能力以及对场景整体信息和结构信息的感知能力。实验结果表明,该网络在DTU数据集以及Tanks and Temples数据集上均取得了具有竞争性的结果,并且在内存消耗以及推理速度上都显著优于其他方法。 展开更多
关键词 三维重建 多视图立体 深度学习 双边网格 轻量级
下载PDF
融合梯度和高斯过程回归的多视图重建方法 被引量:1
15
作者 王若蓝 赵融 韩燮 《微电子学与计算机》 2023年第3期37-45,共9页
针对使用深度神经网络进行多视角图像三维重建时存在特征图对光照变化敏感以及重建不完整的问题,提出了一种融合梯度和高斯过程回归的多视图重建方法.首先,针对光照变化影响提取特征的问题,设计一个融合梯度的特征提取网络.通过对图像... 针对使用深度神经网络进行多视角图像三维重建时存在特征图对光照变化敏感以及重建不完整的问题,提出了一种融合梯度和高斯过程回归的多视图重建方法.首先,针对光照变化影响提取特征的问题,设计一个融合梯度的特征提取网络.通过对图像进行独立的梯度计算并在梯度与原图像的基础上使用卷积神经网络提取特征,提高了梯度信息在特征图中的彩响力,增强了特征图对光照变化因素影响的抑制力.其次,针对多视图重建中特征提取步骤只关注当前视图而没有考虑视图间的潜在空间关系的问题,提出一个融合高斯过程回归算法的视图特征增强模块,有效地增益了视图间相关信息对多视立体视觉重建任务的影响,提高了多视立体视觉重建结果的完整度.最后,通过衡量参考图像与相邻图像特征体之间的匹配程度计算不同视图对Costvolume的贡献度,重新构建符合视觉感知的CostVolume.在DTU和Tanks and Temples数据集上进行实验,结果表明,与主流的多视立体视觉重建方法相比,该方法在三维重建的完整度方面有较大提升,并且拥有良好的泛化性. 展开更多
关键词 多视立体视觉 高斯过程回归 深度估计 深度学习
下载PDF
基于边缘辅助极线Transformer的多视角场景重建
16
作者 童伟 张苗苗 +2 位作者 李东方 吴奇 宋爱国 《电子与信息学报》 EI CSCD 北大核心 2023年第10期3483-3491,共9页
基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断... 基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断方法仍需要较高的深度采样率,并且在静态或预先设定的范围内采样深度值,容易在物体边界以及光照遮挡等区域产生错误的深度推断。为了缓解这些问题,该文提出一种基于边缘辅助极线Transformer的密集深度推断模型。与现有工作相比,具体改进如下:将深度回归转换为多深度值分类进行求解,在有限的深度采样率和GPU占用下保证了推断精度;设计一种极线Transformer模块提高跨视角代价体聚合的可靠性,并引入边缘检测分支约束边缘特征在极线方向的一致性;为了提高弱纹理区域的精度,设计了基于概率成本体积的动态深度范围采样机制。与主流的方法在公开的数据集上进行了综合对比,实验结果表明所提模型能够在有限的显存占用下重建出稠密准确的3D场景。特别地,相比于Cas-MVSNet,所提模型的显存占用降低了35%,深度采样率降低约50%,DTU数据集的综合误差从0.355降低至0.325。 展开更多
关键词 多视角场景重建 多视角立体几何 深度估计 极线几何 TRANSFORMER
下载PDF
基于自适应空间稀疏化的高效多视图立体匹配
17
作者 周晓清 王翔 +1 位作者 郑锦 百晓 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3079-3091,共13页
针对多视图立体匹配中构建和聚合匹配代价体时计算复杂度高的问题,现有研究通常采用级联架构或迭代优化方法.然而这些方法仍面临两个亟待解决的挑战:级联架构在精细阶段缩小了深度采样范围,导致深度不连续区域可能陷入低分辨率的错误估... 针对多视图立体匹配中构建和聚合匹配代价体时计算复杂度高的问题,现有研究通常采用级联架构或迭代优化方法.然而这些方法仍面临两个亟待解决的挑战:级联架构在精细阶段缩小了深度采样范围,导致深度不连续区域可能陷入低分辨率的错误估计;而迭代优化网络的推理时间随迭代次数线性增长,难以满足实时系统需求.为此,本文提出一种基于自适应空间稀疏化的高效多视图立体匹配网络.我们提出一种稀疏匹配代价体构建方法,通过在完整深度范围内稀疏采样,在降低计算复杂度的同时保持了网络对深度不连续区域的建模能力.同时,我们提出一种稀疏迭代优化方法,在迭代中通过自适应变分Dropout逐步剪枝深度值已收敛的区域,使推理时间随迭代次数亚线性增长.在DTU和Tanks&Temples公共数据集上的实验结果表明,本文方法的推理速度相比CasMVSNet和PatchmatchNet分别快1.2倍和0.35倍,同时点云重建效果优异,边缘伪影显著减少,且泛化能力表现出色. 展开更多
关键词 多视图立体 三维重建 深度估计 稀疏神经网络 循环神经网络 TRANSFORMER
下载PDF
面向嵌入式平台多视图立体视觉深度感知
18
作者 单兵 胡益民 +1 位作者 张龙 李加东 《计算机系统应用》 2023年第5期105-111,共7页
针对目前基于神经网络的多视图立体视觉(multi-view stereo,MVS)深度估计算法存在参数量大、内存消耗严重,难以满足当下低算力嵌入式平台的需求.提出基于MVS2D极线注意力机制与MobileNetV3-Small的MVS深度感知网络(Mobile-MVS2D).该网... 针对目前基于神经网络的多视图立体视觉(multi-view stereo,MVS)深度估计算法存在参数量大、内存消耗严重,难以满足当下低算力嵌入式平台的需求.提出基于MVS2D极线注意力机制与MobileNetV3-Small的MVS深度感知网络(Mobile-MVS2D).该网络采用编码器-解码器的结构,使用MobileNetV3-Small网络进行编码特征提取,对源图像与参考图像之间不同特征层的尺度信息耦合采用极线注意力机制,解码阶段引入SE-Net与跳跃连接扩展解码特征细节,提升预测精度.实验结果表明,提出的模型在ScanNet数据集中在深度图的评价指标中展现较高的精度.在与视觉SLAM结合下可以展现出较准确的三维重建效果,具有较好的鲁棒性.在Jeston Xavier NX上推理精度为Float16尺寸为640×480的图片组,仅需0.17 s,GPU消耗仅需1 GB,能够满足低算力嵌入式平台的需求. 展开更多
关键词 多视图立体视觉 嵌入式 注意力机制 三维重建
下载PDF
基于胶囊卷积网络的多视图三维重建 被引量:2
19
作者 胡荣林 付浩志 +2 位作者 何旭琴 张新新 陆文豪 《南京师范大学学报(工程技术版)》 CAS 2023年第1期46-55,92,共11页
从深度神经网络对重建效果影响的角度,提出了基于胶囊卷积网络的多视图三维重建模型Caps-MVSNet,包括特征提取、构建代价体、代价体正则化、回归深度图和细化深度图5个阶段.提出了FENet-T特征提取网络和3D-CapsCNN网络,并分别应用于模... 从深度神经网络对重建效果影响的角度,提出了基于胶囊卷积网络的多视图三维重建模型Caps-MVSNet,包括特征提取、构建代价体、代价体正则化、回归深度图和细化深度图5个阶段.提出了FENet-T特征提取网络和3D-CapsCNN网络,并分别应用于模型的特征提取阶段和代价体正则化阶段.其中,FENet-T利用高效的Block计数比率以及大尺度空洞卷积和分组卷积提高网络的特征提取效率.3D-CapsCNN使用比卷积神经网络更强空间表示能力的3D胶囊网络来正则化代价体.Caps-MVSNet在DTU数据集上完成了效果测试,结果表明,与先前主流重建方法相比该模型在完整性上达到了最优结果,在准确性、整体性上均取得较大提升.另外,与基准模型MVSNet相比,该模型在准确性、整体性和完整性上分别提高3.3%、4.9%和8.2%,参数量减少3.3%. 展开更多
关键词 特征提取网络 3D胶囊网络 空洞卷积 分组卷积 多视立体匹配
下载PDF
自适应聚合和代价自学习的多视图立体重建
20
作者 张晓燕 陈祥 郭颖 《探测与控制学报》 CSCD 北大核心 2023年第4期142-149,共8页
近年来,基于卷积神经网络的多视图立体(MVS)重建应用广泛,可依然存在重建结果整体性和完整性不理想问题,对多视图三维重建中的特征提取模块和匹配代价体优化模块进行改进,提出一种自适应聚合和代价自学习的多视图立体重建方法。首先,从... 近年来,基于卷积神经网络的多视图立体(MVS)重建应用广泛,可依然存在重建结果整体性和完整性不理想问题,对多视图三维重建中的特征提取模块和匹配代价体优化模块进行改进,提出一种自适应聚合和代价自学习的多视图立体重建方法。首先,从输入图像中提取不同尺度图像特征,通过可变性卷积把不同尺度图像特征自适应聚合,以提高特征提取的准确度和丰富度;然后,通过可微分单应性变换构建匹配代价并进行正则化,再通过代价自学习模块进一步优化,进而得出每个像素在不同深度假设平面的概率值;最后,将深度假设平面和概率值加权求和得到最终的深度图。经过在DTU数据集上进行测试,与现有的基准方法MVSNet相比,整体性提高了3.0%,完整性提高了10.7%,得到了质量更优的三维重建结果。 展开更多
关键词 多视图立体 自适应聚合 代价自学习 可变形卷积
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部