期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
End-to-End Paired Ambisonic-Binaural Audio Rendering
1
作者 Yin Zhu Qiuqiang Kong +5 位作者 Junjie Shi Shilei Liu Xuzhou Ye Ju-Chiang Wang Hongming Shan Junping Zhang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2024年第2期502-513,共12页
Binaural rendering is of great interest to virtual reality and immersive media. Although humans can naturally use their two ears to perceive the spatial information contained in sounds, it is a challenging task for ma... Binaural rendering is of great interest to virtual reality and immersive media. Although humans can naturally use their two ears to perceive the spatial information contained in sounds, it is a challenging task for machines to achieve binaural rendering since the description of a sound field often requires multiple channels and even the metadata of the sound sources. In addition, the perceived sound varies from person to person even in the same sound field. Previous methods generally rely on individual-dependent head-related transferred function(HRTF)datasets and optimization algorithms that act on HRTFs. In practical applications, there are two major drawbacks to existing methods. The first is a high personalization cost, as traditional methods achieve personalized needs by measuring HRTFs. The second is insufficient accuracy because the optimization goal of traditional methods is to retain another part of information that is more important in perception at the cost of discarding a part of the information. Therefore, it is desirable to develop novel techniques to achieve personalization and accuracy at a low cost. To this end, we focus on the binaural rendering of ambisonic and propose 1) channel-shared encoder and channel-compared attention integrated into neural networks and 2) a loss function quantifying interaural level differences to deal with spatial information. To verify the proposed method, we collect and release the first paired ambisonic-binaural dataset and introduce three metrics to evaluate the content information and spatial information accuracy of the end-to-end methods. Extensive experimental results on the collected dataset demonstrate the superior performance of the proposed method and the shortcomings of previous methods. 展开更多
关键词 Ambisonic ATTENTION binaural rendering neural network
下载PDF
Weakly-Supervised Single-view Dense 3D Point Cloud Reconstruction via Differentiable Renderer 被引量:2
2
作者 Peng Jin Shaoli Liu +4 位作者 Jianhua Liu Hao Huang Linlin Yang Michael Weinmann Reinhard Klein 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2021年第5期195-205,共11页
In recent years,addressing ill-posed problems by leveraging prior knowledge contained in databases on learning techniques has gained much attention.In this paper,we focus on complete three-dimensional(3D)point cloud r... In recent years,addressing ill-posed problems by leveraging prior knowledge contained in databases on learning techniques has gained much attention.In this paper,we focus on complete three-dimensional(3D)point cloud reconstruction based on a single red-green-blue(RGB)image,a task that cannot be approached using classical reconstruction techniques.For this purpose,we used an encoder-decoder framework to encode the RGB information in latent space,and to predict the 3D structure of the considered object from different viewpoints.The individual predictions are combined to yield a common representation that is used in a module combining camera pose estimation and rendering,thereby achieving differentiability with respect to imaging process and the camera pose,and optimization of the two-dimensional prediction error of novel viewpoints.Thus,our method allows end-to-end training and does not require supervision based on additional ground-truth(GT)mask annotations or ground-truth camera pose annotations.Our evaluation of synthetic and real-world data demonstrates the robustness of our approach to appearance changes and self-occlusions,through outperformance of current state-of-the-art methods in terms of accuracy,density,and model completeness. 展开更多
关键词 Point clouds reconstruction Differentiable renderer neural networks Single-view configuration
下载PDF
基于菌群优化Spiking神经网络的渲染时间估计
3
作者 胡博 章毅 蔡柳萍 《南京理工大学学报》 CAS CSCD 北大核心 2023年第2期214-220,共7页
为了提高三维模型渲染时间估计的准确度,采用Spiking神经网络算法进行渲染时间预估。目前,基于Spiking理念的神经网络模型有多种,选择了其中的卷积Spiking神经网络(Convolutional Spike neural network,CSNN)来实现渲染时间计算。首先,... 为了提高三维模型渲染时间估计的准确度,采用Spiking神经网络算法进行渲染时间预估。目前,基于Spiking理念的神经网络模型有多种,选择了其中的卷积Spiking神经网络(Convolutional Spike neural network,CSNN)来实现渲染时间计算。首先,建立了基于CSNN的渲染时间预估模型。通过点火时间序列完成编码,从而触发脉冲响应实现数据传递。其次,利用CSNN的权重、卷积核尺寸、偏置等参数来构建菌群优化(Bacterial foraging optimization,BFO)算法,并以渲染时间预估值和实际值的差值作为适应度函数。通过驱化、繁衍和迁徙操作不断更新菌群个体的适应度值来获得最优个体。最后,以最优参数进行CSNN的渲染时间预估。试验结果表明,通过合理设置BFO算法的引力系数、斥力系数和迁徙概率阈值等参数,BFO+CSNN算法能够获得较高的渲染时间预估准确率。相比于其他渲染时间预估算法,BFO+CSNN算法具备更高的渲染时间预估准鲁棒性。 展开更多
关键词 SPIKing神经网络 渲染时间 菌群优化 卷积神经网络
下载PDF
注意力机制与神经渲染的多视图三维重建算法
4
作者 朱代先 孔浩然 +2 位作者 秋强 刘树林 张亚莉 《电子测量技术》 北大核心 2024年第5期158-166,共9页
针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在... 针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在挑战性区域特征的表征能力以进行鲁棒的特征匹配。其次在代价体正则化3D CNN部分引入注意力机制,使网络注意于代价体中的重要区域以进行平滑处理。另外建立一个神经渲染网络,该网络利用渲染参考损失精确地解析辐射场景表达的几何外观信息,并引入深度一致性损失保持多视图立体网络与神经渲染网络之间的几何一致性,有效地缓解有噪声代价体对多视图立体网络的不利影响。该算法在室内DTU数据集中测试,点云重建的完整性和整体性指标分别为0.289和0.326,与基准方法CasMVSNet相比,分别提升24.9%和8.2%,即使在挑战性区域也得到高质量的重建效果;在室外Tanks and Temples中级数据集中,点云重建的平均F-score为60.31,与方法UCS-Net相比提升9.9%,体现出较强的泛化能力。 展开更多
关键词 多视图立体网络 三维重建 注意力机制 神经渲染
下载PDF
神经辐射场多视图合成技术综述 被引量:1
5
作者 马汉声 祝玉华 +4 位作者 李智慧 阎磊 司艺艺 连一萌 张钰涵 《计算机工程与应用》 CSCD 北大核心 2024年第4期21-38,共18页
如何从图像中渲染出较为真实的虚拟场景一直是计算机图形学与计算机视觉领域的研究目标之一。神经辐射场是一种基于深度神经网络的新兴方法,它通过学习场景中每个点的辐射场来实现较为真实的渲染效果。通过神经辐射场不仅可以生成逼真... 如何从图像中渲染出较为真实的虚拟场景一直是计算机图形学与计算机视觉领域的研究目标之一。神经辐射场是一种基于深度神经网络的新兴方法,它通过学习场景中每个点的辐射场来实现较为真实的渲染效果。通过神经辐射场不仅可以生成逼真的图像,而且可以生成具有真实感的三维场景,在虚拟现实、增强现实和计算机游戏等领域有着广泛的应用前景。然而,其基础模型存在训练效率低、泛化能力差、可解释性不足、易受光照和材质变化影响以及无法处理动态场景等问题,在某些情况下无法获得最佳的渲染结果。大量基于此研究的工作陆续展开,且在效率和精度等方面都取得了出色的成果。为了跟踪该领域最新研究成果,对近年来神经辐射场领域的关键算法进行回顾和综述。首先介绍了神经辐射场的产生背景及原理,对后续关键改进模型进行分类探讨。主要涵盖以下几个方面:对神经辐射场基本模型参数的优化,在渲染速度与推理能力方面的提升,对空间表达和光照能力的改善,针对静态场景相机位姿估计与稀疏视图合成方法的改进,以及在动态场景建模领域的发展。对各种模型的速度与性能进行分类对比与分析,并简要介绍了该领域主要模型评估指标与公开数据集。最后对神经辐射场未来发展趋势进行展望。 展开更多
关键词 神经辐射场(NeRF) 视图合成 神经渲染 场景表达 深度学习 三维重建
下载PDF
基于神经渲染的数字孪生资产快速场景几何建模与检索方法 被引量:2
6
作者 孙志强 郑杭彬 +2 位作者 吕超凡 孙学民 鲍劲松 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1189-1200,共12页
虚实融合是数字孪生技术的典型特征,数字孪生的虚拟场景大多通过几何建模技术来实现。为解决场景几何建模的自动化程度较低。过于依赖人工,导致成本高昂且效率低下的问题,提出一种数字孪生几何场景构建方法。引入神经渲染技术采集物理... 虚实融合是数字孪生技术的典型特征,数字孪生的虚拟场景大多通过几何建模技术来实现。为解决场景几何建模的自动化程度较低。过于依赖人工,导致成本高昂且效率低下的问题,提出一种数字孪生几何场景构建方法。引入神经渲染技术采集物理实体的点云数据,然后设计一种基于深度学习的点云模型与3DCAD模型语义映射的方法,用于基于数字孪生几何模型资产库的3DCAD模型检索。最后建立训练数据集并构建数字孪生几何模型资产库进行实验验证。通过对比实验和退役电池拆解案例验证:与其他的数字孪生场景几何建模方法相比,该方法具有更低的成本和更高的效率。 展开更多
关键词 数字孪生 场景几何建模 神经渲染 模型检索
下载PDF
神经辐射场加速算法综述 被引量:1
7
作者 王稚儒 常远 +1 位作者 鲁鹏 潘成伟 《图学学报》 CSCD 北大核心 2024年第1期1-13,共13页
近年来,神经辐射场(NeRF)已成为计算机图形学和计算机视觉领域中一个重要的研究方向,因其高逼真的视觉合成效果,在真实感渲染、虚拟现实、人体建模、城市地图等领域得到了广泛的应用。NeRF利用神经网络从输入图片集中学习三维场景的隐... 近年来,神经辐射场(NeRF)已成为计算机图形学和计算机视觉领域中一个重要的研究方向,因其高逼真的视觉合成效果,在真实感渲染、虚拟现实、人体建模、城市地图等领域得到了广泛的应用。NeRF利用神经网络从输入图片集中学习三维场景的隐式表征,并合成高逼真的新视角图像。然而原始NeRF模型的训练和推理速度都很慢,难以在真实环境下部署与应用。针对NeRF的加速问题,研究者们从场景建模方法、光线采样策略等方面展开对NeRF进行提速的研究。该类工作大致可分为以下研究方向:烘焙模型、与离散表示方法结合、提高采样效率、利用哈希编码降低MLP网络复杂度、引入场景泛化性、引入深度监督信息和分解方法。通过介绍NeRF模型提出的背景,对上述思路的代表方法的优势与特点进行了讨论和分析,最后总结了NeRF相关工作在加速方面所取得的进展和对于未来的展望。 展开更多
关键词 神经辐射场 视点合成 神经渲染 NeRF加速 深度学习
下载PDF
真实感材质外观的表示和高效渲染技术研究现状及展望
8
作者 陶成之 孙奇 +6 位作者 过洁 袁军平 周辰熙 何雪滟 范之闽 史鹏程 郭延文 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第8期1131-1154,共24页
在虚拟场景的组成中,除了三维几何模型之外最重要的要素就是物体表面的材质外观,对材质进行基于物理的建模和真实感绘制是保证虚拟场景真实感的重要手段.然而,由于现实世界材质外观本身的多样性和复杂性,迄今为止对真实感材质的研究一... 在虚拟场景的组成中,除了三维几何模型之外最重要的要素就是物体表面的材质外观,对材质进行基于物理的建模和真实感绘制是保证虚拟场景真实感的重要手段.然而,由于现实世界材质外观本身的多样性和复杂性,迄今为止对真实感材质的研究一直是计算机图形学领域的热点和难点.文中总结了材质外观的近期相关工作,从材质的表示建模和材质的真实感绘制2大方向展开讨论;进一步,将材质模型分为表达范围广的通用材质模型和针对毛发及布料等材质的特殊材质模型2大类;并将材质绘制方法分为用于离线渲染的点采样优化和用于实时渲染的材质预过滤2种;最后指出材质研究可能的3个发展方向:神经网络材质、波动光学材质和材质的统一标准,为未来该领域的研究提供思路. 展开更多
关键词 真实感绘制 材质 表面微结构 毛发渲染 皮肤渲染 布料渲染 重要性采样 纹理预过滤
下载PDF
面向卫星遥感图像场景重建的神经辐射场方法综述
9
作者 周鑫 王洋 +3 位作者 孙显 林道玉 刘俊义 付琨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期1582-1590,共9页
随着高分辨率卫星遥感图像成为认知地理空间不可或缺的重要手段,卫星遥感图像在城市建图、生态监测和导航等领域发挥着日益重要的作用,利用卫星遥感图像进行地球表面大规模3维重建成为了计算机视觉和摄影测量领域的研究热点。神经辐射场... 随着高分辨率卫星遥感图像成为认知地理空间不可或缺的重要手段,卫星遥感图像在城市建图、生态监测和导航等领域发挥着日益重要的作用,利用卫星遥感图像进行地球表面大规模3维重建成为了计算机视觉和摄影测量领域的研究热点。神经辐射场(NeRF)利用可微渲染学习场景的隐式表示,在复杂场景新视图合成任务中实现了逼真的视觉效果,并在3维场景重建和渲染领域获得了极大的关注。近期的研究主要集中在利用神经辐射场技术,从卫星遥感图像中提取场景表示及其重建。面向卫星遥感图像的神经辐射场方法主要集中在光线空间优化、场景表示优化以及模型高效训练3方面。该文全面归纳了神经辐射场技术在卫星遥感应用中的最新进展。首先介绍神经辐射场技术的基本概念及相关数据集。然后提出一个面向卫星遥感图像的神经辐射场方法分类框架,用于系统性地回顾和整理该技术在卫星遥感领域的研究进展。接着详述了神经辐射场技术在实际卫星遥感场景应用中的相关成果。最后,基于当前研究所面临的问题和挑战进行分析和讨论,同时对未来的发展趋势和研究方向进行了展望。 展开更多
关键词 神经辐射场 卫星遥感图像 神经渲染 隐式表示
下载PDF
基于可逆神经网络的神经辐射场水印
10
作者 孙文权 刘佳 +2 位作者 董炜娜 陈立峰 钮可 《计算机应用研究》 CSCD 北大核心 2024年第6期1840-1844,共5页
针对面向隐式表达的神经辐射场的3D模型的版权问题,将神经辐射场水印的嵌入与提取视为一对图像变换的逆问题,提出了一种利用可逆神经网络水印保护神经辐射场版权方案。利用二维图像的水印技术以实现对三维场景的保护,通过可逆网络中的... 针对面向隐式表达的神经辐射场的3D模型的版权问题,将神经辐射场水印的嵌入与提取视为一对图像变换的逆问题,提出了一种利用可逆神经网络水印保护神经辐射场版权方案。利用二维图像的水印技术以实现对三维场景的保护,通过可逆网络中的正向过程在神经辐射场的训练图像中嵌入水印,利用逆向过程从神经辐射场渲染出的图像提取水印,实现对神经辐射场以及三维场景的版权保护。但神经辐射场在渲染过程中会造成水印信息丢失,为此设计了图像质量增强模块,将渲染图像通过神经网络进行恢复然后再进行水印提取。同时在每个训练图像中均嵌入水印来训练神经辐射场,实现在多个视角下均可提取水印信息。实验结果表明了提出的水印方案达到版权保护的目的,证明方案的可行性。 展开更多
关键词 可逆神经网络 数字水印 神经辐射场 渲染
下载PDF
神经辐射场的研究现状与展望
11
作者 李吉洋 程乐超 +1 位作者 何靖璇 王章野 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第7期995-1013,共19页
基于2D图片的视点合成一直是计算机视觉和计算机图形学领域中的一个关键问题,旨在通过一组目标场景的2D图片合成新视角下的场景图片.神经辐射场作为一种新颖的隐式场景表达方式,因其出色的视觉效果备受研究者的关注.对神经辐射场的发展... 基于2D图片的视点合成一直是计算机视觉和计算机图形学领域中的一个关键问题,旨在通过一组目标场景的2D图片合成新视角下的场景图片.神经辐射场作为一种新颖的隐式场景表达方式,因其出色的视觉效果备受研究者的关注.对神经辐射场的发展历程进行梳理,从理论基础、优化与扩展以及应用等方面介绍了相关研究.在神经辐射场的优化与扩展方面,通过优化网络结构、模型压缩等方式加速训练及渲染过程,还有一些工作致力于降低对输入图片的要求以及提高渲染质量;在应用方面,神经辐射场在人、物及场景的建模中展现出巨大的潜力,并有工作将其扩展到动态场景的表达.此外,神经辐射场与生成式模型结合,可以实现通过文本或者图像来引导三维模型生成的目标.最后,总结了现有研究工作的不足,并指出加速神经辐射场的训练与渲染,优化渲染结果,以及进一步扩展应用场景仍然是未来相关工作的研究方向. 展开更多
关键词 神经辐射场 深度学习 神经渲染 三维重建
下载PDF
基于NeRF的城市实景高精度三维建模技术 被引量:1
12
作者 孙建华 李巍 +2 位作者 袁伟哲 王峰 谷佳铭 《测绘通报》 CSCD 北大核心 2024年第4期129-134,共6页
为了更好地将NeRF高精度三维建模应用于城市实景三维数字化重建,本文基于NeRF技术将大型场景划分为子NeRF,通过在场景内构造多个正八面体初始化多边形网格,并在训练过程中不断优化多边形面的顶点。训练完成后,得到编码器-解码器网络的权... 为了更好地将NeRF高精度三维建模应用于城市实景三维数字化重建,本文基于NeRF技术将大型场景划分为子NeRF,通过在场景内构造多个正八面体初始化多边形网格,并在训练过程中不断优化多边形面的顶点。训练完成后,得到编码器-解码器网络的权重,通过顶点优化对每个独立块进行不同层次的多边形网格细化。从视图范围捕获城市概览的卫星级图像到显示建筑复杂细节的地面级图像变化,构建面向城市细节层级(level-of-detail)和空间覆盖范围的多尺度数据,通过渐进式学习(progressive learning)神经网络体素渲染模型,使用多层感知器(MLP)实现体积密度和颜色的参数化,采用分层抽样方法实现预定义视角近平面和远平面之间光线的排序距离向量,实现大规模场景的实时交互式渲染。然后将GIS与NeRF相融合,为多数据融合、查询、分析、测量、标注和共享等任务提供了全新的解决方案,实现即时、流畅地拖拽、缩放和360°无死角地浏览和观看场景,这种融合可以轻松地将各种数据源整合,应用于城市规划、土地管理和环境监测等三维场景中,以进行空间分析。 展开更多
关键词 三维建模 NeRF神经辐射场 训练 渲染
下载PDF
高清几何缓存多尺度特征融合的渲染超分方法
13
作者 张浩南 过洁 +2 位作者 覃浩宇 傅锡豪 郭延文 《软件学报》 EI CSCD 北大核心 2024年第6期3052-3068,共17页
人们对图像显示设备高分辨率和逼真视觉感知的需求随着现代信息技术的发展日益增长,这对计算机软硬件提出了更高要求,也为渲染技术在性能与工作负载上带来更多挑战.利用深度神经网络等机器学习技术对渲染图像进行质量改进和性能提升成... 人们对图像显示设备高分辨率和逼真视觉感知的需求随着现代信息技术的发展日益增长,这对计算机软硬件提出了更高要求,也为渲染技术在性能与工作负载上带来更多挑战.利用深度神经网络等机器学习技术对渲染图像进行质量改进和性能提升成为了计算机图形学热门的研究方向,其中通过网络推理将低分辨率图像进行上采样获得更加清晰的高分辨率图像是提升图像生成性能并保证高清细节的一个重要途径.而渲染引擎在渲染流程中产生的几何缓存(geometry buffer,G-buffer)包含较多的语义信息,能够帮助网络有效地学习场景信息与特征,从而提升上采样结果的质量.设计一个基于深度神经网络的低分辨率渲染内容的超分方法.除了当前帧的颜色图像,其使用高分辨率的几何缓存来辅助计算并重建超分后的内容细节.所提方法引入一种新的策略来融合高清缓存与低清图像的特征信息,在特定的融合模块中对不同种特征信息进行多尺度融合.实验验证所提出的融合策略和模块的有效性,并且,在和其他图像超分辨率方法的对比中,所提方法体现出明显的优势,尤其是在高清细节保持方面. 展开更多
关键词 神经网络 渲染 图像超分 几何缓存 特征融合
下载PDF
基于零样本学习的单张SAR图像相干斑滤波方法
14
作者 邓均午 李铭典 陈思伟 《信号处理》 CSCD 北大核心 2024年第5期932-943,共12页
相干斑滤波是合成孔径雷达(Synthetic aperture radar,SAR)图像解译重要的预处理步骤。近年来,基于卷积神经网络(Convolutional neural network,CNN)的相干斑滤波方法得到了快速的发展。然而,基于监督学习的滤波方法缺乏无相干斑参考SA... 相干斑滤波是合成孔径雷达(Synthetic aperture radar,SAR)图像解译重要的预处理步骤。近年来,基于卷积神经网络(Convolutional neural network,CNN)的相干斑滤波方法得到了快速的发展。然而,基于监督学习的滤波方法缺乏无相干斑参考SAR图像作为真值,基于自监督学习的滤波方法大多需要同一场景的多时相SAR图像训练网络,但是这些额外的数据集在实际场景中较难获取。此外,自监督学习方法通常需要较大的训练数据集和较深的网络进行相干斑滤波,导致其计算复杂度较高。因此,本文提出了一种基于零样本学习的单张SAR图像相干斑滤波方法。该方法的核心思想是对待测试的单张SAR图像进行子视分解,选取与待测试SAR图像欧式距离最近的子视图像进行配对,理论上证明了使用配对的子视图像自监督训练网络能达到使用无相干斑参考SAR图像监督训练网络的滤波效果。因此,通过设计自监督损失函数快速训练轻量化相干斑滤波网络,将训练好的网络对待测试SAR图像进行滤波。相较于基于监督学习和自监督学习的相干斑滤波方法,本文所提方法不需要无相干斑参考或多时相SAR图像用于模型训练,也不需要额外训练数据,只需使用任意一个轻量化的CNN即可实现相干斑滤波。在Radarsat-2和ALOS-2实测数据上的实验结果表明,本文所提方法的参数量比对比方法低22倍,能更好的实现对匀质区域相干斑的抑制和图像细节的保护。 展开更多
关键词 合成孔径雷达 卷积神经网络 零样本学习 相干斑滤波 子视分解
下载PDF
融合可微分渲染的SAR多视角样本增广
15
作者 贾赫成 蒲欣洋 +2 位作者 王燕妮 符士磊 徐丰 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期457-470,共14页
合成孔径雷达(SAR)因其全天候、全天时的监测能力在民用和军事领域得到广泛应用。近年来,深度学习已被广泛应用于SAR图像自动解译。然而,由于卫星轨道和观测角度的限制,SAR目标样本面临视角覆盖率不全的问题,这为学习型SAR目标检测识别... 合成孔径雷达(SAR)因其全天候、全天时的监测能力在民用和军事领域得到广泛应用。近年来,深度学习已被广泛应用于SAR图像自动解译。然而,由于卫星轨道和观测角度的限制,SAR目标样本面临视角覆盖率不全的问题,这为学习型SAR目标检测识别算法带来了挑战。该文提出一种融合可微分渲染的SAR多视角样本生成方法,结合逆向三维重建和正向渲染技术,通过卷积神经网络(CNN)从少量SAR视角图像中反演目标三维表征,然后利用可微分SAR渲染器(DSR)渲染出更多视角样本,实现样本在角度维的插值。另外,方法的训练过程使用DSR构建目标函数,无需三维真值监督。根据仿真数据的实验结果,该方法能够有效地增加多视角SAR目标图像,并提高小样本条件下典型SAR目标识别率。 展开更多
关键词 合成孔径雷达(SAR) 可微分SAR渲染器(DSR) 卷积神经网络(CNN) 三维重建 多视角样本生成
下载PDF
基于图神经网络与优化采样策略的隐式表面重建方法
16
作者 何涵波 付蔚 +1 位作者 余嘉玮 吴新宇 《自动化应用》 2024年第16期263-265,275,共4页
针对体渲染技术在神经隐式表面重建中常见的细节模糊与局部信息缺失等问题,提出了一种改进的隐式表面重建方法。首先,采用图神经网络(GNN)对不同目标视图进行特征提取,并将这些特征图作为监督信息,引导重建过程。其次,引入一种基于场景... 针对体渲染技术在神经隐式表面重建中常见的细节模糊与局部信息缺失等问题,提出了一种改进的隐式表面重建方法。首先,采用图神经网络(GNN)对不同目标视图进行特征提取,并将这些特征图作为监督信息,引导重建过程。其次,引入一种基于场景几何和光照特征的优化蒙特卡洛路径追踪技术,通过自适应重要性采样策略,优先采样贡献最大的光线路径。最后,利用Omnidata预训练模型提取深度信息和法线信息,对重建过程进行额外的约束。结果表明,与现有技术相比,所提方法在提高表面重建的准确度和视图渲染效果方面表现优异。 展开更多
关键词 神经隐式表面重建 图神经网络 光线采样 体渲染
下载PDF
3D场景渲染技术——神经辐射场的研究
17
作者 韩开 徐娟 《计算机应用研究》 CSCD 北大核心 2024年第8期2252-2260,共9页
神经辐射场(NeRF)是一种面向三维隐式空间建模的深度学习模型,在表示和渲染三维场景领域具有重要价值。然而由于神经辐射场算法训练过程复杂、需要大量的计算资源和时间等,其可用性和实用性受到一定限制,如何针对神经辐射场的痛点问题... 神经辐射场(NeRF)是一种面向三维隐式空间建模的深度学习模型,在表示和渲染三维场景领域具有重要价值。然而由于神经辐射场算法训练过程复杂、需要大量的计算资源和时间等,其可用性和实用性受到一定限制,如何针对神经辐射场的痛点问题进行优化是当前计算机视觉等领域研究的热点之一。此研究旨在对神经辐射场的优化和应用进行全面综述。首先,在深入解析神经辐射场基本原理的基础上,从渲染质量、计算复杂度、位姿等方面对现阶段神经辐射场的优化情况进行概述;其次,列举神经辐射场应用状况,为未来更高效和实用的算法优化设计提供参考;最后,总结神经辐射场的优势与局限性,并提出未来可能的发展方向,以期发挥神经辐射场在三维渲染、场景合成等方面的巨大潜力。 展开更多
关键词 神经辐射场 神经渲染 三维场景 深度学习
下载PDF
AI联合电影渲染技术在放射住培CTA后处理教学中的应用研究
18
作者 张景 沈华伟 +1 位作者 宋亭 麦慧 《中国医学教育技术》 2024年第5期662-666,共5页
目的探讨人工智能(artificial intelligence,AI)联合电影渲染(cinematic rendering,CR)技术在放射住培医师CT血管成像(computed tomography angiography,CTA)后处理教学及影像诊断思维培养中的应用效果。方法选取2021年3月—2023年3月... 目的探讨人工智能(artificial intelligence,AI)联合电影渲染(cinematic rendering,CR)技术在放射住培医师CT血管成像(computed tomography angiography,CTA)后处理教学及影像诊断思维培养中的应用效果。方法选取2021年3月—2023年3月广州医科大学附属第三医院放射科规培学员共33人为研究对象。随机分为对照组(n=17)和试验组(n=16)。对照组采用传统教学模式,试验组采用AI+CR技术的教学模式。教学效果评价采用考试和问卷调查形式。结果试验组学员的理论考核、技能操作、临-影思维成绩(75.00±5.35,85.54±5.49,80.27±4.36)均高于对照组的成绩(71.06±4.08,80.28±7.35,75.67±3.67),差异具有统计学意义(P=0.023,0.027,0.003)。问卷调查结果显示,试验组学员对该教学模式的满意度(62.5%)高于传统教学的对照组(17.6%),差异具有统计学意义(P=0.013);同时,试验组学员反馈该教学模式在提升学习兴趣、提高学习效率、改善图像质量以及提高专业水平方面有一定助力。结论将前沿的AI联合CR技术引入放射住培医师CTA后处理培训中,有助于增强学习体验感,培养学员“临影结合”的影像思维,提升专业知识的学习效率。 展开更多
关键词 人工智能 电影渲染 CTA 规培医师 教学评价
下载PDF
基于深度学习的半监督语义分割综述
19
作者 孙博远 刘夏雷 侯淇彬 《北京交通大学学报》 CAS CSCD 北大核心 2024年第2期10-22,共13页
语义分割在诸多现实领域有丰富的应用,但是其训练过程需要大量像素级别标注图像,训练成本较高.半监督语义分割可以在仅使用少量标注图像和大量无标注图像的情况下进行训练,更贴近现实场景,受到国内外的广泛关注.本文分析和总结了近年基... 语义分割在诸多现实领域有丰富的应用,但是其训练过程需要大量像素级别标注图像,训练成本较高.半监督语义分割可以在仅使用少量标注图像和大量无标注图像的情况下进行训练,更贴近现实场景,受到国内外的广泛关注.本文分析和总结了近年基于深度学习的半监督语义分割的相关研究,对现有方法进行分类讨论.首先,介绍了半监督语义分割中使用最广泛的基准数据集,以及常用的实验设定和评价指标.其次,从基于对抗学习、基于多网络架构、基于多阶段架构以及单阶段端到端架构4个方面对基于深度学习的半监督语义分割算法进行了梳理和归类.再次,在不同数据集主流基准下对多种代表性方法进行公平对比实验.最后,从基础模型结构、单阶段端到端方法的潜在能力、有标签数据的长尾分布问题以及与先进大模型结合等方面,对半监督语义分割任务面临的挑战以及可能的未来研究方向进行了讨论. 展开更多
关键词 半监督语义分割 卷积神经网络 对抗学习 自学习
下载PDF
基于神经辐射场的室外去遮挡快速重建算法
20
作者 侯立培 陈壹华 《微电子学与计算机》 2024年第5期31-39,共9页
三维重建和渲染是虚拟现实的关键技术,如何提高三维重建的质量并降低三维重建的成本是虚拟现实的重要问题。神经辐射场可以在保证高质量重建的同时降低重建的门槛,使得用户仅仅通过手机相机等移动设备采集多视角图像,就可以重建出照片... 三维重建和渲染是虚拟现实的关键技术,如何提高三维重建的质量并降低三维重建的成本是虚拟现实的重要问题。神经辐射场可以在保证高质量重建的同时降低重建的门槛,使得用户仅仅通过手机相机等移动设备采集多视角图像,就可以重建出照片级真实度的物体和场景。然而神经辐射场的重建效果依赖于实验室理想环境中采集的数据。在真实室外环境中,重建场景中会出现暂态物体遮挡,并且用户对重建的速度有较高的要求,这两点神经辐射场均不能很好地处理。针对这两点局限,提出了一种神经辐射场的改进模型FoRF,结合多分辨率哈希编码并修改网络结构以加快建模速度,引入暂态嵌入以处理神经辐射场无法处理暂态物体遮挡的问题。分别在开源数据集、手机拍摄的数据集上进行了实验。实验结果证明了本文模型能够使用移动设备采集的图像重建场景,并具有快速建模和消除暂态物体遮挡对重建结果影响的能力。 展开更多
关键词 神经辐射场 三维重建 渲染 深度学习
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部