期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于梯度自适应光照模型的统一计算设备构架实时体绘制技术研究
1
作者 龚剑 贠照强 +1 位作者 秦安 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2010年第9期2156-2160,共5页
医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模... 医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模型中环境光等参数根据体素梯度自动调整;同时采用统一计算设备构架(Compute Unified Device Architecture)技术对算法进行加速。实验结果表明,该方法在保证实时交互的同时,能够达到保留组织上下文信息的效果。 展开更多
关键词 体绘制 统一计算设备构架 光照模型 GPU
下载PDF
CUDA并行计算的应用研究 被引量:43
2
作者 董荦 葛万成 陈康力 《信息技术》 2010年第4期11-15,共5页
统一设备架构(CUDA)是NVIDIA公司提出的一个基于GPU通用计算的开发环境,它针对GPU多处理单元的特性,通过并行计算提高大规模运算的速度。根据CUDA技术的特点,提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法,并论述其关键技术和... 统一设备架构(CUDA)是NVIDIA公司提出的一个基于GPU通用计算的开发环境,它针对GPU多处理单元的特性,通过并行计算提高大规模运算的速度。根据CUDA技术的特点,提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法,并论述其关键技术和基本执行流程。试验结果表明,提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降。这同时体现了CUDA的优势和局限性,为其更复杂的应用提供了参考和依据。 展开更多
关键词 图形处理器 统一计算设备构架 图像锐化 中值滤波 并行计算
下载PDF
GPU加速MOC输运计算性能分析研究 被引量:4
3
作者 宋佩涛 张志俭 +2 位作者 梁亮 张乾 赵强 《原子能科学技术》 EI CAS CSCD 北大核心 2020年第1期103-111,共9页
特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试... 特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试了菱形差分和步特征线法分别在双精度、混合精度及单精度浮点运算下的计算精度、效率及GPU加速效果。采用性能分析工具对GPU程序性能进行了分析,识别了程序性能瓶颈。结果表明:菱形差分和步特征线法在不同浮点运算精度下均表现出良好的计算精度;相比于CPU单线程计算,GPU加速效果在双精度和单精度情况下分别达到35倍和100倍以上。 展开更多
关键词 GPU加速 特征线方法 中子输运计算 统一计算设备构架 性能分析
下载PDF
基于CUDA的超声二维声场EFIT仿真 被引量:1
4
作者 宋波 李威 廉国选 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第7期1322-1328,共7页
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场... 随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 展开更多
关键词 并行计算 弹性动力学有限积分算法(EFIT) 二维声场 图形处理器(GPU) 计算设备统一构架(CUDA)
下载PDF
GPU上高效Jacobi迭代算法的研究与实现 被引量:3
5
作者 狄鹏 胡长军 李建江 《小型微型计算机系统》 CSCD 北大核心 2012年第9期1962-1967,共6页
Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数... Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数据相关,增强数据局部性,从而获得更高的执行性能.此外,利用块(Tile)大小选取模型,合理的划分计算数据,充分利用GPU的运算资源,进一步提高性能.实验结果表明,Jacobi奇偶复制算法比传统Jacobi并行算法在GPU上的性能提高4倍以上. 展开更多
关键词 图像处理单元 计算设备统一构架 Jacobi迭代算法 循环优化
下载PDF
一种高效直方图生成算法在GPU上的实现 被引量:2
6
作者 狄鹏 胡长军 李建江 《计算机科学》 CSCD 北大核心 2012年第3期304-307,共4页
直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理... 直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理器平台,特别是当前最先进的图像处理单元(Graphic Processing Unit,GPU)实现高效的直方图生成算法是很有研究价值的。为了减少直方图生成过程中的存储体冲突,通过内存填充技术,将多线程的共享内存访问均匀地分散到各个存储体,可以大幅减少直方图生成算法在GPU上的内存访问延时。同时,通过提出有效可靠的近似最优配置搜索模型,可以指导用户配置GPU执行参数,以获得更高的性能。经实验验证,在实际应用中,改良后的算法比原有算法性能提高了42%~88%。 展开更多
关键词 图像处理单元 计算设备统一构架 直方图生成 内存填充
下载PDF
基于GPU的变型SIFT算子实时图像配准 被引量:13
7
作者 袁修国 彭国华 王琳 《计算机科学》 CSCD 北大核心 2011年第3期300-303,共4页
针对SIFT变型算法描述向量维数过高实、时性差的问题,分别在建立高斯尺度金字塔、关键点的亚像素定位等方面进行改进与并行化。利用CUDA设备构架在GPU硬件上实现多线程,一方面避免了PCA方法造成的关键点信息流失,另一方面使得配准速度... 针对SIFT变型算法描述向量维数过高实、时性差的问题,分别在建立高斯尺度金字塔、关键点的亚像素定位等方面进行改进与并行化。利用CUDA设备构架在GPU硬件上实现多线程,一方面避免了PCA方法造成的关键点信息流失,另一方面使得配准速度达到了工程中的实时性要求。在VS2005平台上通过C语言实现混合CUDA编程,结果表明该方法使得配准速度和点对匹配正确率都有较大提升。 展开更多
关键词 旋转不变特征变换(SIFT) 梯度定位与方向直方图(GLOH) 图形处理器(GPU) 计算统一设备构架
下载PDF
GPU加速下脉冲压缩雷达的点迹凝聚 被引量:4
8
作者 夏栋 夏奎 +1 位作者 张伟 孙剑英 《火力与指挥控制》 CSCD 北大核心 2013年第3期81-85,共5页
GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的... GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的粗粒度并行方式,结果发现处理时间反而有所增加,分析了处理时间加长的原因。然后增加了并行的尺度,对单个目标的凝聚过程进行并行分解。结果表明大尺度细粒度的并行方式可以有效利用GPU强大的运算能力,加快脉冲压缩雷达的点迹凝聚速度。 展开更多
关键词 GPU的通用运算 并行计算 点迹凝聚 计算统一设备构架
下载PDF
改进的电大目标电磁散射弹跳射线算法 被引量:1
9
作者 刘兴霞 张利军 赵玉祥 《探测与控制学报》 CSCD 北大核心 2015年第3期91-95,共5页
针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更... 针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更新的计算统一设备构架(CUDA)并行计算SBR算法。通过实验算例验证表明,该方法可有效提高SBR方法处理电大尺寸目标电磁散射问题的的计算效率。 展开更多
关键词 弹跳射线法 目标电磁散射 层次包围 计算统一设备构架
下载PDF
基于GPU的图像处理算法研究 被引量:14
10
作者 陈国强 《软件》 2014年第2期135-136,共2页
随着计算机处理技术不断发展,PC级微机得到了普及,这一趋势使计算机图形应用发生了重大变革,改变了以往工作站处理方式的格局,并且较大地影响了虚拟现实领域、仿真技术等图像处理领域。而这些变革之所以能够付诸现实,很大程度上依赖于... 随着计算机处理技术不断发展,PC级微机得到了普及,这一趋势使计算机图形应用发生了重大变革,改变了以往工作站处理方式的格局,并且较大地影响了虚拟现实领域、仿真技术等图像处理领域。而这些变革之所以能够付诸现实,很大程度上依赖于图形处理硬件技术的发展,尤其是图形处理器(GPU)性能的大幅提升极大地满足了日益复杂的图像处理要求。本文在实践的基础上探讨了CUDA框架和C++语言构建的图像处理算法,证实GPU图像处理所具有的明显优势。 展开更多
关键词 图形处理器 统一计算设备构架 高斯模糊算法
下载PDF
基于GPU的快速调强算法研究 被引量:2
11
作者 李霞 张树芝 +2 位作者 吴章文 侯氢 勾成俊 《核技术》 CAS CSCD 北大核心 2012年第4期297-300,共4页
研究了使用图形处理器(GPU)对调强放射治疗计划系统(IMRT)中分子动力学优化方法的加速方法及效果。利用统一计算设备构架(CUDA)平台,分别对4个临床肿瘤调强病例的笔束剂量响应矩阵的乘积运算进行GPU并行优化加速。比较和分析GPU并行加... 研究了使用图形处理器(GPU)对调强放射治疗计划系统(IMRT)中分子动力学优化方法的加速方法及效果。利用统一计算设备构架(CUDA)平台,分别对4个临床肿瘤调强病例的笔束剂量响应矩阵的乘积运算进行GPU并行优化加速。比较和分析GPU并行加速笔束剂量响应矩阵的乘积运算的结果。结果表明,GPU平台上的计算结果与CPU平台的计算结果存在一定的差异,其最大相对误差为5.822×10^(-7),这一差异在临床上是可以接受的,GPU并行运算可以使计算速度提升9-12倍。 展开更多
关键词 图形处理器(GPU) 统一计算设备构架(CUDA) 调强放射治疗(IMRT)
下载PDF
改进的储层直接取样随机模拟方法及GPU实现
12
作者 谢青 彭威 +2 位作者 柳瑶阁 黄涛 卢德唐 《中国科学技术大学学报》 CAS CSCD 北大核心 2013年第8期626-630,共5页
讨论了储层随机模拟方法中的直接取样方法,并对其中地质模式分量的选取方式进行了改进,提出了结合空间相关关系模型结构化特性的方法.针对模式子空间中的求解问题,提出了基于统一计算设备构架(compute unified device architecture,CUDA... 讨论了储层随机模拟方法中的直接取样方法,并对其中地质模式分量的选取方式进行了改进,提出了结合空间相关关系模型结构化特性的方法.针对模式子空间中的求解问题,提出了基于统一计算设备构架(compute unified device architecture,CUDA)的并行策略.实验结果表明,模式分量选取方式的改进有效改善了两相河流沉积系统中河道的连续性,并且模式子空间中的求解的并行方法具有较小的时间复杂度.根据选取参数组的不同,并行方法的计算速度比串行方法最低提速10倍,最高提高了近100倍. 展开更多
关键词 随机模拟 直接采样 并行计算 统一计算设备构架(CUDA)
下载PDF
基于CUDA的高速并行高斯滤波算法 被引量:10
13
作者 卢文龙 王建军 刘晓军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期10-13,共4页
为加快表面三维形貌分析中高斯滤波算法的执行速度,提出了一种基于计算统一设备构架(CUDA)的高斯滤波算法来实现高速并行处理.分析高斯滤波算法原理和CUDA并行计算体系,将CUDA并行计算技术引入到表面分析领域.针对高斯滤波数据间依赖性... 为加快表面三维形貌分析中高斯滤波算法的执行速度,提出了一种基于计算统一设备构架(CUDA)的高斯滤波算法来实现高速并行处理.分析高斯滤波算法原理和CUDA并行计算体系,将CUDA并行计算技术引入到表面分析领域.针对高斯滤波数据间依赖性弱和CUDA采用单指令多线程(SIMT)执行模型的特点,总结出适合于CUDA的并行高斯滤波算法流程.实验证明:该方法与CPU串行处理方法相比,其加速比达到40倍以上,可以有效提高数据处理能力. 展开更多
关键词 高斯滤波 计算统一设备构架 图像处理器 表面形貌 并行处理
原文传递
基于GPU加速的虚拟内窥镜手术实时冒烟仿真
14
作者 袁志勇 丁乙华 +1 位作者 张圆圆 赵俭辉 《武汉理工大学学报》 CAS CSCD 北大核心 2009年第18期55-58,共4页
采用计算流体力学建模方法提出了一种实时的动态三维冒烟仿真模型;利用定常、温度不变的不可压缩Navi-er-Stokes方程组构造冒烟仿真模型。为了满足虚拟内窥镜手术训练过程中冒烟仿真的实时性和视觉效果上逼真性的要求,利用基于CUDA+GPU... 采用计算流体力学建模方法提出了一种实时的动态三维冒烟仿真模型;利用定常、温度不变的不可压缩Navi-er-Stokes方程组构造冒烟仿真模型。为了满足虚拟内窥镜手术训练过程中冒烟仿真的实时性和视觉效果上逼真性的要求,利用基于CUDA+GPU软硬件体系结构的高性能计算平台,通过多线程的并发执行实现冒烟仿真模型的大规模并行计算,并使用基于硬件的光线跟踪算法对烟雾进行绘制。实验结果表明所述方法是有效的。 展开更多
关键词 实时动态冒烟仿真 计算流体力学 CUDA(计算统一设备构架) GPU
原文传递
遥感影像CVA变化检测的CUDA并行算法设计 被引量:20
15
作者 常方正 赵银娣 刘善磊 《遥感学报》 EI CSCD 北大核心 2016年第1期114-128,共15页
随着遥感影像数据量以及复杂程度的日益增加,遥感图像的快速处理成为实际应用过程中亟需解决的问题。为了实现遥感影像的实时变化检测,针对基于变化矢量分析CVA的变化检测算法,设计了一种基于统一计算设备构架CUDA的并行处理模型。首先... 随着遥感影像数据量以及复杂程度的日益增加,遥感图像的快速处理成为实际应用过程中亟需解决的问题。为了实现遥感影像的实时变化检测,针对基于变化矢量分析CVA的变化检测算法,设计了一种基于统一计算设备构架CUDA的并行处理模型。首先利用地理空间数据提取库GDAL实现大数据量遥感影像的分块读取、操作和保存;其次将基于变化矢量分析的变化检测过程分为变化强度检测、映射表构建和变化方向检测,并借助CUDA C将变化矢量分析算法的3个步骤嵌入到CPU和GPU组成的异构平台上进行实验;最后利用该模型对不同数据量的遥感影像进行CVA变化检测并作对比分析。实验结果表明:与CPU串行相比,基于GPU/CUDA的遥感影像CVA的变化检测速度提高了10倍左右;在一定程度上,达到了实时变化检测的效果。 展开更多
关键词 遥感影像 变化检测 变化矢量分析 并行计算 统一计算设备构架
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部