期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于CUDA的光线跟踪实现中纹理内存的应用研究 被引量:1
1
作者 陆建勇 焦良葆 《中国新技术新产品》 2009年第23期40-41,共2页
CUDA是由NVIDIA开发的用于通用并行计算的开发平台,可方便地实现并行算法的编程。本文利用光线跟踪算法具有的天然可并行性,采用KD树加速结构,在CUDA上实现光线跟踪的并行算法,经过纹理内存的优化使用后,可达到交互式光线跟踪。
关键词 CUDA 光线跟踪 纹理内存 优化
下载PDF
CUDA内存资源池设计避免访问冲突 被引量:1
2
作者 于玉龙 王宇新 +2 位作者 郭忠明 唐堃 郭禾 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2583-2587,共5页
CUDA内存资源往往存在静态申请与访问的约束,多CPU线程并发执行时会产生资源访问冲突.经建模分析发现,消除资源与设备核函数之间的静态关系可避免该问题.基于资源池模式设计CUDA内存资源池,整合多份资源副本,增加相应调度管理机制,达到... CUDA内存资源往往存在静态申请与访问的约束,多CPU线程并发执行时会产生资源访问冲突.经建模分析发现,消除资源与设备核函数之间的静态关系可避免该问题.基于资源池模式设计CUDA内存资源池,整合多份资源副本,增加相应调度管理机制,达到了消除资源访问冲突的目的.以纹理内存为案例,在确认纹理内存线程间访问冲突存在及发生频率的基础上,设计并实现纹理内存资源池.大量实验证明资源池不但能够保证程序正确性,避免访问冲突,而且具有较小的性能损耗与负载开销,较低的代码维护成本,同时适用于多GPU系统. 展开更多
关键词 CUDA 多线程 纹理内存 访问冲突 内存资源池
下载PDF
Lattice-Boltzmann方腔模型的CUDA加速实现 被引量:3
3
作者 郑彦奎 刘沙 +1 位作者 熊生伟 周季夫 《科学技术与工程》 2010年第7期1684-1688,共5页
对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存... 对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存存储数据,将模型中9个分布函数存储为二维网格,每个网格分配一个线程,每个线程块包括256个线程,多条线程并行计算。在普通个人计算机上,采用NVIDIA GeForce 9600 GT显卡和CUDA,实现了LBM模拟方腔流动,将计算速度提高到CPU的50倍。 展开更多
关键词 计算统一设备架构(Compute Unified Device Architoctune CUDA) GPU Lattice BOLTZMANN方法 非平衡外推 边界处理 纹理内存 多线程 并行计算
下载PDF
基于GPU的机载气象雷达仿真系统设计与实现 被引量:1
4
作者 周明 胡士强 张军 《电气自动化》 2013年第4期100-102,共3页
详细描述了一种基于GPU的机载气象雷达仿真系统的设计思想和实现方法。首先对卫星图像进行三维重建,得到三维云场体数据,通过加入虚拟地形数据,搭建气象雷达的大气环境激励模块。然后在建立三维云场基础上,根据飞机飞行姿态以及真实雷... 详细描述了一种基于GPU的机载气象雷达仿真系统的设计思想和实现方法。首先对卫星图像进行三维重建,得到三维云场体数据,通过加入虚拟地形数据,搭建气象雷达的大气环境激励模块。然后在建立三维云场基础上,根据飞机飞行姿态以及真实雷达的扫描方式,计算飞机前方扇形区域的雷达回波强度,并对雷达回波数据进行数据分析和显示。最后为了实现雷达回波模拟的大规模数据密集型计算,提出CPU+GPU异构并行的解决方案。实验结果表明,可以实现飞机在大范围飞行情形下对机载气象雷达回波进行实时仿真的效果。 展开更多
关键词 机载气象雷达 三维重建 马尔可夫链 并行计算 纹理内存
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部