期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
FMM算法中PP问题在GPU上的研究与实现 被引量:2
1
作者 李正杰 徐炜民 +1 位作者 柴亚辉 郑衍衡 《计算机工程与设计》 CSCD 北大核心 2011年第9期3050-3053,3169,共5页
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合... 针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。 展开更多
关键词 图形处理器 异构体系结构 统一计算架构 快速多极子算法 pp问题
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部