期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于CUDA的邻近粒子搜索算法研究 被引量:3
1
作者 刘丹 陈捷捷 《计算机工程与应用》 CSCD 2012年第18期53-56,共4页
在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技... 在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。 展开更多
关键词 统一计算设备框架(CUDA) 图形处理单元(GPU) 粒子方法 邻近粒子搜索
下载PDF
基于GPU的并行协同过滤算法 被引量:1
2
作者 许建 林泳 +1 位作者 秦勇 黄翰 《计算机应用研究》 CSCD 北大核心 2013年第9期2656-2659,共4页
为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有... 为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有的特点。使用统一计算设备框架(compute unified device architecture,CUDA)实现了此协同过滤算法。实验表明,在中低端的GPU上该算法与在高端的四核CPU上的协同过滤算法相比,其加速比达到40倍以上,显著地提高了算法的可伸缩性,而算法在准确率方面也有优秀的表现。 展开更多
关键词 协同过滤 图形处理器 统一计算设备框架
下载PDF
gAC:基于GPU的高性能AC算法 被引量:2
3
作者 陈虎 彭江锋 施少怀 《计算机工程与应用》 CSCD 2012年第12期43-48,共6页
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经... 字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。 展开更多
关键词 图形处理器(GPU) 计算统一设备框架(CUDA) 多字符串匹配 并行计算 AC算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部