-
题名基于CUDA的邻近粒子搜索算法研究
被引量:3
- 1
-
-
作者
刘丹
陈捷捷
-
机构
武汉第二船舶设计研究所
中国舰船研究设计中心
-
出处
《计算机工程与应用》
CSCD
2012年第18期53-56,共4页
-
文摘
在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。
-
关键词
统一计算设备框架(CUDA)
图形处理单元(GPU)
粒子方法
邻近粒子搜索
-
Keywords
Compute Unified Device Architecture (CUDA)
Graphic Processing Unit (GPU)
particle method
neighbor particle search
-
分类号
TP319.9
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于GPU的并行协同过滤算法
被引量:1
- 2
-
-
作者
许建
林泳
秦勇
黄翰
-
机构
清远职业技术学院网络信息中心
华南理工大学软件学院
东莞市理工学院计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第9期2656-2659,共4页
-
基金
国家自然科学基金资助项目(61170193)
广东省自然科学基金资助项目(S2012010010613)
东莞市高等院校科研机构科技计划资助项目(2012108102035)
-
文摘
为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有的特点。使用统一计算设备框架(compute unified device architecture,CUDA)实现了此协同过滤算法。实验表明,在中低端的GPU上该算法与在高端的四核CPU上的协同过滤算法相比,其加速比达到40倍以上,显著地提高了算法的可伸缩性,而算法在准确率方面也有优秀的表现。
-
关键词
协同过滤
图形处理器
统一计算设备框架
-
Keywords
collaborative filtering
GPU
CUDA framework
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名gAC:基于GPU的高性能AC算法
被引量:2
- 3
-
-
作者
陈虎
彭江锋
施少怀
-
机构
华南理工大学软件学院
华南理工大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第12期43-48,共6页
-
基金
广东省科技计划项目(No.2006B80407001)
华南理工大学中央高校基本业务费项目(No.2009ZM0007)
-
文摘
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。
-
关键词
图形处理器(GPU)
计算统一设备框架(CUDA)
多字符串匹配
并行计算
AC算法
-
Keywords
Graphic Processing Uni(tGPU)
Compute Unified Device Architecture(CUDA)
parallel multi-string matching
parallel computation
AC algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP319
[自动化与计算机技术—计算机软件与理论]
-