期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于自适应线程束的GPU并行粒子群优化算法 被引量:2
1
作者 张硕 何发智 +1 位作者 周毅 鄢小虎 《计算机应用》 CSCD 北大核心 2016年第12期3274-3279,共6页
基于统一计算设备架构(CUDA)对图形处理器(GPU)下的并行粒子群优化(PSO)算法作改进研究。根据CUDA的硬件体系结构特点,可知Block是串行执行的,线程束(Warp)才是流多处理器(SM)调度和执行的基本单位。为了充分利用Block中线程的并行性,... 基于统一计算设备架构(CUDA)对图形处理器(GPU)下的并行粒子群优化(PSO)算法作改进研究。根据CUDA的硬件体系结构特点,可知Block是串行执行的,线程束(Warp)才是流多处理器(SM)调度和执行的基本单位。为了充分利用Block中线程的并行性,提出基于自适应线程束的GPU并行PSO算法:将粒子的维度和线程相对应;利用GPU的Warp级并行,根据维度的不同自适应地将每个粒子与一个或多个Warp相对应;自适应地将一个或多个粒子与每个Block相对应。与已有的粗粒度并行方法(将每个粒子和线程相对应)以及细粒度并行方法(将每个粒子和Block相对应)进行了对比分析,实验结果表明,所提出的并行方法相对前两种并行方法,CPU加速比最多提高了40。 展开更多
关键词 粒子群优化算法 并行计算 图形处理器 统一计算设备架构 自适应线程束
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部