-
题名基于GPU的并行最小生成树算法的设计与实现
被引量:5
- 1
-
-
作者
郭绍忠
王伟
王磊
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第5期1682-1684,1702,共4页
-
基金
国家"863"计划重点资助项目(2009AA012201)
上海市科委重大科技攻关资助项目(08dz501600)
-
文摘
针对目前并行Prim最小生成树算法效率不高的问题,在分析现有并行Prim算法的基础上,提出了适于GPU架构的压缩邻接表图表示形式,开发了基于GPU的min-reduction数据并行原语,在NVIDIA GPU上设计并实现了基于Prim算法思想的并行最小生成树算法。该算法通过使用原语缩短关键步骤的查找时间,从而获得较高效率。实验表明,相对于传统CPU实现算法和不使用原语的算法,该算法具有较明显的性能优势。
-
关键词
图形处理器
图论
最小生成树
PRIM算法
数据并行原语
-
Keywords
GPU
graphic theory
minimum spanning tree(MST)
Prim's algorithm
data parallel primitive
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名适用于异构集群的混合并行流线生成系统
被引量:1
- 2
-
-
作者
刘俊
高阳
单桂华
迟学斌
-
机构
中国科学院计算机网络信息中心
中国科学院大学
-
出处
《计算机系统应用》
2021年第3期60-69,共10页
-
基金
国家数值风洞工程基础研究(NNW2019ZT6-B19)
国家重点研发计划(2019YFB1704201)。
-
文摘
流线是流场可视化的主要方法之一,而针对大规模流场的流线生成由于计算量大往往需要采用高性能计算机这样的并行计算环境结合并行化算法以实现计算加速.在当前异构计算系统越来越普遍的情况下,为了充分利用并行异构计算环境的计算能力,实现更高效的并行流线生成,本文采用了基于数据并行原语结合分布式消息通讯的技术架构,设计了一套适用于异构集群的混合并行流线生成系统,并在此基础上针对数据分块、数据冗余化及进程通讯策略等方面进行设计,提出并实现了一套并行粒子追踪算法.该系统被部署于国产超算平台上,并针对大规模CFD流场模拟结果数据可视化应用开展了实验.本文给出了相关实验结果,分析了核心并行算法的速度性能、可扩展性以及负载均衡等方面情况,说明了系统及算法的有效性和可扩展性.
-
关键词
流场可视化
并行流线生成
粒子追踪
数据并行原语
异构并行算法
-
Keywords
flow visualization
parallel streamline generation
particle advection
data parallel primitives
heterogeneous parallel algorithm
-
分类号
O35
[理学—流体力学]
TP332
[自动化与计算机技术—计算机系统结构]
-