-
题名基于Charm++的并行FMM实现
- 1
-
-
作者
丁磊
王武
姜金荣
赵莲
-
机构
中国科学院计算机网络信息中心
中国科学院大学
-
出处
《数据与计算发展前沿》
2020年第3期101-112,共12页
-
基金
国家重点研发计划“地球系统模式的改进、应用开发和高性能计算”(2016YFB0200800)
中国科学院科研信息化应用工程:高性能应用软件(XXH13506-405)
中国科学院战略性先导科技专项(C):国产安全可控先进计算系统研制(XDC01040100)。
-
文摘
【目的】为了利用Charm++的过分解与运行时迁移特性,提高FMM的并行执行效率,本文在Charm++上完成了FMM的并行实现。【方法】通过分析通信、并行任务分解、异步调用转化,采用SDAG实现了基本通信函数,并利用LPT近似策略达到了负载均衡,最终实现了并行FMM。【结果】测试结果表明,FMM的Charm++实现的计算精度与MPI实现完全相同,在千核规模上的执行速度优于MPI实现。过分解与负载均衡策略在粒子分布不均的情况下减少了10%的运行时间。【局限】目前的实现没有利用Charm++共享内存的结构,仍有优化的空间,负载均衡策略较为简单。【结论】本文给出了一个较为通用的MPI风格程序向Charm++转化的策略,并证明了Charm++的过分解与负载均衡策略对FMM有加速效果。
-
关键词
Charm++
FMM
负载均衡
过分解
-
Keywords
Charm++
FMM
load balancing
over-decomposition
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
O241
[理学—计算数学]
-