-
题名多GPU混合结构下FMM近程算法的优化
- 1
-
-
作者
曹旻
田力
朱永华
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机工程与应用》
CSCD
2013年第8期37-42,91,共7页
-
基金
国家自然科学基金(No.61001163)
上海市教育委员会科研创新项目(No.09YZ09)
-
文摘
近几年,在高性能计算领域,GPU+CPU混合结构成为许多高性能计算机的主要结构,得到了广泛的应用。由于混合结构的特殊性,分析了传统的阿姆达尔定律,将其推广到混合结构中。针对FMM算法中近程计算部分在multi-GPU+CPU混合结构中存在的任务均衡以及通信延时等问题,在混合结构阿姆达尔定律的指导下,提出了多GPU调度模型和两级流水模型。该调度模型能够有效地进行多个GPU之间负载的均衡,缓解近程计算的非均匀性所带来的问题;同时,两级流水模型使CPU和GPU可以并行工作,通过计算和访存的重叠,来隐藏访存带来的延时问题,提高运算部件的利用率。实验验证和数据的比较证明了上述优化的可行性,该优化方案进一步加速了算法的执行。
-
关键词
混合结构
GPU
快速多极子算法(FMM)
petfmm
流水线
-
Keywords
hybrid architecture
GPU
Fast Multipole Method(FMM)
petfmm
pipelining
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-