-
题名海洋环流数值模式POP的GPU并行优化
被引量:3
- 1
-
-
作者
郭松
窦勇
雷元武
-
机构
国防科学技术大学高性能计算国家重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第8期147-153,共7页
-
基金
自然科学基金杰青基金资助项目(61125201)
教育部博士点基金资助项目(60911062)
-
文摘
POP是一种全球海洋环流模式,广泛应用于海洋研究和气候预测。但是,随着模式分辨率的提高,POP对计算能力的需求呈几何级数增长,从而限制了POP模式的发展。本文在分析POP原理和特征的基础上,采用CUDA Fortran编程模型将POP模式移植到GPU平台上,并采用了网格块间并行和网格块内并行相结合的多层次并行实现全局存储器合并访问,减少局部存储器的使用,利用寄存器提高数据重用度和增大GPU端代码以减少CPU与GPU间的通信等优化策略。实验结果表明,与运行在Intel Xeon X56756核处理器上的串行程序和6进程并行程序相比,GPUPOP可以分别获得8.47倍和1.5倍的加速效果。
-
关键词
CUDA
GPU
POP模式
gpupop
CUDA
FORTRAN
-
Keywords
CUDA GPU
parallel ocean program model
gpupop
CUDA Fortran
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-