期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于OpenACC的GRAPES_GLOBAL模式长波辐射异构并行化研究 被引量:2
1
作者 孙晨 王彬 +1 位作者 顾文静 魏敏 《气象科技进展》 2018年第1期197-202,共6页
气象数值模式是天气预报的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使计算量呈指数增长,然而气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以GRAPES_GLOBAL数值天气预报模式为... 气象数值模式是天气预报的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使计算量呈指数增长,然而气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以GRAPES_GLOBAL数值天气预报模式为研究案例,以"神威·太湖之光"新一代国产异构众核高性能计算系统为试验平台,分析其程序结构及计算原理,定位影响模式并行效率及扩展性的热点子程序。通过调整程序结构以及添加协处理器加速指示语句,并针对模式系统消息缓存过大等问题,为长波辐射过程的每个热点子程序分别设计了高效的通讯策略。实现了"粗粒度MPI并行+细粒度众核OPENACC并行"多级异构并行方案,使其普遍达到3~6倍的加速。本试验充分继承了原始代码的MPI级并行,同时利用数量众多的协处理器为其中的热点函数提供加速,有效提升模式的并行效率,节约了开发成本。 展开更多
关键词 神威·太湖之光 OpenACC GRAPES模式 长波辐射过程
下载PDF
基于OpenACC的高性能计算并行优化研究与应用 被引量:3
2
作者 顾文静 孙晨 王彬 《计算机技术与发展》 2018年第4期65-70,共6页
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选... 针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选项对程序性能进行初步优化,再根据其数据依赖和访存特性,对数据和循环结构进行预处理并添加OpenACC指导命令实现循环级并行。实验结果表明,长波辐射过程并行计算结果正确,在不改变原有代码结构的基础上即可获得4~6倍的加速比,优化性能可比拟相同计算能力的Intel集群,虽然较GPU加速仍有差距,但大大增强了代码的可读性和可移植性,且随着编译器和硬件技术的发展,OpenACC有着广阔的发展空间。 展开更多
关键词 神威·太湖之光 OpenACC GRAPES模式 长波辐射过程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部