期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于OpenACC的GRAPES_GLOBAL模式长波辐射异构并行化研究
被引量:
2
1
作者
孙晨
王彬
+1 位作者
顾文静
魏敏
《气象科技进展》
2018年第1期197-202,共6页
气象数值模式是天气预报的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使计算量呈指数增长,然而气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以GRAPES_GLOBAL数值天气预报模式为...
气象数值模式是天气预报的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使计算量呈指数增长,然而气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以GRAPES_GLOBAL数值天气预报模式为研究案例,以"神威·太湖之光"新一代国产异构众核高性能计算系统为试验平台,分析其程序结构及计算原理,定位影响模式并行效率及扩展性的热点子程序。通过调整程序结构以及添加协处理器加速指示语句,并针对模式系统消息缓存过大等问题,为长波辐射过程的每个热点子程序分别设计了高效的通讯策略。实现了"粗粒度MPI并行+细粒度众核OPENACC并行"多级异构并行方案,使其普遍达到3~6倍的加速。本试验充分继承了原始代码的MPI级并行,同时利用数量众多的协处理器为其中的热点函数提供加速,有效提升模式的并行效率,节约了开发成本。
展开更多
关键词
神威·太湖之光
OpenACC
GRAPES模式
长波辐射过程
下载PDF
职称材料
基于OpenACC的高性能计算并行优化研究与应用
被引量:
3
2
作者
顾文静
孙晨
王彬
《计算机技术与发展》
2018年第4期65-70,共6页
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选...
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选项对程序性能进行初步优化,再根据其数据依赖和访存特性,对数据和循环结构进行预处理并添加OpenACC指导命令实现循环级并行。实验结果表明,长波辐射过程并行计算结果正确,在不改变原有代码结构的基础上即可获得4~6倍的加速比,优化性能可比拟相同计算能力的Intel集群,虽然较GPU加速仍有差距,但大大增强了代码的可读性和可移植性,且随着编译器和硬件技术的发展,OpenACC有着广阔的发展空间。
展开更多
关键词
神威·太湖之光
OpenACC
GRAPES模式
长波辐射过程
下载PDF
职称材料
题名
基于OpenACC的GRAPES_GLOBAL模式长波辐射异构并行化研究
被引量:
2
1
作者
孙晨
王彬
顾文静
魏敏
机构
国家气象信息中心
出处
《气象科技进展》
2018年第1期197-202,共6页
基金
国家重点研发计划项目(2016YFA0602102)
公益性行业(气象)科研专项(GYHY201306062)
文摘
气象数值模式是天气预报的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使计算量呈指数增长,然而气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以GRAPES_GLOBAL数值天气预报模式为研究案例,以"神威·太湖之光"新一代国产异构众核高性能计算系统为试验平台,分析其程序结构及计算原理,定位影响模式并行效率及扩展性的热点子程序。通过调整程序结构以及添加协处理器加速指示语句,并针对模式系统消息缓存过大等问题,为长波辐射过程的每个热点子程序分别设计了高效的通讯策略。实现了"粗粒度MPI并行+细粒度众核OPENACC并行"多级异构并行方案,使其普遍达到3~6倍的加速。本试验充分继承了原始代码的MPI级并行,同时利用数量众多的协处理器为其中的热点函数提供加速,有效提升模式的并行效率,节约了开发成本。
关键词
神威·太湖之光
OpenACC
GRAPES模式
长波辐射过程
Keywords
Sunway TaihuLight system
OpenACC
GRAPES model
long-wave radiation process
分类号
P456.7 [天文地球—大气科学及气象学]
下载PDF
职称材料
题名
基于OpenACC的高性能计算并行优化研究与应用
被引量:
3
2
作者
顾文静
孙晨
王彬
机构
国家气象信息中心高性能计算室
出处
《计算机技术与发展》
2018年第4期65-70,共6页
基金
国家重点研发计划项目(2016YFA0602102)
公益性行业专项(气象)科研专项(GYHY201306062)
中国气象局局校合作项目
文摘
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选项对程序性能进行初步优化,再根据其数据依赖和访存特性,对数据和循环结构进行预处理并添加OpenACC指导命令实现循环级并行。实验结果表明,长波辐射过程并行计算结果正确,在不改变原有代码结构的基础上即可获得4~6倍的加速比,优化性能可比拟相同计算能力的Intel集群,虽然较GPU加速仍有差距,但大大增强了代码的可读性和可移植性,且随着编译器和硬件技术的发展,OpenACC有着广阔的发展空间。
关键词
神威·太湖之光
OpenACC
GRAPES模式
长波辐射过程
Keywords
Sunway Tauhu Light System
OpenACC
GRAPES model
long wave radiation
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于OpenACC的GRAPES_GLOBAL模式长波辐射异构并行化研究
孙晨
王彬
顾文静
魏敏
《气象科技进展》
2018
2
下载PDF
职称材料
2
基于OpenACC的高性能计算并行优化研究与应用
顾文静
孙晨
王彬
《计算机技术与发展》
2018
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部