期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
激光等离子体相互作用模拟的并行和加速研究
1
作者
武海鹏
文敏华
+1 位作者
see simon
林新华
《计算机科学与探索》
CSCD
北大核心
2018年第4期550-558,共9页
随着生成超短激光脉冲技术的不断发展,对这种激光脉冲和等离子体相互作用进行动力学描述也变得越来越重要。PIC(particle-in-cell)是一种在等离子体物理中,研究充能粒子在电磁场中运动轨迹的广泛采用的方法。尽管现在已经有一些在GPU上...
随着生成超短激光脉冲技术的不断发展,对这种激光脉冲和等离子体相互作用进行动力学描述也变得越来越重要。PIC(particle-in-cell)是一种在等离子体物理中,研究充能粒子在电磁场中运动轨迹的广泛采用的方法。尽管现在已经有一些在GPU上的PIC方法的实现,但是基于激光等离子体相互作用模拟的特点,仍然有很多重要问题可以尝试其他解决思路。提出了一种把初始的基于CPU的LPI模拟代码完整移植到GPU上的可行方法。提出了一系列加速初始的GPU版本的方法:动态冗余算法、混合精度算法、粒子排序算法。利用并且评估了GPUDirect RDMA(remote direct memory access)技术,其可以提高MPI的通信性能。实验结果证明,与初始的GPU版本相比,"Scatter"阶段加速比为6.1倍,当MPI传输数据大于3 KB时,通信过程提速了2.8倍。这些研究证明了针对模拟应用和GPU集群的特点进行特殊的优化能对性能带来显著的提升。
展开更多
关键词
激光等离子体相互作用
粒子网格模拟
统一计算设备架构(CUDA)
CUDA优化
GPUDirect
RDMA
下载PDF
职称材料
太湖之光上利用OpenACC移植和优化GTC-P
被引量:
8
2
作者
王一超
林新华
+5 位作者
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
《计算机研究与发展》
EI
CSCD
北大核心
2018年第4期875-884,共10页
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学...
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学应用,算法基于高性能计算领域中被广泛使用的PIC(particle-in-cell)方法.利用神威OpenACC并行编程模型在"太湖之光"上成功移植了GTC-P应用.在移植过程中,鉴于OpenACC编译器尚无法解决的性能瓶颈,提出了3种基于中间代码二次开发的优化方法:1)消除原子操作;2)避免低效的全局访存操作;3)手动添加SIMD intrinsics指令.实验结果表明,在64个从核上相比1个主核,优化后的函数charge和push分别实现了1.6倍和8.6倍的加速比,同时GTC-P代码整体取得了2.5倍的加速比.优化结果证明了基于中间代码的手动优化对利用神威OpenACC移植的PIC算法在"太湖之光"上的性能提升非常重要.
展开更多
关键词
太湖之光
GTC-P
PIC算法
神威
OpenACC
下载PDF
职称材料
题名
激光等离子体相互作用模拟的并行和加速研究
1
作者
武海鹏
文敏华
see simon
林新华
机构
上海交通大学高性能计算中心
NVIDIA Technology Center
东京工业大学学术国际情报中心
出处
《计算机科学与探索》
CSCD
北大核心
2018年第4期550-558,共9页
基金
国家重点研发计划(Nos.2016YFB0201400,2016YFB0201800);日本学术振兴会RONPAKU项目
NVIDIA GPU全球卓越中心项目
文摘
随着生成超短激光脉冲技术的不断发展,对这种激光脉冲和等离子体相互作用进行动力学描述也变得越来越重要。PIC(particle-in-cell)是一种在等离子体物理中,研究充能粒子在电磁场中运动轨迹的广泛采用的方法。尽管现在已经有一些在GPU上的PIC方法的实现,但是基于激光等离子体相互作用模拟的特点,仍然有很多重要问题可以尝试其他解决思路。提出了一种把初始的基于CPU的LPI模拟代码完整移植到GPU上的可行方法。提出了一系列加速初始的GPU版本的方法:动态冗余算法、混合精度算法、粒子排序算法。利用并且评估了GPUDirect RDMA(remote direct memory access)技术,其可以提高MPI的通信性能。实验结果证明,与初始的GPU版本相比,"Scatter"阶段加速比为6.1倍,当MPI传输数据大于3 KB时,通信过程提速了2.8倍。这些研究证明了针对模拟应用和GPU集群的特点进行特殊的优化能对性能带来显著的提升。
关键词
激光等离子体相互作用
粒子网格模拟
统一计算设备架构(CUDA)
CUDA优化
GPUDirect
RDMA
Keywords
laser-plasma-interaction simulation
particle-in-cell(PIC)
compute unified device architecture(CUDA)
CUDA optimization
GPUDirect RDMA
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
太湖之光上利用OpenACC移植和优化GTC-P
被引量:
8
2
作者
王一超
林新华
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
机构
上海交通大学高性能计算中心
东京工业大学
普林斯顿大学等离子体物理实验室
英伟达公司
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第4期875-884,共10页
基金
国家重点研发计划项目(2016YFB0201400
2016YFB0201800)
+2 种基金
美国自然科学基金跨学科合作项目(ACI-1440733)
NVIDIA GPU全球卓越中心
日本学术振兴会RONPAKU项目(113209)~~
文摘
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学应用,算法基于高性能计算领域中被广泛使用的PIC(particle-in-cell)方法.利用神威OpenACC并行编程模型在"太湖之光"上成功移植了GTC-P应用.在移植过程中,鉴于OpenACC编译器尚无法解决的性能瓶颈,提出了3种基于中间代码二次开发的优化方法:1)消除原子操作;2)避免低效的全局访存操作;3)手动添加SIMD intrinsics指令.实验结果表明,在64个从核上相比1个主核,优化后的函数charge和push分别实现了1.6倍和8.6倍的加速比,同时GTC-P代码整体取得了2.5倍的加速比.优化结果证明了基于中间代码的手动优化对利用神威OpenACC移植的PIC算法在"太湖之光"上的性能提升非常重要.
关键词
太湖之光
GTC-P
PIC算法
神威
OpenACC
Keywords
TaihuLight
GTC-P
particle-in-cell(PIC)
Sunway
OpenACC
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
激光等离子体相互作用模拟的并行和加速研究
武海鹏
文敏华
see simon
林新华
《计算机科学与探索》
CSCD
北大核心
2018
0
下载PDF
职称材料
2
太湖之光上利用OpenACC移植和优化GTC-P
王一超
林新华
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
《计算机研究与发展》
EI
CSCD
北大核心
2018
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部