期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向国产工业级CFD软件的并行性能测试分析
1
作者
戴未希
邱昊中
+4 位作者
丁越
汪青松
林拥真
张健
徐传福
《软件导刊》
2024年第10期8-14,共7页
NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowSta...
NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowStar等大型工业级CFD软件越发困难。鉴于此,依托典型HPC平台,针对FlowStar软件,从计算、通信、访存等角度对FlowStar性能特征进行了深入的测试和分析,可帮助研究人员更好地理解HPC系统上复杂CFD软件运行性能特征,为后续FlowStar软件的并行计算和性能优化提供参考。该研究对其他非结构CFD软件并行计算、性能优化以及HPC与CFD融合发展也具有借鉴意义。
展开更多
关键词
CFD并行计算
FlowStar
性能测试
性能分析
下载PDF
职称材料
基于SYCL的多相流LBM模拟跨平台异构并行计算研究
被引量:
1
2
作者
丁越
徐传福
+4 位作者
邱昊中
戴未希
汪青松
林拥真
王正华
《计算机科学》
CSCD
北大核心
2023年第11期32-40,共9页
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并...
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理的格子数量以及形状,与基础并行版本相比,在CPU与GPU上分别取得了最高1.57以及1.34的加速比。结果表明,SYCL并行应用在CPU上更适合采用计算到工作项多对一映射的优化方法,在GPU上更适合采用ND-range并行内核,以提高性能。
展开更多
关键词
SYCL
格子玻尔兹曼方法
多相流模拟
异构并行计算
跨平台并行编程模型
下载PDF
职称材料
题名
面向国产工业级CFD软件的并行性能测试分析
1
作者
戴未希
邱昊中
丁越
汪青松
林拥真
张健
徐传福
机构
国防科技大学计算机学院
中国空气动力研究与发展中心计算空气动力研究所
出处
《软件导刊》
2024年第10期8-14,共7页
文摘
NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowStar等大型工业级CFD软件越发困难。鉴于此,依托典型HPC平台,针对FlowStar软件,从计算、通信、访存等角度对FlowStar性能特征进行了深入的测试和分析,可帮助研究人员更好地理解HPC系统上复杂CFD软件运行性能特征,为后续FlowStar软件的并行计算和性能优化提供参考。该研究对其他非结构CFD软件并行计算、性能优化以及HPC与CFD融合发展也具有借鉴意义。
关键词
CFD并行计算
FlowStar
性能测试
性能分析
Keywords
CFD parallel computing
FlowStar
performance testing
performance analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于SYCL的多相流LBM模拟跨平台异构并行计算研究
被引量:
1
2
作者
丁越
徐传福
邱昊中
戴未希
汪青松
林拥真
王正华
机构
国防科技大学计算机学院
出处
《计算机科学》
CSCD
北大核心
2023年第11期32-40,共9页
文摘
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理的格子数量以及形状,与基础并行版本相比,在CPU与GPU上分别取得了最高1.57以及1.34的加速比。结果表明,SYCL并行应用在CPU上更适合采用计算到工作项多对一映射的优化方法,在GPU上更适合采用ND-range并行内核,以提高性能。
关键词
SYCL
格子玻尔兹曼方法
多相流模拟
异构并行计算
跨平台并行编程模型
Keywords
SYCL
Lattice Boltzmann method
Multi-phase flows imulation
Heterogeneous parallel computing
Cross-platform parallel programming model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向国产工业级CFD软件的并行性能测试分析
戴未希
邱昊中
丁越
汪青松
林拥真
张健
徐传福
《软件导刊》
2024
0
下载PDF
职称材料
2
基于SYCL的多相流LBM模拟跨平台异构并行计算研究
丁越
徐传福
邱昊中
戴未希
汪青松
林拥真
王正华
《计算机科学》
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部