期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于MPI+CUDA的DSMC/PIC耦合模拟异构并行及性能优化研究
1
作者 林拥真 徐传福 +4 位作者 邱昊中 汪青松 王正华 杨富翔 李洁 《计算机科学》 CSCD 北大核心 2024年第9期31-39,共9页
DSMC/PIC耦合模拟是一类重要的高性能计算应用,大规模DSMC/PIC耦合模拟计算量巨大,需要实现高效并行计算。由于粒子动态注入、迁移等操作,基于MPI并行的DSMC/PIC耦合模拟往往通信开销较大且难以实现负载均衡。针对自主研发的DSMC/PIC耦... DSMC/PIC耦合模拟是一类重要的高性能计算应用,大规模DSMC/PIC耦合模拟计算量巨大,需要实现高效并行计算。由于粒子动态注入、迁移等操作,基于MPI并行的DSMC/PIC耦合模拟往往通信开销较大且难以实现负载均衡。针对自主研发的DSMC/PIC耦合模拟软件,在原有MPI并行优化版本上设计实现了高效的MPI+CUDA异构并行算法,结合GPU体系结构和DSMC/PIC计算特点,开展了GPU访存优化、GPU线程工作负载优化、CPU-GPU数据传输优化及DSMC/PIC数据冲突优化等一系列性能优化。在北京北龙超级云HPC系统的NVIDIA V100和A100 GPU上,针对数亿粒子规模的脉冲真空弧等离子体羽流应用,开展了大规模DSMC/PIC耦合异构并行模拟,相比原有纯MPI并行,GPU异构并行大幅缩短了模拟时间,两块GPU卡较192核的CPU加速比达到550%,同时具有更好的强可扩展性。 展开更多
关键词 DSMC/PIC耦合 粒子模拟 异构并行 MPI+CUDA
下载PDF
面向国产工业级CFD软件的并行性能测试分析
2
作者 戴未希 邱昊中 +4 位作者 丁越 汪青松 林拥真 张健 徐传福 《软件导刊》 2024年第10期8-14,共7页
NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowSta... NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowStar等大型工业级CFD软件越发困难。鉴于此,依托典型HPC平台,针对FlowStar软件,从计算、通信、访存等角度对FlowStar性能特征进行了深入的测试和分析,可帮助研究人员更好地理解HPC系统上复杂CFD软件运行性能特征,为后续FlowStar软件的并行计算和性能优化提供参考。该研究对其他非结构CFD软件并行计算、性能优化以及HPC与CFD融合发展也具有借鉴意义。 展开更多
关键词 CFD并行计算 FlowStar 性能测试 性能分析
下载PDF
基于SYCL的多相流LBM模拟跨平台异构并行计算研究 被引量:1
3
作者 丁越 徐传福 +4 位作者 邱昊中 戴未希 汪青松 林拥真 王正华 《计算机科学》 CSCD 北大核心 2023年第11期32-40,共9页
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并... 异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理的格子数量以及形状,与基础并行版本相比,在CPU与GPU上分别取得了最高1.57以及1.34的加速比。结果表明,SYCL并行应用在CPU上更适合采用计算到工作项多对一映射的优化方法,在GPU上更适合采用ND-range并行内核,以提高性能。 展开更多
关键词 SYCL 格子玻尔兹曼方法 多相流模拟 异构并行计算 跨平台并行编程模型
下载PDF
DSMC/PIC耦合模拟的大规模高效混合并行计算研究
4
作者 汪青松 邱昊中 +4 位作者 林拥真 杨富翔 李洁 王正华 徐传福 《计算机科学》 CSCD 北大核心 2023年第S02期811-819,共9页
DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负... DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负载均衡研究。首先设计了基于嵌套双重非结构网格的MPI并行算法,实现了集中式和分布式两种并行通信策略,支持粒子在任意并行进程间的动态迁移。然后提出了加权负载性能模型,设计了动态负载均衡算法及高效网格重映射机制,大幅提升了耦合模拟并行效率,进一步设计了MPI+OpenMP混合并行算法,有效降低了纯MPI并行计算中动态负载均衡的网格重剖分和通信开销。在北京北龙超级云HPC系统上,针对10亿粒子规模脉冲真空弧等离子体羽流开展了数千处理器核心DSMC/PIC耦合并行模拟,验证了并行算法和动态负载均衡的效果。 展开更多
关键词 DSMC/PIC耦合 粒子模拟 分布式和集中式 动态负载均衡 MPI+OPENMP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部