期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
THAFTS-Acoustic软件全流程多级并行与容错设计
1
作者 吕小敬 邹明松 +2 位作者 刘钊 徐金秀 冷文浩 《船舶力学》 EI CSCD 北大核心 2023年第11期1729-1736,共8页
经过多年的技术发展,三维水弹性计算软件声学分析模块THAFTS-Acoustic已成为船海领域声固耦合分析的重要工具。随着计算量的不断增加,高性能计算能力成为制约该软件实现工程应用的关键因素之一。本文首先对软件核心求解模块的计算特征... 经过多年的技术发展,三维水弹性计算软件声学分析模块THAFTS-Acoustic已成为船海领域声固耦合分析的重要工具。随着计算量的不断增加,高性能计算能力成为制约该软件实现工程应用的关键因素之一。本文首先对软件核心求解模块的计算特征进行详细分析,发现软件在不同计算阶段计算密集度相差悬殊,数据间计算耦合方式不规则,单一并行模式无法保障所有核心段的高效并行。然后基于神威太湖之光超级计算系统设计实现混合异构多级并行算法和容错功能,提高软件的计算效率,并规避软硬件故障风险。最后,通过大规模并行算例测试全流程多级并行版本的加速性能。结果表明,以5万核心测试为基准,软件在百万核心运行时并行效率超过了38.3%。 展开更多
关键词 三维水弹性 神威太湖之光 多级并行 容错
下载PDF
面向超大规模并行模拟的LBM计算流体力学软件 被引量:2
2
作者 吕小敬 刘钊 +3 位作者 褚学森 石树鹏 孟虹松 黄震春 《计算机科学》 CSCD 北大核心 2020年第4期13-17,共5页
格子玻尔兹曼方法(Lattice Boltzmann Method,LBM)是一种基于介观模拟尺度的计算流体力学方法,已被广泛用于理论研究和工程领域。提高LBM计算流体软件的并行模拟能力,是高性能计算及应用研究中的一项重要内容。该研究基于“神威·... 格子玻尔兹曼方法(Lattice Boltzmann Method,LBM)是一种基于介观模拟尺度的计算流体力学方法,已被广泛用于理论研究和工程领域。提高LBM计算流体软件的并行模拟能力,是高性能计算及应用研究中的一项重要内容。该研究基于“神威·太湖之光”超级计算系统,设计并实现了一套高效扩展的LBM计算流体力学软件。针对国产众核处理器SW26010的架构,文中设计了以下几种提高SWLBM方针速度和可扩展性的多级并行技术,包括面向19点stencil的数据复用、碰撞过程向量化、主从异步并行通信计算隐藏等。基于以上并行优化方案,文中测试了高达56000亿网格的数值模拟,SWLBM软件持续浮点计算性能达到4.7 PFlops,软件模拟速度提高了172倍。相比百万核心10000*10000*5000网格风场模拟,SWLBM整机千万核心的并行效率可达87%。测试结果表明,SWLBM有能力为工业应用提供实用的大规模并行模拟解决方案。 展开更多
关键词 格子玻尔兹曼方法 SW26010 多级并行 并行优化
下载PDF
船舶三维声弹性模拟软件的并行优化策略
3
作者 吕小敬 刘钊 +2 位作者 蒋令闻 陈德训 杨广文 《计算机科学与探索》 CSCD 北大核心 2019年第11期1852-1863,共12页
三维声弹性理论及计算方法为海洋弹性浮体结构流固耦合振动声辐射与海洋声传播提供了理论基础,在海洋弹性浮体结构研究中具有很重要的影响。根据三维声弹性不同计算阶段计算密度特征,基于神威太湖之光超级计算系统,完成了三维声弹性应... 三维声弹性理论及计算方法为海洋弹性浮体结构流固耦合振动声辐射与海洋声传播提供了理论基础,在海洋弹性浮体结构研究中具有很重要的影响。根据三维声弹性不同计算阶段计算密度特征,基于神威太湖之光超级计算系统,完成了三维声弹性应用软件(THAFTS-Acoustic)的多级并行和优化。优化技术包括循环分裂、循环合并、直接内存存取(DMA)、通信和计算的相互隐藏、基于神威太湖之光的向量化(SIMD)等方法。测试结果表明:三维声弹性多级异构并行具有较好的MPI扩展性能和众核并行加速效果,核心段加速可达18倍,64进程时程序整体相较原始程序并行程序加速5.5倍,可有效地发挥"神威·太湖之光"的强大计算能力,进一步支持THAFTS-Acoustic进行超大规模和更高精度的并行计算。 展开更多
关键词 三维声弹性 神威太湖之光 多级异构并行
下载PDF
面向国产神威众核架构的区域气候模式CWRF性能优化技术
4
作者 吕小敬 刘钊 +1 位作者 蔡蕙伊 李锦薇 《电子技术应用》 2022年第1期31-38,共8页
区域气候模式CWRF(Climate-Weather Research and Forecasting model)是国家气候中心区域气候预测系统的重要组成部分,也是系统最耗时的程序。高性能计算是提高CWRF数值预报计算性能的关键技术,开展CWRF模式在国产神威众核架构上的移植... 区域气候模式CWRF(Climate-Weather Research and Forecasting model)是国家气候中心区域气候预测系统的重要组成部分,也是系统最耗时的程序。高性能计算是提高CWRF数值预报计算性能的关键技术,开展CWRF模式在国产神威众核架构上的移植和优化,提高模式的模拟效率,对模式的扩展、开发能力和可持续发展具有重要意义。基于国产众核SW26010处理器,完成了CWRF区域气候模式的移植、性能分析和深入性能优化,采用访存优化、Cache命中率优化及众核加速优化等方法,对CWRF模式动力过程、物理过程和I/O过程计算代码进行重构及众核加速。结果表明:优化技术可使CWRF动力过程平均加速2倍,最高加速6.4倍,物理过程平均加速1.7倍,最高加速5.4倍,I/O过程加速1.2倍,程序整体最高加速1.4倍,计算误差在合理范围内。 展开更多
关键词 CWRF 高性能计算 神威 SW26010
下载PDF
基于神威太湖之光的宇宙学多体模拟
5
作者 刘旭 张曦煌 +2 位作者 刘钊 吕小敬 朱光辉 《计算机工程》 CAS CSCD 北大核心 2020年第9期35-43,共9页
宇宙学模拟对于科学家研究非线性结构的形成以及暗物质、暗能量等假想形式具有重要作用,而高精度宇宙学模拟包含数千亿甚至数万亿个粒子,因此超级计算机强大的计算能力使其成为解决宇宙学模拟问题的理想平台。为在国产神威太湖之光超级... 宇宙学模拟对于科学家研究非线性结构的形成以及暗物质、暗能量等假想形式具有重要作用,而高精度宇宙学模拟包含数千亿甚至数万亿个粒子,因此超级计算机强大的计算能力使其成为解决宇宙学模拟问题的理想平台。为在国产神威太湖之光超级计算机上实现宇宙学N体模拟,分析PHoToNs软件中使用的粒子网格算法和快速多极子方法,并结合众核处理器架构提出多层次分解和负载均衡方案、执行树遍历和引力计算的流水线策略以及向量化引力计算算法等多种性能优化技术,从而实现能充分发挥神威太湖之光架构优势的N体模拟软件SwPHoToNs。实验结果表明,在神威太湖之光超级计算系统的5200000个计算核心上进行包含6400亿个粒子的宇宙学模拟,SwPHoToNs获得了29.44 PFLOPS的持续计算速度,且并行和计算效率分别为84.6%和48.3%。 展开更多
关键词 神威太湖之光 宇宙学 多体模拟 并行优化 可扩展性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部