期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
申威处理器上数据流运行时系统的设计与实现
1
作者 张鹏飞 陈俊仕 +3 位作者 郑重 沈沛祺 安虹 许乐 《计算机工程》 CAS CSCD 北大核心 2023年第12期46-54,共9页
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、... 我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、点对点同步的特点能够很好地解决上述问题。基于Codelet程序执行模型和申威主从核架构特点,设计并实现面向申威处理器的数据流运行时系统swTasklet,通过对Codelet功能的进一步细化和对Codelet机器模型到主从核的映射,避免从核阵列上的同步操作,减少同步开销;由主核完成从核计算任务的调度分配,将计算和同步操作分离,保证运行时系统可以和从核计算库的共用。实验以NPB LU程序和向量-向量加作为测试用例,采用相同的优化方法分别对swTasklet和athread实现进行并行化。实验结果表明:在规模较大情况下,LU程序的swTasklet实现版本比athread版本快16%,向量-向量加swTasklet实现版本比athread版本快1倍;使用swTasklet实现的LU并行版本较主核本取得了平均8倍以上的加速,而向量-向量加swTasklet版本较主核版本取得30倍左右的加速。 展开更多
关键词 申威异构处理器 数据流运行时系统 Codelet程序执行模型 并行编程模型 众核加速
下载PDF
面向新一代国产异构众核处理器的数据流计算系统
2
作者 肖谦 赵美佳 +5 位作者 李名凡 沈莉 陈俊仕 周文浩 王飞 安虹 《计算机研究与发展》 EI CSCD 北大核心 2023年第10期2405-2417,共13页
如今,科学研究已从计算科学时代进入数据科学时代.从海量数据中发现规律和突破科学发展瓶颈是数据科学范式的主要目标.与此同时,高性能计算机(HPC)也越来越重视智能算力,在传统高性能计算方法的基础上融合人工智能算法(HPC+AI),更有利... 如今,科学研究已从计算科学时代进入数据科学时代.从海量数据中发现规律和突破科学发展瓶颈是数据科学范式的主要目标.与此同时,高性能计算机(HPC)也越来越重视智能算力,在传统高性能计算方法的基础上融合人工智能算法(HPC+AI),更有利于在数据科学时代解决实际问题,并能充分发挥高性能计算机的智能算力.不过,在国产HPC系统——特别是面向由新一代国产异构众核处理器sw26010pro构建的HPC系统——上支撑HPC+AI领域应用,则面临着诸多挑战.提出了一种面向国产异构众核处理器的数据流计算系统swFLOWpro,支持使用TensorFlow接口构建数据流程序,实现对用户透明的众核加速,并实现了面向全处理器视角的两级并行策略.经测试,系统针对典型核心计算,单核组众核加速比最高可达545倍、典型模型众核加速比最高可达346倍,全片6核组并行执行ResNet50模型训练,对比单核组加速比达到4.96倍,并行效率82.6%.实验表明,swFLOWpro能够支持以深度学习为代表的数据流程序在国产异构众核处理器上的高效运行. 展开更多
关键词 数据流 深度学习 异构众核 swFLOWpro系统 高性能计算
下载PDF
基于神威太湖之光的NAMD软件的移植与优化 被引量:10
3
作者 姚文军 陈俊仕 +3 位作者 苏志超 余洋 廖陈志 安虹 《计算机工程与科学》 CSCD 北大核心 2017年第6期1022-1030,共9页
纳米级粒度分子动力学NAMD是基于Charm++并行编程模型的开源免费分子动力学模拟软件,能够在大规模并行计算机上快速模拟百万原子级别的大分子体系。太湖之光是中国自主研发的超级计算机,峰值性能为125.4Pflop/s,共有1 000多万个核心,整... 纳米级粒度分子动力学NAMD是基于Charm++并行编程模型的开源免费分子动力学模拟软件,能够在大规模并行计算机上快速模拟百万原子级别的大分子体系。太湖之光是中国自主研发的超级计算机,峰值性能为125.4Pflop/s,共有1 000多万个核心,整机Linpack效率不低于70%。NAMD在空间上对原子进行划分,在计算上对力进行划分,充分曝露出单步模拟的并行度,并通过CHARM++对负载平衡进行调控。针对NAMD进行模拟计算时的特点,移植并优化了NAMD的核心计算代码,让其能够更好地运行在超级计算机神威太湖之光上,优化后性能提高了近20倍,单个核组的性能较Intel XeonE5-2650v2提高3倍。扩展性方面目前至多可达到325万核的并行度,突破百万核大关。 展开更多
关键词 分子动力学模拟 神威超级计算机 异构多核处理器
下载PDF
功耗受限情况下多核处理器能效优化方案 被引量:3
4
作者 邱晓杰 安虹 +2 位作者 陈俊仕 迟孟贤 金旭 《计算机工程》 CAS CSCD 北大核心 2017年第4期39-45,共7页
将处理器功耗控制在预算以下有助于降低散热成本和提升系统稳定性,但现有功耗优化方案大多依赖线下分析得到的先验知识,影响实用性,而集中式搜索最优策略的算法也存在复杂度过高的问题。为此,提出功耗优化方案PPCM。利用动态电压频率调... 将处理器功耗控制在预算以下有助于降低散热成本和提升系统稳定性,但现有功耗优化方案大多依赖线下分析得到的先验知识,影响实用性,而集中式搜索最优策略的算法也存在复杂度过高的问题。为此,提出功耗优化方案PPCM。利用动态电压频率调整(DVFS)技术控制CPU功耗在预算内以提高处理器能效。同时,将功耗控制和功耗分配解耦合以提高灵活性。采用动态调整的线性模型估计功耗,通过反馈控制技术对其进行调节。以计算访存比为指标在应用间分配功耗,并考虑多线程应用特征进行线程间功耗分配。实验结果表明,PPCM比Priority算法速度平均提高10.7%,能耗平均降低5.1%,能量-延迟积平均降低14.3%。与PCM CA算法相比,其速度平均提高4.5%,能量-延迟积平均降低5.0%。 展开更多
关键词 功耗控制 功耗分配 能效优化 动态电压频率调整 计算访存比 线程关键度
下载PDF
利用访存负载平衡提高多核处理器系统吞吐量 被引量:1
5
作者 刘玉 安虹 +1 位作者 孙荪 陈俊仕 《小型微型计算机系统》 CSCD 北大核心 2014年第3期671-675,共5页
多任务并行执行是发挥多核处理器效能的常用手段,对多任务进行有效调度从而避免资源使用瓶颈是多核处理器任务调度的一个重要课题.本文针对多核处理器片上存储资源的使用提出一个访存负载平衡调度机制,通过刻画任务访存负载、操作系统... 多任务并行执行是发挥多核处理器效能的常用手段,对多任务进行有效调度从而避免资源使用瓶颈是多核处理器任务调度的一个重要课题.本文针对多核处理器片上存储资源的使用提出一个访存负载平衡调度机制,通过刻画任务访存负载、操作系统内核层性能检测,实现了集成的计算和访存负载协同平衡系统.该调度系统在区分任务访存特征的基础上,可以在操作系统内核层组织任务执行.通过对测试程序集合的实验验证,并与其它两种调度算法进行比较,相对于操作系统缺省的计算负载平衡机制,访存负载平衡调度系统可以提高多核处理器任务吞吐量达8.2%,并且具有较低的系统实现开销. 展开更多
关键词 访存负载平衡 多核处理器 系统吞吐量 内核级性能监测
下载PDF
CPU-GPU融合架构上的缓存性能分析与优化 被引量:3
6
作者 孙传伟 安虹 +1 位作者 孙荪 陈俊仕 《计算机工程与应用》 CSCD 北大核心 2017年第2期47-52,57,共7页
现今CPU和GPU的发展已经出现新的瓶颈,将两者"结合"在同一块芯片上成为一种新的趋势。这种新的异构架构给片上共享资源的管理带来压力。而共享末级缓存(LLC)的管理对性能的影响非常关键。由于CPU程序和GPU程序的不同特性,给CP... 现今CPU和GPU的发展已经出现新的瓶颈,将两者"结合"在同一块芯片上成为一种新的趋势。这种新的异构架构给片上共享资源的管理带来压力。而共享末级缓存(LLC)的管理对性能的影响非常关键。由于CPU程序和GPU程序的不同特性,给CPU和GPU间共享的末级缓存管理带来新的挑战。通过分析GPU程序访存特征,借鉴之前的缓存管理方案,提出对CPU-GPU融合系统的末级缓存进行等量的静态划分和最优静态划分的方案。实验结果表明:通过缓存划分可以有效避免CPU和GPU程序间的干扰。与传统LRU策略相比,等量静态划分和最优静态划分可以使系统整体性能分别提高7.68%和11.62%。 展开更多
关键词 异构架构 融合 共享末级缓存 静态缓存划分
下载PDF
众核平台上广度优先搜索算法的优化 被引量:3
7
作者 徐启泽 韩文廷 +1 位作者 陈俊仕 安虹 《计算机科学》 CSCD 北大核心 2019年第1期314-319,共6页
图算法在多个领域具有重要的应用价值。随着社会信息化程度的提高,需要处理的图数据量越来越大,图算法的性能已成为研究热点。广度优先搜索算法是一种重要的图算法,研究它的性能优化技术可以为其他图算法的性能优化提供借鉴。目前,在新... 图算法在多个领域具有重要的应用价值。随着社会信息化程度的提高,需要处理的图数据量越来越大,图算法的性能已成为研究热点。广度优先搜索算法是一种重要的图算法,研究它的性能优化技术可以为其他图算法的性能优化提供借鉴。目前,在新一代Xeon Phi众核处理器上的工作均基于自顶向下算法且没有考虑到非均匀访存(NUMA)对性能的影响。文中以混合广度优先搜索算法为基础,结合NUMA拓扑结构,从任务分配、向量化和数据预处理3个方面展开优化,在Xeon Phi平台上设计并实现了高性能并行广度优先搜索算法。一系列实验结果表明,优化后的算法在不同规模的测试数据上与Graph500官方优化的算法相比取得了50%~145%的性能提升。 展开更多
关键词 广度优先搜索 众核架构 非均匀访存 向量化 性能优化
下载PDF
基于神威太湖之光的AMBER软件移植与优化 被引量:5
8
作者 彭龙 陈俊仕 安虹 《计算机工程》 CAS CSCD 北大核心 2020年第12期12-20,共9页
AMBER是一款主流的分子动力学模拟软件,用于研究分子体系内的微观运动状态。为利用神威太湖之光的海量计算资源加速AMBER软件模拟分子体系的运动过程,将AMBER软件移植到SW26010处理器的主核上建立主从加速模型,实现AMBER软件的从核并行... AMBER是一款主流的分子动力学模拟软件,用于研究分子体系内的微观运动状态。为利用神威太湖之光的海量计算资源加速AMBER软件模拟分子体系的运动过程,将AMBER软件移植到SW26010处理器的主核上建立主从加速模型,实现AMBER软件的从核并行化设计。在从核并行化的基础上提出主从异步流水化方案,利用SW26010处理器从核的局部数据缓存和直接内存存取通道技术,解决从核访存速度过低及并行访存带宽受限的问题,并通过SIMD指令将部分从核代码向量化,进一步提升AMBER软件在神威太湖之光平台上的计算性能。测试结果表明,AMBER热点函数的计算性能较优化前约提升15倍,单核组的整体性能较Intel Xeon Platinum 8163约提升4.6倍。 展开更多
关键词 分子动力学模拟 神威太湖之光 异构众核处理器 并行优化 异步流水化
下载PDF
面向I/O密集型应用的分离执行模型的实现与优化 被引量:2
9
作者 颜秉辉 安虹 +1 位作者 梁伟浩 陈俊仕 《小型微型计算机系统》 CSCD 北大核心 2019年第12期2619-2623,共5页
在众多科学大数据计算应用中,I/O性能已逐渐成为制约应用程序性能的主要瓶颈.然而随着硬件设备的更新与发展,现有高性能计算系统的计算性能与I/O性能差距逐渐增大.传统的以计算为中心的执行模型旨在利用内存和CPU的性能来解决I/O瓶颈问... 在众多科学大数据计算应用中,I/O性能已逐渐成为制约应用程序性能的主要瓶颈.然而随着硬件设备的更新与发展,现有高性能计算系统的计算性能与I/O性能差距逐渐增大.传统的以计算为中心的执行模型旨在利用内存和CPU的性能来解决I/O瓶颈问题.本文面向I/O密集型的科学大数据应用,实现并优化了新的执行模型--分离执行模型.该模型通过分离应用的计算操作与I/O操作,对I/O操作予以统一的管理和调度,以此来解决当前HPC系统上具有挑战性的应用I/O瓶颈问题.分离执行模型在架构上增加专门负责I/O操作的中间节点;在实现上利用消息传递模型(MPI)的I/O操作接口,重新定义并划分I/O操作流程.实验表明,该模型有效减少数据在网络中的传输,加快计算过程对数据的访问,从而提升10%至20%的I/O性能.其以数据为中心的架构模型思想对我国下一代高性能超级计算机系统结构研发设计具有参考意义. 展开更多
关键词 科学大数据计算应用 高性能计算 I/O性能 分离执行模型
下载PDF
一种面向神威·太湖之光的通用并行卷积算法 被引量:1
10
作者 舒嘉明 安虹 +1 位作者 武铮 陈俊仕 《计算机工程》 CAS CSCD 北大核心 2019年第12期153-159,共7页
神威·太湖之光深度学习库中的并行卷积算法存在批量受限的问题,且传统gemm卷积算法在其硬件架构上效率较低。基于申威异构众核处理器,提出一种无批量限制的通用并行卷积算法。结合异步DMA访存操作和从核间的寄存器通信,使用数据重... 神威·太湖之光深度学习库中的并行卷积算法存在批量受限的问题,且传统gemm卷积算法在其硬件架构上效率较低。基于申威异构众核处理器,提出一种无批量限制的通用并行卷积算法。结合异步DMA访存操作和从核间的寄存器通信,使用数据重用和软件流水等方法降低从核访存开销,利用手动向量化的方法充分发挥从核浮点的计算能力。实验结果表明,与基础7层循环算法、gemm算法和Intel平台上的MKL-DNN算法相比,该算法的加速性能较好。 展开更多
关键词 神威·太湖之光 卷积神经网络 数据重用 软件流水 批量受限
下载PDF
基于神威·太湖之光的非结构网格计算加速算法 被引量:1
11
作者 许乐 安虹 +2 位作者 陈俊仕 张鹏飞 武铮 《计算机工程》 CAS CSCD 北大核心 2022年第12期45-53,共9页
在国产异构众核平台神威·太湖之光上的非结构网格计算具有稀疏存储、离散访存、数据依赖等特点,严重制约了众核处理器的性能发挥。为解决稀疏存储和离散访存问题,提出一种N阶对角染色算法,以有效平衡主从核计算并利用从核将全局访... 在国产异构众核平台神威·太湖之光上的非结构网格计算具有稀疏存储、离散访存、数据依赖等特点,严重制约了众核处理器的性能发挥。为解决稀疏存储和离散访存问题,提出一种N阶对角染色算法,以有效平衡主从核计算并利用从核将全局访存转化为LDM访问。针对数据依赖造成的计算竞争问题,采用自适应和无依赖的任务划分方法,避免并行计算时的数据冲突。为对处理器架构和非结构网格计算进行优化,采用主核与从核异步并行的方式,差异化使用主从核以充分利用硬件资源,同时,取消处理器提供的寄存器通信机制,降低从核阵列的同步开销同时便于扩展到新一代神威平台。此外,使用计算访存异步重叠技术来充分隐藏访存延迟。利用SpMV、Integration、calcLudsFcc算子进行实验,结果表明,相比主核实现,组合加速算法在不同算例规模下平均取得了10倍的加速效果,加速比最高可达24倍,N阶对角染色算法相比非染色分块算法取得了超过5.8倍的性能加速,有效提升了数据局部性和计算并行度。该算法对有依赖关系的计算冲突算子同样具有良好的加速性能,验证了自适应和无依赖任务划分方法的有效性。 展开更多
关键词 神威·太湖之光 非结构网格 众核加速 离散访存 无依赖任务划分
下载PDF
PME算法在神威太湖之光上的移植和优化 被引量:1
12
作者 林增 武铮 +1 位作者 安虹 陈俊仕 《小型微型计算机系统》 CSCD 北大核心 2021年第1期9-14,共6页
分子动力学模拟(MD)是一套通过计算机模拟生物体系内分子、原子运动的多体模拟方法.GROMACS是著名的MD应用,能够快速模拟生物及非生物体系运动过程,广泛应用于各高性能平台.作为世界排名第3的超级计算机,神威太湖之光拥有40960块SW2601... 分子动力学模拟(MD)是一套通过计算机模拟生物体系内分子、原子运动的多体模拟方法.GROMACS是著名的MD应用,能够快速模拟生物及非生物体系运动过程,广泛应用于各高性能平台.作为世界排名第3的超级计算机,神威太湖之光拥有40960块SW26010异构众核处理器,峰值性能达到125.4PFlops.目前太湖之光上已有对GROM ACS短程力优化的相关研究,但对于PM E(Particle Mesh Ewald)算法未有探索性工作.本文基于申威平台对PME算法展开研究,针对随机访存模式、网格点写写冲突等挑战,提出了基于局部网格序的分块策略、数据重组策略、非线性函数近似等方法进行优化.最终优化后的结果相较于初始版本性能提升了8.85倍,相较于Intel CPU版本提升了1.2倍.本文采用的优化技术也可以为神威太湖之光上其他分子动力学模拟软件和涉及散乱数据插值程序的优化提供借鉴. 展开更多
关键词 PME GROMACS 神威太湖之光 异构众核处理器
下载PDF
商用处理器上针对能耗优化的DVFS调节机制
13
作者 陈志韬 安虹 +2 位作者 邱晓杰 李丰 陈俊仕 《计算机工程》 CAS CSCD 北大核心 2017年第3期46-50,56,共6页
针对动态电压频率调节(DVFS)对应用程序运行时性能与功耗的影响,基于区间划分方法,使用现有商用处理器提供的性能监测单元,提出一种考虑访存延迟变化的DVFS性能预测模型,并利用该模型实现针对能耗优化的DVFS调节机制(eDVFS)。实验结果表... 针对动态电压频率调节(DVFS)对应用程序运行时性能与功耗的影响,基于区间划分方法,使用现有商用处理器提供的性能监测单元,提出一种考虑访存延迟变化的DVFS性能预测模型,并利用该模型实现针对能耗优化的DVFS调节机制(eDVFS)。实验结果表明,与Linux内核提供的ondemand调节策略相比,该eDVFS调节机制能够获得最大23%、平均6.85%的能耗优化。 展开更多
关键词 动态电压频率调节 功耗预测模型 性能预测模型 电压频率调节机制 能耗优化
下载PDF
利用分组算法实现高效的并行程序模型检测
14
作者 王云云 韩文廷 +3 位作者 周军蕊 陈俊仕 姚文军 安虹 《小型微型计算机系统》 CSCD 北大核心 2016年第9期1898-1903,共6页
在并行时代,模型检测技术(通常也被称为状态空间搜索)是验证并行程序正确性的有效方法.由于线程执行次序的不确定性,线程之间交互次序的改变导致程序状态呈指数性增长,因此在利用状态空间搜索法搜索程序状态时,状态爆炸是亟需解决的难题... 在并行时代,模型检测技术(通常也被称为状态空间搜索)是验证并行程序正确性的有效方法.由于线程执行次序的不确定性,线程之间交互次序的改变导致程序状态呈指数性增长,因此在利用状态空间搜索法搜索程序状态时,状态爆炸是亟需解决的难题.为了改善该问题,提出基于分组的模型检测方法.针对操作不同变量的线程,在程序中简单添加制导语句对其进行分组,之后利用该分组信息搜索状态空间,并实时记录已完成搜索的分组信息,从而避免搜索冗余状态.实验结果表明,本文提出的方案对于缓解状态爆炸问题有很好的效果,制导分组前后,测试程序的状态集平均减少了67%,有效提高了并行程序验证效率. 展开更多
关键词 制导语言 源到源编译 模型检测 分组
下载PDF
还给学生学习的主动权
15
作者 陈俊仕 《课程教育研究(学法教法研究)》 2017年第13期295-295,共1页
纵观我们的课堂教学。存在着以讲为主,学生被动接受的现象。教师是学生学习的主宰者,学生学会,怎样学,都在教师的严格控制之下,稍有不从就要受到教师的指责,这种形式下教育的学生缺乏个性和创造性。不能适应未来社会的发展。近年... 纵观我们的课堂教学。存在着以讲为主,学生被动接受的现象。教师是学生学习的主宰者,学生学会,怎样学,都在教师的严格控制之下,稍有不从就要受到教师的指责,这种形式下教育的学生缺乏个性和创造性。不能适应未来社会的发展。近年来我们进行了创新教育课堂教学的研究,深刻体会到还给学生学习的主动权,让学生在课堂上真正“活”起来,让学生插上创新的翅膀,自由飞翔。 展开更多
关键词 主动权 学生 学习 课堂教学 创新教育 被动接受 教师 创造性
下载PDF
打造特色班级文化
16
作者 高彩云 陈俊仕 《湖北教育》 2019年第7期10-10,共1页
营造和谐融洽、积极向上、富有特色的班级文化,不仅有利于学生的健康成长,也是每个班主任做好日常工作的必然要求.创建班级环境文化.良好的班级环境带给学生不只是身心愉悦,更是美的享受.好的班级环境更像一位无声的老师,在无形中对学... 营造和谐融洽、积极向上、富有特色的班级文化,不仅有利于学生的健康成长,也是每个班主任做好日常工作的必然要求.创建班级环境文化.良好的班级环境带给学生不只是身心愉悦,更是美的享受.好的班级环境更像一位无声的老师,在无形中对学生的健康成长起着潜移默化的作用. 展开更多
关键词 文化 班主任 特色 学生 班级 工作 环境
下载PDF
基于神威太湖之光百万核高性能计算的数万原子第一性原理间断有限元密度泛函理论模拟 被引量:2
17
作者 胡伟 秦新明 +9 位作者 姜庆彩 陈俊仕 安虹 贾伟乐 李芳 刘鑫 陈德训 刘芳芳 赵玉文 杨金龙 《Science Bulletin》 SCIE EI CSCD 2021年第2期111-119,M0003,共10页
高性能计算(HPC)是在现代异构超级计算机上加速Kohn-Sham密度泛函理论(KS-DFT)计算的有力手段.本文描述了DGDFT方法在神威太湖之光超级计算机上大规模并行计算的代码实现和优化.DGDFT方法是利用自洽场(SCF)迭代过程中动态生成的自适应... 高性能计算(HPC)是在现代异构超级计算机上加速Kohn-Sham密度泛函理论(KS-DFT)计算的有力手段.本文描述了DGDFT方法在神威太湖之光超级计算机上大规模并行计算的代码实现和优化.DGDFT方法是利用自洽场(SCF)迭代过程中动态生成的自适应局域基函数(ALB)来求解KS方程,具有可媲美平波基组的高精度计算结果.特别地,DGDFT方法采用了两级并行化策略,用于处理并行计算中各种类型的数据分布、任务调度和数据通信方案等;同时结合了SW26010处理器的主从核多线程异构并行,在神威太湖之光上实现了超大规模高性能KS-DFT计算模拟.计算结果表明,DGDFT方法已经在神威太湖之光超级计算机上并行扩展到了8519680个计算处理核(131072个核组),可用于研究含有数万碳原子的二维金属石墨烯体系的电子结构性质. 展开更多
关键词 超级计算机 高性能计算 数据分布 任务调度 多线程 并行计算 间断有限元 第一性原理
原文传递
基于中国神威超算构建包含气溶胶反馈的全球3 km非静力平衡大气模拟系统(iAMAS)
18
作者 顾俊 冯家望 +10 位作者 郝晓宇 方涛 赵纯 安虹 陈俊仕 许明月 李建 韩文廷 杨超 李芳 陈德训 《Science Bulletin》 SCIE EI CSCD 2022年第11期1170-1181,共12页
大气数值模拟是研究前沿大气科学问题的重要途径,也是预测极端天气、气候变化、空气质量的关键手段.大气系统包括不同时空尺度过程以及它们之间的相互作用,例如大气物理过程和气溶胶过程间的相互作用.在大气动力和物理的基础上发展气溶... 大气数值模拟是研究前沿大气科学问题的重要途径,也是预测极端天气、气候变化、空气质量的关键手段.大气系统包括不同时空尺度过程以及它们之间的相互作用,例如大气物理过程和气溶胶过程间的相互作用.在大气动力和物理的基础上发展气溶胶过程及其反馈作用,进而开展大气全耦合数值模拟,可以显著提升大气数值模拟能力.基于国产神威超算平台,本研究发展了全球高分辨率大气模拟中的气溶胶过程,修改了I/O策略并优化了计算方法,最终提升了大气全耦合数值计算效率,实现了全球3 km大气物理-气溶胶高效数值模拟,在I/O速度和计算效率、可扩展性、时效性等多个方面填补了国内外空白.数值模拟实验扩展到600000进程,并行效率仍保持在76.2%,在常规模拟I/O情景下实现了每小时运算0.82天的模拟速度.模拟结果展现了高分辨率和耦合气溶胶效应对数值天气预报的重要性,并初步揭示了大气多尺度过程间相互作用机制及其对大气污染、天气、气候变化数值模拟的影响. 展开更多
关键词 数值天气预报 大气科学 大气动力 极端天气 气候变化 模拟系统 大气系统 气溶胶
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部