期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
面向神威·太湖之光的PETSc可扩展异构并行算法及其性能优化 被引量:14
1
作者 洪文杰 李肯立 +4 位作者 全哲 阳王东 李克勤 郝子宇 谢向辉 《计算机学报》 EI CSCD 北大核心 2017年第9期2057-2069,共13页
共性数学库PETSc(Portable,Extensible Toolkit for Scientific Computation)是高性能计算的基础模块,是超级计算机计算环境的基础算法库之一,其性能直接影响调用数学库的高性能数值计算应用的效率.面向国际上首台100P神威·太湖之... 共性数学库PETSc(Portable,Extensible Toolkit for Scientific Computation)是高性能计算的基础模块,是超级计算机计算环境的基础算法库之一,其性能直接影响调用数学库的高性能数值计算应用的效率.面向国际上首台100P神威·太湖之光异构超级计算机,根据实际研究需要选取PETSc中两个典型用例ex5(单节点线性求解方程组问题)和ex19(多节点求解2D驱动腔问题)进行实验探究.对运行结果分析找到的热点函数主要为PETSc函数库中7个核心函数,针对这7个核心函数(主要包括向量运算与矩阵运算),提出和实现了其异构并行算法,并结合机器的异构体系结构提出了相应的性能优化方法.在超级计算机上的实验结果为:核心函数并行算法在4主核、256从核的单节点上加速比最大可达到16.4;多节点情况下,当输入规模为16 384时,8192个节点相对于256节点的加速比为32,且加速比随着异构处理器数目的增加接近线性增加,表明PETSc核心函数并行算法在神威·太湖之光超级计算机上具有良好的可扩展性. 展开更多
关键词 并行算法设计 petsc数学库 可扩展性 神威·太湖之光
下载PDF
利用PETSc和FEPG编制海啸数值模拟程序的研究 被引量:2
2
作者 张超凡 石耀霖 《地震》 CSCD 北大核心 2008年第1期47-56,共10页
海啸的数值模拟是海啸研究的一个重要领域,它对于帮助理解海啸的基本物理特性和预防减灾具有重要意义。海啸数值模拟程序的编制是一项繁杂的工作,该文介绍了利用两种功能强大的通用软件(PETSc和FEPG)来进行海啸数值模拟程序编写的研究。... 海啸的数值模拟是海啸研究的一个重要领域,它对于帮助理解海啸的基本物理特性和预防减灾具有重要意义。海啸数值模拟程序的编制是一项繁杂的工作,该文介绍了利用两种功能强大的通用软件(PETSc和FEPG)来进行海啸数值模拟程序编写的研究。PETSc和FEPG采用有限差分、有限元、有限体积等多种离散方法,可以对数值问题给出稳定的求解。该文采用了直角坐标系下的非线性浅水波方程作为海啸波传播的控制方程进行离散求解,并将其结果与TUNAMI N1模型进行了比较,表明这两种方法方便而且有效。 展开更多
关键词 海啸 数值模拟 非线性浅水波方程 petsc FEPG
下载PDF
采用PETSc的有限元并行计算实现与优化 被引量:3
3
作者 张健飞 《计算机工程与应用》 CSCD 北大核心 2010年第10期57-59,共3页
可移植可扩展科学计算工具箱PETSc提供了高性能求解偏微分方程组的大量对象和解法库,基于此进行结构有限元并行计算,可降低难度和成本。给出了基于PETS的结构有限元并行计算实现方法,包括有限元方程组的并行形成和并行求解的实现。根据P... 可移植可扩展科学计算工具箱PETSc提供了高性能求解偏微分方程组的大量对象和解法库,基于此进行结构有限元并行计算,可降低难度和成本。给出了基于PETS的结构有限元并行计算实现方法,包括有限元方程组的并行形成和并行求解的实现。根据PETSc的特点,提出了提高计算性能的优化措施,即数据局部化和存储预分配。数值实验表明实现方法可行,优化措施效果明显。 展开更多
关键词 可移植可扩展科学计算工具箱(petsc) 有限元 并行计算 数据局部化 存储预分配
下载PDF
基于TAO与PETSc的MPI并行编程及应用
4
作者 王建 迟学斌 姜金荣 《微电子学与计算机》 CSCD 北大核心 2004年第10期113-116,共4页
文章介绍了TAO和PETSc以及MPI的编程方法,并且通过具体实例就如何在高性能机器上基于TAO进行并行求解最优化问题的编程作了讨论,所给出的程序代码均已在曙光2000II上运行成功,并和基于MPI手工编写的并行代码作了比较。
关键词 TAO petsc MPI HPC 并行编程 并行计算
下载PDF
基于PETSc上的Fortran编程
5
作者 程海英 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2003年第2期127-130,共4页
介绍了可移植可扩展科学计算工具箱(PETSc:Portable,ExtensibleToolkitforScientificCom putation)及MPI编程的方法,通过具体实例讨论了如何在高性能计算机上基于PETSc进行Fortran语言的并行编程,所给出的程序代码均已运行成功,并给出... 介绍了可移植可扩展科学计算工具箱(PETSc:Portable,ExtensibleToolkitforScientificCom putation)及MPI编程的方法,通过具体实例讨论了如何在高性能计算机上基于PETSc进行Fortran语言的并行编程,所给出的程序代码均已运行成功,并给出了具体结果. 展开更多
关键词 FORTRAN语言 并行计算 并行算法 程序设计 petsc 可移植可扩展科学计算工具箱 MPI编程
下载PDF
PETSc及其典型开源计算流体力学应用 被引量:2
6
作者 钟英 张理论 刘巍 《计算机应用》 CSCD 北大核心 2013年第A02期63-66,共4页
PETSc作为一个典型的通用数值并行软件框架,近年来在诸多领域获得应用。着眼计算流体力学(CFD)领域,研究了PETSc的两个典型开源应用:PETSc-FUN3D和PFLOTRAN,着重分析二者在利用PETSc软件框架方面的方法、思路与效果,评述了PETSc对CFD领... PETSc作为一个典型的通用数值并行软件框架,近年来在诸多领域获得应用。着眼计算流体力学(CFD)领域,研究了PETSc的两个典型开源应用:PETSc-FUN3D和PFLOTRAN,着重分析二者在利用PETSc软件框架方面的方法、思路与效果,评述了PETSc对CFD领域的应用优势及众核异构体系结构对传统并行软件框架技术带来的挑战。 展开更多
关键词 并行软件框架 petsc 计算流体力学 众核
下载PDF
基于PETSc的MPI编程方法及应用
7
作者 庞新琴 《安徽工程科技学院学报(自然科学版)》 2003年第2期46-48,共3页
介绍了可移植可扩展科学计算工具箱(PETSc:Portable,ExtensibleToolkitforScientificComputation)及MPI编程的方法,并且通过具体实例就如何在高性能计算机上基于PETSc进行并行编程作了讨论,所给出的程序代码均已运行成功,并和基于MPI方... 介绍了可移植可扩展科学计算工具箱(PETSc:Portable,ExtensibleToolkitforScientificComputation)及MPI编程的方法,并且通过具体实例就如何在高性能计算机上基于PETSc进行并行编程作了讨论,所给出的程序代码均已运行成功,并和基于MPI方法手工编写的并行代码作了比较,并给出具体结果. 展开更多
关键词 可移植可扩展科学计算工具箱 petsc MPI编程 并行计算 并行算法
下载PDF
基于PETSc的有限元高性能求解方法 被引量:1
8
作者 高怀玉 张峰 秦忠国 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期365-370,共6页
基于科学计算工具箱PETSc提供的应用开发平台,针对单机多核计算机开发出一种线性并行求解器。用C++类的形式封装求解线性有限元问题必需的数据和操作,并行使用迭代法求解线性有限元问题。算例测试结果表明,在内存为3G的四核计算机上可... 基于科学计算工具箱PETSc提供的应用开发平台,针对单机多核计算机开发出一种线性并行求解器。用C++类的形式封装求解线性有限元问题必需的数据和操作,并行使用迭代法求解线性有限元问题。算例测试结果表明,在内存为3G的四核计算机上可以计算节点数达80万的三维线性有限元问题;在运行2个进程计算时加速比达到1.81,4个进程计算时为3.24;求解器对于病态方程组有良好的适应能力;对于材料弹性模量相差10万倍的有限元模型,迭代也能收敛。 展开更多
关键词 有限元 线性方程组 并行计算 petsc
下载PDF
PETSC库在自强2000上的移植及其并行性能分析
9
作者 潘楷钱 雷咏梅 《计算机工程》 CAS CSCD 北大核心 2004年第3期96-98,共3页
论述了PETSC在自强2000集群式高性能计算机上的移植与实现,结合五对角线性方程问题实例,分析了其在高性能计算机上的并行性能。
关键词 petsc 可扩展 高性能计算机 并行性能
下载PDF
基于PETSc的非线性逆向运动并行计算方法研究
10
作者 范志瑞 阎军 +4 位作者 牛斌 隋倩倩 许琦 蒋存存 赵国忠 《计算力学学报》 CAS CSCD 北大核心 2021年第6期695-703,共9页
在考虑几何非线性的有限元分析中,初始构型和变形构型是严格区分的,并且变形后的构型对结构性能和功能的实现往往具有重要意义。传统的非线性有限元分析主要面向变形前的初始构型为导向的设计问题,而对于变形后构型为导向的设计问题则... 在考虑几何非线性的有限元分析中,初始构型和变形构型是严格区分的,并且变形后的构型对结构性能和功能的实现往往具有重要意义。传统的非线性有限元分析主要面向变形前的初始构型为导向的设计问题,而对于变形后构型为导向的设计问题则有较大局限性。针对此问题,引入非线性逆向运动分析方法,为了保证大变形非线性分析迭代的收敛性和计算效率,基于PETSc函数库建立了并行分析框架,并对并行框架中的模块划分、数据并行存储以及通信锁死和负载平衡等进行了详细阐述。在算例部分,首先通过正向运动和逆向运动分析结果对比,阐述了两种分析方法的不同以及逆向运动分析方法对变形前构型求解的准确性;其次,采用不同MPI进程数对并行分析程序的效率进行了测试。结果表明,合理地选择MPI进程数目可显著提高非线性逆向运动分析的效率。 展开更多
关键词 逆向运动分析 非线性分析 有限元方法 并行计算 petsc
下载PDF
PETSc库在网格环境下的应用研究
11
作者 罗义斌 徐炜民 潘楷钱 《计算机工程》 CAS CSCD 北大核心 2004年第24期82-85,共4页
网格计算的推广应用,需要各种资源和服务的支持。在自强2000集群系统上,采用基于OGSI的GT3网格技术,实现PETSc的网格服务,提供PETSc源程序的编译及PETSc并行作业的管理功能,用于在网格环境下为远程用户解决各种复杂的科学计算问题。
关键词 可移植可扩展科学计算工具箱 开放网格服务体系 GLOBUS Toolkit3.0 PBS
下载PDF
Application of PETSc in Soil-Water Coupled Geotechnical Problems
12
作者 狄东超 叶冠林 +1 位作者 夏小和 王建华 《Journal of Shanghai Jiaotong university(Science)》 EI 2013年第4期401-408,共8页
In this paper, parallel library, portable extensible toolkit for scientific computation (FETSc), 18 used to solve linear systems in soil-water coupled finite element method (FEM) for geotechnical problems. The par... In this paper, parallel library, portable extensible toolkit for scientific computation (FETSc), 18 used to solve linear systems in soil-water coupled finite element method (FEM) for geotechnical problems. The parallel environment is integrated into GLEAVES, which is a geotechnical software package used for the finite elementsimulation. The linear system Ax = b which is a fundamental and the most time-consuming part of the FEM is solved with iterative solvers in PETSc. In order to find a robust and effective combination of iterative solvers and corresponding preconditioners for the soil-water coupled problems, performance evaluations on Krylov subspace methods and four preconditioners are carried out. The results indicate that general minimal residual (GMRES) method coupled with preconditioners can provide an effective solution. The application to a construction project is presented to illustrate the potential of the proposed solution. 展开更多
关键词 portable extensible toolkit for scientific computation petsc parallel computing soil-water cou- pled geotechnical problem
原文传递
求解三对角方程组的两种并行方法比较 被引量:1
13
作者 程海英 谢江 邵华钢 《计算机应用与软件》 CSCD 2010年第11期76-78,共3页
求解偏微分方程组是许多流体力学问题的数值模拟中所碰到的关键问题之一,但是设计相应的并行算法并实现都会碰到开发周期长,难度大的问题。介绍的可移植可扩展科学计算工具箱PETSc(Portable,Extensible Toolkit for Scientific Computat... 求解偏微分方程组是许多流体力学问题的数值模拟中所碰到的关键问题之一,但是设计相应的并行算法并实现都会碰到开发周期长,难度大的问题。介绍的可移植可扩展科学计算工具箱PETSc(Portable,Extensible Toolkit for Scientific Computation)突破性地解决了这一问题,它能够实现自动并行处理。通过求解三对角方程问题实例,并和基于MPI(message passing interface)方法手工编写的并行代码作了比较,给出了并行性能的分析结果。 展开更多
关键词 petsc 并行计算 并行算法 MPI编程
下载PDF
自适应大型线性方程组并行算法
14
作者 赵航涛 《现代计算机》 2009年第7期41-45,共5页
研究工程数值分析中的矩阵类型和对应的并行求解算法,提出自适应的大型线性方程并行求解算法,并在自己建立的机群上进行了二个实验,实验结果表明自适算法能够根据用户的参数自动从算法库中选择出最佳的并行算法,计算出相应的最佳计算节... 研究工程数值分析中的矩阵类型和对应的并行求解算法,提出自适应的大型线性方程并行求解算法,并在自己建立的机群上进行了二个实验,实验结果表明自适算法能够根据用户的参数自动从算法库中选择出最佳的并行算法,计算出相应的最佳计算节点数,从而提高了线性方程组并行算法的通用性,大大降低工程数值分析的难度。 展开更多
关键词 线性方程组 PCG算法 GMRES算法 LU算法 petsc 自适应
下载PDF
基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题 被引量:1
15
作者 张理论 宋君强 +1 位作者 赵文涛 胡江林 《气象学报》 CAS CSCD 北大核心 2011年第3期432-439,共8页
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高... 亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(PETSc)的GRAPES全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对GRAPES在用解法器、代数多重网格、并行不完全LU分解(EUCLID)及加性Schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示PETSc结合高性能预条件库的并行方案是解决GRAPES模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于GRAPES现有解法器,更适用于更高精度和较大规模并行计算。 展开更多
关键词 GRAPES 亥姆霍兹方程 并行可扩展科学计算工具集 高性能预条件库 预条件
下载PDF
大规模水闸非线性有限元并行计算研究
16
作者 张向阳 秦忠国 《大连交通大学学报》 CAS 2016年第1期40-43,共4页
借助开源的PETSc并行数值算法包,使用C++编写了一个基于消息传递模式的非线性弹性有限元的并行计算程序.程序通过多次调用PETSc中的求解器组件KSP完成了Duncan-Chang双曲线模型的并行有限元分析.最后通过一个实际工程水闸模型进行测试,... 借助开源的PETSc并行数值算法包,使用C++编写了一个基于消息传递模式的非线性弹性有限元的并行计算程序.程序通过多次调用PETSc中的求解器组件KSP完成了Duncan-Chang双曲线模型的并行有限元分析.最后通过一个实际工程水闸模型进行测试,结果表明多线程的计算效率比单线程的计算效率要高,四个进程的加速比达到了1.91.同时也表明,通过借助于成熟的数学工具箱进行非线性有限元并行程序开发是可行的,有效的. 展开更多
关键词 非线性有限元 增量法 并行程序 petsc
下载PDF
A Comparison of Techniques for Solving the Poisson Equation in CFD
17
作者 Nick Brown 《民用飞机设计与研究》 2017年第3期85-94,共10页
CFD is a ubiquitous technique central to much of computational simulation such as that required by aircraft design.Solving of the Poisson equation occurs frequently in CFD and there are a number of possible approaches... CFD is a ubiquitous technique central to much of computational simulation such as that required by aircraft design.Solving of the Poisson equation occurs frequently in CFD and there are a number of possible approaches one may leverage.The dynamical core of the MONC atmospheric model is one example of CFD which requires the solving of the Poisson equation to determine pressure terms.Traditionally this aspect of the model has been very time consuming and so it is important to consider how we might reduce the runtime cost.In this paper we survey the different approaches implemented in MONC to perform the pressure solve.Designed to take advantage of large scale,modern,HPC machines,we are concerned with the computation and communication behaviour of the available techniques and in this text we focus on direct FFT and indirect iterative methods.In addition to describing the implementation of these techniques we illustrate on up to 32768 processor cores of a Cray XC30 both the performance and scalability of our approaches.Raw runtime is not the only measure so we also make some comments around the stability and accuracy of solution.The result of this work are a number of techniques,optimised for large scale HPC systems,and an understanding of which is most appropriate in different situations. 展开更多
关键词 飞行器 设计方案 飞机 理论研究
下载PDF
一种适用于三维混合网格的GMRES加速收敛新方法 被引量:6
18
作者 张健 邓有奇 +1 位作者 李彬 张耀冰 《航空学报》 EI CAS CSCD 北大核心 2016年第11期3226-3235,共10页
为提高流场计算收敛效率,发展了一套适用于三维混合网格Naiver-Stokes方程求解的并行广义最小残差(GMRES)隐式时间推进方法。该方法由科学计算可移植扩展工具包(PETSc)中的Krylov子空间求解器实现,线性方程系统中的系数矩阵直接以显式... 为提高流场计算收敛效率,发展了一套适用于三维混合网格Naiver-Stokes方程求解的并行广义最小残差(GMRES)隐式时间推进方法。该方法由科学计算可移植扩展工具包(PETSc)中的Krylov子空间求解器实现,线性方程系统中的系数矩阵直接以显式给出以提高算法的稳定性。为进一步提高GMRES方法的收敛速度,对非结构网格的序号进行了重排序,使得系数矩阵的非零元素尽量向主对角线靠近。利用所发展的GMRES方法,完成了对ONERAM6机翼、AIAA阻力预测会议通用研究模型(CRM)等算例的计算,计算结果与试验结果吻合良好。通过与其他隐式推进方法进行比较,对算法的收敛特性进行了研究。结果表明,所发展的GMRES方法计算更加稳定,残差下降速度相对LU-SGS(Lower-Upper Symmetric Gauss-Seidel)方法更快,尤其是气动力系数向着收敛解逼近的速度更加明显,提高了计算效率。 展开更多
关键词 混合网格 收敛效率 隐式时间推进方法 GMRES petsc 网格重排序
原文传递
天体大规模数值模拟软件性能优化
19
作者 孙相征 张云泉 +2 位作者 王婷 杨超 李力刚 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第S1期51-54,共4页
在百万亿次超级计算机深腾7000上进行了基于Aztec库和PETSc库的天体大规模数值模拟程序对比测试,并对性能测试结果进行了分析.实验结果表明,当8核/节点时,PETSc程序运行时间是Aztec程序的23.34%~41.10%,平均为29.31%;当4核/节点时,PETS... 在百万亿次超级计算机深腾7000上进行了基于Aztec库和PETSc库的天体大规模数值模拟程序对比测试,并对性能测试结果进行了分析.实验结果表明,当8核/节点时,PETSc程序运行时间是Aztec程序的23.34%~41.10%,平均为29.31%;当4核/节点时,PETSc程序运行时间是Aztec程序的19.72%~31.34%,平均为24.97%.在测试过程中,还观察到同样的问题规模和处理器核数,每节点采用4个处理器核比采用8个处理器核时的运行时间,在基于Aztec库的情况下平均下降29%,在基于PETSc软件包的情况下平均下降36%.此外,还给出了对PETSc程序进一步对角线存储优化的结果.实验结果体现了深腾7000提供的有效支持,对软件下一步的优化研究有指导意义. 展开更多
关键词 天体数值模拟 深腾7000 性能测试 可扩展性 Aztec库 petsc
原文传递
Eigenvalue Solver for Fluid and Kinetic Plasma Models in Arbitrary Magnetic Topology
20
作者 D.A.Baver J.R.Myra M.V.Umansky 《Communications in Computational Physics》 SCIE 2016年第6期136-155,共20页
ArbiTER(Arbitrary Topology Equation Reader)is a new code for solving linear eigenvalue problems arising from a broad range of physics and geometry models.The primary application area envisioned is boundary plasma phys... ArbiTER(Arbitrary Topology Equation Reader)is a new code for solving linear eigenvalue problems arising from a broad range of physics and geometry models.The primary application area envisioned is boundary plasma physics in magnetic confinement devices;however ArbiTER should be applicable to other science and engineering fields as well.The code permits a variable numbers of dimensions,making possible application to both fluid and kinetic models.The use of specialized equation and topology parsers permits a high degree of flexibility in specifying the physics and geometry. 展开更多
关键词 PLASMA eigensolver finite difference method finite element method SLEPc petsc field-line following coordinates snowflake divertor
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部