期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
MPI/OpenMP-Based Parallel Solver for Imprint Forming Simulation
1
作者 Yang Li Jiangping Xu +2 位作者 Yun Liu Wen Zhong Fei Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期461-483,共23页
In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining pr... In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining process to address the challenge of capturing fine relief features of approximately 50 microns.Achieving such precision demands the utilization of at least 7 million tetrahedron elements,surpassing the capabilities of traditional serial programs previously developed.To mitigate data races when calculating internal forces,intermediate arrays are introduced within the OpenMP directive.This helps ensure proper synchronization and avoid conflicts during parallel execution.Additionally,in the MPI implementation,the coins are partitioned into the desired number of regions.This division allows for efficient distribution of computational tasks across multiple processes.Numerical simulation examples are conducted to compare the three solvers with serial programs,evaluating correctness,acceleration ratio,and parallel efficiency.The results reveal a relative error of approximately 0.3%in forming force among the parallel and serial solvers,while the predicted insufficient material zones align with experimental observations.Additionally,speedup ratio and parallel efficiency are assessed for the coining process simulation.The pureMPI parallel solver achieves a maximum acceleration of 9.5 on a single computer(utilizing 12 cores)and the hybrid solver exhibits a speedup ratio of 136 in a cluster(using 6 compute nodes and 12 cores per compute node),showing the strong scalability of the hybrid MPI/OpenMP programming model.This approach effectively meets the simulation requirements for commemorative coins with intricate relief patterns. 展开更多
关键词 hybrid mpi/openmp parallel computing mpi openmp imprint forming
下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
2
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 mpi openmp 内存
下载PDF
OpenFoam中多面体网格生成的MPI+OpenMP混合并行方法 被引量:3
3
作者 刘江 刘文博 张矩 《计算机科学》 CSCD 北大核心 2022年第3期3-10,共8页
网格生成是计算流体力学中非常重要的一环,大规模数值模拟过程中对网格精度要求的提高会导致网格生成所耗的时间增加.文中基于OpenFoam开源软件中的网格生成算法,主要研究多面体网格的并行生成,并提出OpenMP和MPI混合并行的多面体网格... 网格生成是计算流体力学中非常重要的一环,大规模数值模拟过程中对网格精度要求的提高会导致网格生成所耗的时间增加.文中基于OpenFoam开源软件中的网格生成算法,主要研究多面体网格的并行生成,并提出OpenMP和MPI混合并行的多面体网格生成方法.通过理论分析得到,使用混合并行方法生成相同质量的网格时,混合并行方法生成网格的时间消耗随着线程数量和网格单元数量的增加而减少.3组使用不同求解器的数值模拟实验结果表明,该混合并行方法不但可以保证生成网格的质量---可以正常进行数值计算模拟且模拟结果与原方法相比几乎没有差别,而且生成同样质量与数量网格的耗时最多可以缩短至未使用OpenMP并行方法之耗时的1/4以内. 展开更多
关键词 计算流体力学 OPENFOAM 多面体网格生成 mpi+openmp混合并行 并行效率
下载PDF
水质预报系统的MPI+OpenMP并行优化研究 被引量:2
4
作者 李春 《河北工程大学学报(自然科学版)》 CAS 2015年第2期77-81,共5页
OpenMP(Open Multi-Processing)能够在共享存储环境中获得理想的并行性能,MPI+OpenMP混合并行编程模型更贴近于多核心集群的体系结构。在多核心集群上进行实验,混合模型相对串行程序可缩短95%的运算时间,加速比超过20。实验结果表明,该... OpenMP(Open Multi-Processing)能够在共享存储环境中获得理想的并行性能,MPI+OpenMP混合并行编程模型更贴近于多核心集群的体系结构。在多核心集群上进行实验,混合模型相对串行程序可缩短95%的运算时间,加速比超过20。实验结果表明,该混合模型比纯MPI并行的系统具有更优的加速比和扩展性,是对纯MPI并行系统的一种改进。 展开更多
关键词 多核心集群 水质预报系统 消息传递接口 开放式多处理 混合并行编程模型
下载PDF
适用于任意网格的大规模并行CFD计算框架PHengLEI 被引量:30
5
作者 赵钟 张来平 +3 位作者 何磊 何先耀 郭永恒 徐庆新 《计算机学报》 EI CSCD 北大核心 2019年第11期2368-2383,共16页
针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器... 针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器开发者隔离,我们设计了通用的通信模式和一种基于网格块的“三合一”的数据交换模式,即将多块结构网格块、并行分区网格块和结构/非结构网格块间的交界面数据完全标准化为数据底层后,在数据底层统一进行交换,使得数据交换不依赖于网格类型和数据类型,从而实现任意网格类型并行通信模式的统一.作为气动数据生产的“数值风洞”,要求代码将并行隔离至底层,为此针对主流计算机系统的特点,设计了粗粒度MPI/OpenMP混合并行模式,领域专家只需关注求解器开发而无需关注并行通信,在提高可移植性、可扩展性的同时尽可能兼顾封装性.针对大规模并行计算的实际工程需求,设计了并行分区、大规模并行文件存储模式,以缩短前置处理和文件I/O时间.最后,分别基于结构网格、非结构网格和重叠网格,给出了工程应用领域的标模算例,以说明PHengLEI并行计算框架对不同网格类型的适应性.大规模网格测试结果表明,国产定制集群上16.38万核并行效率达83%以上,“天河二号”上近10万核并行效率达95%以上,展现了较好的可扩展性和并行计算效率. 展开更多
关键词 并行计算 mpi/openmp混合并行 CFD并行计算框架 PHengLEI 风雷软件 HyperFLOW
下载PDF
非结构CFD软件MPI+OpenMP混合并行及超大规模非定常并行计算的应用 被引量:11
6
作者 王年华 常兴华 +1 位作者 赵钟 张来平 《航空学报》 EI CAS CSCD 北大核心 2020年第10期185-199,共15页
常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模... 常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模拟的可扩展性和计算效率十分必要。为充分发挥既有分布内存又有共享内存的多核处理器的性能和效率优势,对作者团队开发的非结构网格二阶精度有限体积CFD软件(HyperFLOW)进行了混合并行改造,在计算节点间采用MPI消息传递机制,在节点内采用OpenMP共享内存的MPI+OpenMP混合并行策略。首先分别实现了两种粒度(粗粒度和细粒度)的混合并行,并基于国产in-house集群采用CRM标模(约4000万网格单元)定常湍流算例对两种混合并行模式进行了测试和比较。结果表明,粗粒度在进程数和分区数较少的小规模并行时具有效率优势,16线程时效率较高;而细粒度混合并行在大规模并行计算时具有优势,8线程时效率较高。其次,验证了混合并行在非定常计算情况下的可扩展性,采用机翼外挂物投放标模算例,分别生成3.6亿和28.8亿非结构重叠网格,采用对等的(P2P)网格读入模式和优化的重叠网格隐式装配策略,网格读入和重叠网格装配耗时仅需数十秒;采用3.6亿网格,完成了非定常状态效率测试及非定常分离过程的湍流流场计算,在in-house集群上12288核并行效率达到90%(以768核为基准),在天河2号上12288核并行效率达到70%(以384核为基准),数值模拟结果与试验结果符合良好。最后,在inhouse集群上采用28.8亿非结构重叠网格进行了4.9万核的并行效率测试,结果显示,4.9万核并行效率达到55.3%(以4096核为基准)。 展开更多
关键词 mpi+openmp混合并行 并行效率 计算流体力学 重叠网格 非定常计算
原文传递
SMP集群系统上矩阵特征问题并行求解器的有效算法 被引量:5
7
作者 赵永华 迟学斌 程强 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期334-340,共7页
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算... 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 展开更多
关键词 SMP集群系统 mpi+openmp 混合并行算法 矩阵特征值问题 并行求解器
下载PDF
基于SMP集群系统的并行编程模式研究与分析 被引量:5
8
作者 宋伟 宋玉 《计算机技术与发展》 2007年第2期164-167,171,共5页
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点... 并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 展开更多
关键词 并行计算 对称多处理器 集群 消息传递模型 共享存储模型 mpi openmp 混合编程
下载PDF
混合并行计算在海洋水龄谱模拟中的应用研究 被引量:1
9
作者 黄伟建 周伟 李珍 《科学技术与工程》 北大核心 2013年第15期4207-4211,4222,共6页
在海洋水龄谱数值模拟过程中应用并行计算技术可以显著提高运算效率。将适用于分布式存储环境的消息传递接口(Message Passing Interface,MPI)与适用于共享存储环境的开放式多处理(Open Multi-Processing,OpenMP)两种并行计算技术相结合... 在海洋水龄谱数值模拟过程中应用并行计算技术可以显著提高运算效率。将适用于分布式存储环境的消息传递接口(Message Passing Interface,MPI)与适用于共享存储环境的开放式多处理(Open Multi-Processing,OpenMP)两种并行计算技术相结合,提出了一种适用于海洋水龄谱数值模拟的混合并行计算模型。对比了其与传统的纯MPI方式在多核心(Chip Muti-processors)集群上的运算效率,并在此基础上研究了混合模型的系统资源利用情况以进一步了解其扩展能力。实验结果表明,MPI+OpenMP混合并行水龄谱模型具有更高的运算效率,同时系统资源消耗明显低于纯MPI方式。 展开更多
关键词 混合并行 水龄谱 消息传递接口 开放式多处理 多核系统
下载PDF
多群粒子输运问题在多核集群系统上的混合并行计算
10
作者 迟利华 刘杰 +3 位作者 龚春叶 徐涵 蒋杰 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2009年第11期94-97,共4页
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个O... 本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。 展开更多
关键词 mpi/openmp混合并行计算 粒子输运 Sn方法 多核机群系统
下载PDF
SMP集群系统上可扩展并行特征问题求解器研究
11
作者 赵永华 迟学斌 姜金荣 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期3-5,共3页
基于对称三对角特征问题的分而治之方法,提出了一个适合SMP集群环境的多级混合并行算法。SMP节点内的并行求解采用了粗粒度和细粒度两种OpenMP并行。为了改善纯MPI算法中的负载不平衡,混合并行算法使用了动态任务分配方法。在深腾6800... 基于对称三对角特征问题的分而治之方法,提出了一个适合SMP集群环境的多级混合并行算法。SMP节点内的并行求解采用了粗粒度和细粒度两种OpenMP并行。为了改善纯MPI算法中的负载不平衡,混合并行算法使用了动态任务分配方法。在深腾6800上的试验表明,混合并行算法具有好的扩展性和加速比。 展开更多
关键词 SMP集群 mpi+openmp 混合并行 并行求解器
下载PDF
面向层次化NoC的混合并行编程模型 被引量:1
12
作者 曹祥 易伟 +2 位作者 潘红兵 高明伦 李丽 《计算机工程》 CAS CSCD 北大核心 2010年第13期278-280,共3页
为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程... 为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程模型相比,混合并行编程模型加速比提高了20%~50%。 展开更多
关键词 片上网络 消息传递接口 openmp模型 层次化 混合并行编程
下载PDF
基于P2P的保护定值在线校核混合并行算法 被引量:2
13
作者 刘高明 宋玮 仇向东 《南方电网技术》 2014年第2期60-64,共5页
考虑到大型互联电网规模的逐渐扩大,尤其是"三华"特高压同步电网的顺利投运,传统的集中式计算会遇到硬件计算能力的瓶颈,提出了一种基于P2P的保护定值在线校核混合并行算法。充分利用P2P网络技术的对等通信,实现区域间信息的... 考虑到大型互联电网规模的逐渐扩大,尤其是"三华"特高压同步电网的顺利投运,传统的集中式计算会遇到硬件计算能力的瓶颈,提出了一种基于P2P的保护定值在线校核混合并行算法。充分利用P2P网络技术的对等通信,实现区域间信息的对等交互,重点介绍了MPI+OpenMP的混合并行编程模型以及算法的设计,对在线校核进行了并行性分析,实现了在线校核进程级与线程级的两级并行。最后,在基于P2P技术的分布式并行计算平台上,对混合并行算法进行了测试比较,结果表明所提出的算法正确且有效。 展开更多
关键词 保护定值在线校核 P2P 混合并行计算 mpi openmp
下载PDF
基于二维结构化网格的可压缩流体并行算法研究 被引量:1
14
作者 皇甫永硕 刘杰 龚春叶 《计算机工程与科学》 CSCD 北大核心 2017年第9期1602-1609,共8页
基于二维/轴对称高精度可压缩多相流计算流体力学方法 MuSiC-CCASSIM的结构化网格部分,设计了区域并行分解方法;针对各处理器边界数据的通信,设计了阻塞式通信与非阻塞式通信并行算法;为了减少通信开销,设计了MPI/OpenMP混合并行优化算... 基于二维/轴对称高精度可压缩多相流计算流体力学方法 MuSiC-CCASSIM的结构化网格部分,设计了区域并行分解方法;针对各处理器边界数据的通信,设计了阻塞式通信与非阻塞式通信并行算法;为了减少通信开销,设计了MPI/OpenMP混合并行优化算法。在天河二号超级计算机上进行了测试,每个核固定网格规模为625*250,最多调用8 192核。测试数据表明,采用MPI/OpenMP混合并行算法、纯MPI非阻塞式通信并行算法和纯MPI阻塞式通信并行算法的程序的平均并行效率分别达到86%、83%和77%,三种算法都具有良好的可扩展性。 展开更多
关键词 并行计算 阻塞式通信 非阻塞式通信 mpi/openmp混合编程 天河计算机
下载PDF
基于混合编程模式的Jacobi迭代并行算法
15
作者 袁云 王传美 童恒庆 《武汉理工大学学报(信息与管理工程版)》 CAS 2014年第1期18-20,共3页
为了提高Jacobi迭代法在集群中解线性方程组的计算速度,在Jacobi迭代法中引入MPI+OpenMP混合编程模型,基于该模型,在集群中实现混合并行设计,分析Jacobi迭代法并行性,在已有的串行迭代基础上,实现并行算法,可有效改善系统性能,提高计算... 为了提高Jacobi迭代法在集群中解线性方程组的计算速度,在Jacobi迭代法中引入MPI+OpenMP混合编程模型,基于该模型,在集群中实现混合并行设计,分析Jacobi迭代法并行性,在已有的串行迭代基础上,实现并行算法,可有效改善系统性能,提高计算速度。 展开更多
关键词 JACOBI迭代 混合编程 mpi+openmp 并行计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部