期刊文献+
共找到134篇文章
< 1 2 7 >
每页显示 20 50 100
二维三温能量方程求解MPI-OpenMP并行算法研究
1
作者 邓伟辉 宋应文 +1 位作者 刘兴平 颜卓 《计算机应用研究》 CSCD 北大核心 2015年第5期1326-1329,共4页
二维三温能量方程的求解是惯性约束聚变(ICF)的核心问题。随着ICF问题规模的不断扩大和计算机性能的飞速提升,现有的并行算法和软件包已经不再适用。提出了二维三温能量方程的MPI-Open MP并行求解算法,该算法上层使用MPI进程进行通信,... 二维三温能量方程的求解是惯性约束聚变(ICF)的核心问题。随着ICF问题规模的不断扩大和计算机性能的飞速提升,现有的并行算法和软件包已经不再适用。提出了二维三温能量方程的MPI-Open MP并行求解算法,该算法上层使用MPI进程进行通信,下层使用Open MP多线程进行核心计算,不但能够适应大规模问题的求解,而且还表现出很好的扩展性和加速比。实验表明,算法在网格规模大小为106的实际物理模型的模拟求解中,48个MPI进程192个Open MP线程可以得到39.53倍的加速比;并且随着参与计算的处理器核数的增加,加速比将大幅度地提高。 展开更多
关键词 二维三温能量方程 惯性约束巨变 mpi-openmp并行化 加速比
下载PDF
基于MPI-OpenMP混合编程的并行三维FDTD计算研究
2
作者 王方 蒋弦 《电子技术与软件工程》 2016年第1期259-259,共1页
以多处理器节点集群计算机为平台,构建了MPI-Open MP混合并行的层次化结构模型。然后以三维金属圆柱FDTD散射计算为算例,将单独使用MPI和MPIOpen MP混合编程情况下结果的加速比进行了比较,并借此做了通信与计算重叠试验,不仅验证了混合... 以多处理器节点集群计算机为平台,构建了MPI-Open MP混合并行的层次化结构模型。然后以三维金属圆柱FDTD散射计算为算例,将单独使用MPI和MPIOpen MP混合编程情况下结果的加速比进行了比较,并借此做了通信与计算重叠试验,不仅验证了混合方法的有效性,而且可以看出在多处理器集群计算系统上运用MPI-Open MP模式能进一步提高加速比和带宽利用率。最后,通过对附加通信量、负载平衡以及网络通信性能等因素对FDTD并行计算产生的影响进行讨论,可以进一步得出构建局域网的硬件性能、子区域的不同划分以及通信原语言的软件设计对并行加速比和效率具有明显影响,而带宽利用率的提高则系于负载平衡问题的改善。 展开更多
关键词 mpi-openmp FDTD 加速比 带宽利用率
下载PDF
基于SMP集群系统的MPI-OpenMP混合并行FDTD算法研究 被引量:2
3
作者 朱良杰 宋祖勋 刘真 《现代电子技术》 2011年第14期107-110,共4页
针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属... 针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属长方体的散射问题分析,把混合编程算法同基于MPI的FDTD并行算法进行了比较。结果表明,混合并行算法具有更好的加速比和带宽利用率。 展开更多
关键词 FDTD MPI—OpenMP 加速比 带宽利用率
下载PDF
基于MPI和OpenMP混合编程的高分三号数据分布式并行转换算法 被引量:3
4
作者 陈云 《测绘与空间地理信息》 2024年第2期43-45,49,共4页
高分三号是我国C波段多极化合成孔径雷达卫星。PolSARpro是欧空局支持下的一款极化SAR影像处理的开源软件,为了便于利用该软件处理高分三号数据,本文提出了一种基于MPI和OpenMP并以PolSARpro软件的数据格式要求进行分布式并行转换算法,... 高分三号是我国C波段多极化合成孔径雷达卫星。PolSARpro是欧空局支持下的一款极化SAR影像处理的开源软件,为了便于利用该软件处理高分三号数据,本文提出了一种基于MPI和OpenMP并以PolSARpro软件的数据格式要求进行分布式并行转换算法,实现将高分三号极化数据快速精确转化为复数散射矩阵S2数据格式,通过KingMap V8.0平台实现了算法并在实际数据中进行测试,验证了算法的可行性、正确性和高效性。 展开更多
关键词 高分三号 合成孔径雷达 复数散射矩阵 OPENMP MPI KingMap
下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:4
5
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
下载PDF
DSMC/PIC耦合模拟的大规模高效混合并行计算研究
6
作者 汪青松 邱昊中 +4 位作者 林拥真 杨富翔 李洁 王正华 徐传福 《计算机科学》 CSCD 北大核心 2023年第S02期811-819,共9页
DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负... DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负载均衡研究。首先设计了基于嵌套双重非结构网格的MPI并行算法,实现了集中式和分布式两种并行通信策略,支持粒子在任意并行进程间的动态迁移。然后提出了加权负载性能模型,设计了动态负载均衡算法及高效网格重映射机制,大幅提升了耦合模拟并行效率,进一步设计了MPI+OpenMP混合并行算法,有效降低了纯MPI并行计算中动态负载均衡的网格重剖分和通信开销。在北京北龙超级云HPC系统上,针对10亿粒子规模脉冲真空弧等离子体羽流开展了数千处理器核心DSMC/PIC耦合并行模拟,验证了并行算法和动态负载均衡的效果。 展开更多
关键词 DSMC/PIC耦合 粒子模拟 分布式和集中式 动态负载均衡 MPI+OPENMP
下载PDF
多核并行粒子滤波算法设计与实现
7
作者 卞泽韬 陈华 《电脑与电信》 2023年第5期63-69,共7页
粒子滤波算法由于需要采样大量粒子才能较好地逼近后验概率,故使得系统实时性较差。以一个简单的离散系统为例实现多种粒子滤波并行算法。实验结果表明,并行算法可以有效提高计算效率,基于OpenMP和MPI的并行算法加速效果较好,在一定情... 粒子滤波算法由于需要采样大量粒子才能较好地逼近后验概率,故使得系统实时性较差。以一个简单的离散系统为例实现多种粒子滤波并行算法。实验结果表明,并行算法可以有效提高计算效率,基于OpenMP和MPI的并行算法加速效果较好,在一定情况下可以达到超线性加速,此外,当粒子数达到一定数量时,MPI结合OpenMP的并行方法加速效果更佳。 展开更多
关键词 并行计算 粒子滤波 OPENMP MPI Windows API PPL
下载PDF
MT Occam反演的CPU/GPU异构混合并行算法研究
8
作者 刘羽 熊壬浩 肖熠 《石油物探》 EI CSCD 北大核心 2018年第3期470-477,共8页
由于观测频率数有限,传统的基于频率划分的电磁法正反演并行计算方式不具有可扩展并行性,难以通过扩大集群规模以提高计算速度。为此,以大地电磁(MT)Occam反演为例,通过挖掘线性方程组求解、矩阵运算等细粒度并行分量,对传统的大粒度分... 由于观测频率数有限,传统的基于频率划分的电磁法正反演并行计算方式不具有可扩展并行性,难以通过扩大集群规模以提高计算速度。为此,以大地电磁(MT)Occam反演为例,通过挖掘线性方程组求解、矩阵运算等细粒度并行分量,对传统的大粒度分频方式进行扩展,设计了MPI-OpenMP-CUDA多层次混合并行算法。第一层采用消息传递接口(MPI)以消息传递的方式实现节点间大粒度任务的分发,第二层采用OpenMP以共享内存方式实现节点内中小粒度任务的并行处理,底层采用统一计算设备架构(CUDA)实现节点内GPU的核心计算。给出了理论背景和并行性分析,设计了并行处理流程,对方案的适用性进行了讨论。多个理论模型的试算验证了代码的正确性,评估了计算精度,比较了加速性能。实验结果表明,所设计的算法合理高效,仅利用4个节点,就使较大规模的模型(文中类型2)反演平均加速比达到16倍,最高加速比可达23倍。 展开更多
关键词 大地电磁 反演 异构 并行计算 mpi-openmp-CUDA
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
9
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP MPI+OPENMP HL-2A高性能计算系统
下载PDF
适用于任意网格的大规模并行CFD计算框架PHengLEI 被引量:28
10
作者 赵钟 张来平 +3 位作者 何磊 何先耀 郭永恒 徐庆新 《计算机学报》 EI CSCD 北大核心 2019年第11期2368-2383,共16页
针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器... 针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器开发者隔离,我们设计了通用的通信模式和一种基于网格块的“三合一”的数据交换模式,即将多块结构网格块、并行分区网格块和结构/非结构网格块间的交界面数据完全标准化为数据底层后,在数据底层统一进行交换,使得数据交换不依赖于网格类型和数据类型,从而实现任意网格类型并行通信模式的统一.作为气动数据生产的“数值风洞”,要求代码将并行隔离至底层,为此针对主流计算机系统的特点,设计了粗粒度MPI/OpenMP混合并行模式,领域专家只需关注求解器开发而无需关注并行通信,在提高可移植性、可扩展性的同时尽可能兼顾封装性.针对大规模并行计算的实际工程需求,设计了并行分区、大规模并行文件存储模式,以缩短前置处理和文件I/O时间.最后,分别基于结构网格、非结构网格和重叠网格,给出了工程应用领域的标模算例,以说明PHengLEI并行计算框架对不同网格类型的适应性.大规模网格测试结果表明,国产定制集群上16.38万核并行效率达83%以上,“天河二号”上近10万核并行效率达95%以上,展现了较好的可扩展性和并行计算效率. 展开更多
关键词 并行计算 MPI/OpenMP混合并行 CFD并行计算框架 PHengLEI 风雷软件 HyperFLOW
下载PDF
多核并行技术在分子动力学模拟中的应用 被引量:8
11
作者 刘青昆 滕人达 +2 位作者 刘凤 宫利东 张建强 《计算机工程与设计》 CSCD 北大核心 2011年第10期3395-3398,共4页
为了充分利用多核处理器资源,研究了一种用于分子动力学模拟中的多核并行技术。在多核处理器上利用OpenMP技术实现多线程创建与同步、动态设置子线程的调度运行方式以及负载均衡以减少子线程执行等待时间。通过对不同分子体系结构下的... 为了充分利用多核处理器资源,研究了一种用于分子动力学模拟中的多核并行技术。在多核处理器上利用OpenMP技术实现多线程创建与同步、动态设置子线程的调度运行方式以及负载均衡以减少子线程执行等待时间。通过对不同分子体系结构下的动力学模型测试,得出在不同子线程下并行计算的时间,并且得到了良好的性能加速比。实验结果表明,采用OpenMP并行技术可有效地提高电荷求解过程在分子动力学模拟运算中的时间效率,以及多核计算机资源的利用率。 展开更多
关键词 多核 多线程 并行 MPI OPENMP 分子动力学模拟
下载PDF
基于SMP集群的多层次并行编程模型与并行优化技术 被引量:25
12
作者 单莹 吴建平 王正华 《计算机应用研究》 CSCD 北大核心 2006年第10期254-256,260,共4页
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行... 详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。 展开更多
关键词 SMP集群 MPI/OpenMP 并行 优化 单处理器性能优化
下载PDF
SMP机群混合编程模型研究 被引量:19
13
作者 陈勇 陈国良 +1 位作者 李春生 何家华 《小型微型计算机系统》 CSCD 北大核心 2004年第10期1763-1767,共5页
研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP+MPI和 Thread+MPI两类 .通过研究指出 ,Open MP+MPI优于 Thread+MPI.在此基础上 ,重点研究了 Open MP+MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注... 研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP+MPI和 Thread+MPI两类 .通过研究指出 ,Open MP+MPI优于 Thread+MPI.在此基础上 ,重点研究了 Open MP+MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注意事项等 ,得出细粒度并行化的 Open MP+MPI是 展开更多
关键词 SMP 机群 编程模型 OPENMP MPI
下载PDF
基于MPI+OpenMP的三维声波方程正演模拟 被引量:5
14
作者 宋鹏 解闯 +3 位作者 李金山 谭军 刘伟 谭惠文 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第9期97-102,129,共7页
针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多... 针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多线程并行模式,以有效地利用计算和存储资源。3D-Overthrust模型的实验结果显示,基于MPI+OpenMP的三维声波方程数值模拟并行算法的计算效率与基于MPI的按炮分任务并行计算模式相当,但其内存消耗远远低于后者,其更适合于基于大模型或实际模型的三维模拟。 展开更多
关键词 三维声波方程 正演模拟 并行计算 MPI+OPENMP
下载PDF
基于MPI+OpenMP混合编程模型的城市路网最短路径并行算法 被引量:11
15
作者 杨庆芳 刘冬 杨兆升 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1581-1584,共4页
针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效... 针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效改善系统性能,提高系统计算速度。经由长春市路网验证可知,混合模型比MPI模型具有更好的加速比和运算效率,并且随着计算节点个数的增加,加速比提高幅度更大,表明MPI+OpenMP混合模型有着更好的可扩展性。 展开更多
关键词 交通运输系统工程 消息传递接口 MPI+OpenMP混合模型 最短路径 FLOYD算法
下载PDF
连通域标记算法的并行化研究 被引量:17
16
作者 马益杭 占利军 +1 位作者 谢传节 秦承志 《地理与地理信息科学》 CSCD 北大核心 2013年第4期67-71,F0002,共6页
连通域标记算法在地理栅格数据分析中有广泛应用,当面对大规模地理栅格数据时,连通域标记串行算法十分耗时,亟须算法并行化。但目前连通域标记算法还缺乏并行化,更缺乏对不同并行技术实现时的性能对比。该文对常用的连通域标记两遍扫描... 连通域标记算法在地理栅格数据分析中有广泛应用,当面对大规模地理栅格数据时,连通域标记串行算法十分耗时,亟须算法并行化。但目前连通域标记算法还缺乏并行化,更缺乏对不同并行技术实现时的性能对比。该文对常用的连通域标记两遍扫描法进行了并行化设计,并分别利用OpenMP和MPI两种并行技术实现了不同版本的并行算法,以适用于单机多核、多机多处理器等不同的并行计算硬件环境。对所实现的并行算法在单节点、多节点的不同测试环境下,以不同数据规模和不同连通域复杂度情况的数据进行效率测试,结果表明:该算法均大幅缩短了运行时间;在数据量较小且连通域数目较少的情况下更适合使用OpenMP版本的并行算法;若图像数据规模较大时,MPI并行算法更快、更高效,但是在多节点的集群环境中,如果连通域情况复杂,进程数的增多并不能保证获得更好的加速效果。 展开更多
关键词 连通域标记 栅格数据 并行算法 OPENMP MPI
下载PDF
SMP集群系统上矩阵特征问题并行求解器的有效算法 被引量:5
17
作者 赵永华 迟学斌 程强 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期334-340,共7页
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算... 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 展开更多
关键词 SMP集群系统 MPI+OPENMP 混合并行算法 矩阵特征值问题 并行求解器
下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
18
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 MPI OPENMP 内存
下载PDF
基于MPI+OpenMP的多层次并行偏移算法研究 被引量:8
19
作者 陈辉 孙雷鸣 +2 位作者 李录明 罗省贤 赵安军 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期528-534,共7页
根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多... 根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多层次并行叠前深度偏移算法。理论模型验证了其正确性,得到了较好的成像效果,不同类型的多层次并行偏移算法计算结果有所差异。多层次并行偏移算法是在实现MPI并行偏移的基础上,对集群各节点内核的充分利用,有利于提升PC集群的计算性能,为叠前深度偏移的实际推广奠定基础。 展开更多
关键词 MPI OPENMP 多层次并行 偏移
下载PDF
基于分布/共享内存层次结构的并行程序设计 被引量:10
20
作者 李清宝 张平 《计算机应用》 CSCD 北大核心 2004年第6期148-150,158,共4页
分布内存结构和共享内存结构各具特点,又有很强的互补性,分布/共享内存层次结构将两种结构相结合,以充分发挥其优势。文中主要讨论基于分布/共享内存层次结构的并行程序设计问题,介绍了MPI和OpenMP混合并行程序设计模式。
关键词 分布内存结构 共享内存结构 分布/共享内存层次结构 MPI OPENMP
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部