期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
Targeting BSP Library for SMP Cluster
1
作者 DONG Jing-yi, DING Jun, MENG Rui, TONG Wei-qin School of Computer Engineering and Science, Shanghai University, Shanghai 200072, China 《Advances in Manufacturing》 SCIE CAS 2000年第S1期78-82,共5页
Using commodity SMPs (shared memory processors) to build cluster-based supercomputer has become a mainstream trend.Yet programming this kind of supercomputer system requires an environment support both message passing... Using commodity SMPs (shared memory processors) to build cluster-based supercomputer has become a mainstream trend.Yet programming this kind of supercomputer system requires an environment support both message passing and shared memory programming. This paper describes our preliminary work in an effort to target BSP library for cluster of SMPs. In order to exploit the maximum performance potential that a cluster of SMPs brings, we adopt thread technique to reduce system overhead and to exploit the capacity of SMPs. A fore-layer synchronization mechanism is proposed to support barrier synchronization within an SMP node, a group of SMP nodes and the whole cluster respectively. A comparison is made between our BSP library and the currently available BSP libraries such as PUB. 展开更多
关键词 parallel computing smp cluster BSP THREAD
下载PDF
SMPCluster:如何开发两级并行 被引量:5
2
作者 王韬 李晓明 《计算机工程与科学》 CSCD 2002年第4期78-80,88,共4页
本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用... 本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用性的综合考虑 ,在LinuxSMPCluster上应当直接使用利用共享内存进行通信的MPI进行编程。 展开更多
关键词 smpcluster 两级并行 操作系统 消息传递 LIUNX
下载PDF
Communication Optimization for SMP Clusters
3
作者 林伟坚 陈文光 +1 位作者 李志光 郑纬民 《Tsinghua Science and Technology》 SCIE EI CAS 2001年第1期18-23,41,共7页
Shared Memory Processors (SMP) workstation clusters are becoming more and more popular. To optimize communication between the workstations, a new graph partition problem was developed to schedule tasks in SMP clusters... Shared Memory Processors (SMP) workstation clusters are becoming more and more popular. To optimize communication between the workstations, a new graph partition problem was developed to schedule tasks in SMP clusters. The problem is NP-complete and a heuristic algorithm was developed based on Lee, Kim and Park's algorithm. Experimental results indicate that our algorithm outperforms theirs, especially when the number of partitions is large. This algorithm can be integrated in a parallelizing compiler as a back end optimizer for the distributed code generator. 展开更多
关键词 smp cluster communication optimization task scheduling
原文传递
Hybrid Decomposition Method in Parallel Molecular Dynamics Simulation Based on SMP Cluster Architecture 被引量:2
4
作者 王冰 舒继武 +2 位作者 郑纬民 王金照 陈民 《Tsinghua Science and Technology》 SCIE EI CAS 2005年第2期183-188,共6页
A hybrid decomposition method for molecular dynamics simulations was presented, using simul- taneously spatial decomposition and force decomposition to fit the architecture of a cluster of symmetric multi-processo... A hybrid decomposition method for molecular dynamics simulations was presented, using simul- taneously spatial decomposition and force decomposition to fit the architecture of a cluster of symmetric multi-processor (SMP) nodes. The method distributes particles between nodes based on the spatial decom- position strategy to reduce inter-node communication costs. The method also partitions particle pairs within each node using the force decomposition strategy to improve the load balance for each node. Simulation results for a nucleation process with 4 000 000 particles show that the hybrid method achieves better paral- lel performance than either spatial or force decomposition alone, especially when applied to a large scale particle system with non-uniform spatial density. 展开更多
关键词 symmetric multi-processor (smp) cluster computing molecular dynamics DECOMPOSITION
原文传递
SMP机群混合编程模型研究 被引量:19
5
作者 陈勇 陈国良 +1 位作者 李春生 何家华 《小型微型计算机系统》 CSCD 北大核心 2004年第10期1763-1767,共5页
研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP+MPI和 Thread+MPI两类 .通过研究指出 ,Open MP+MPI优于 Thread+MPI.在此基础上 ,重点研究了 Open MP+MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注... 研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP+MPI和 Thread+MPI两类 .通过研究指出 ,Open MP+MPI优于 Thread+MPI.在此基础上 ,重点研究了 Open MP+MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注意事项等 ,得出细粒度并行化的 Open MP+MPI是 展开更多
关键词 smp 机群 编程模型 OPENMP MPI
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
6
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP MPI+OPENMP HL-2A高性能计算系统
下载PDF
基于SMP集群的多层次并行编程模型与并行优化技术 被引量:25
7
作者 单莹 吴建平 王正华 《计算机应用研究》 CSCD 北大核心 2006年第10期254-256,260,共4页
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行... 详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。 展开更多
关键词 smp集群 MPI/OpenMP 并行 优化 单处理器性能优化
下载PDF
基于SMP机群的层次化并行编程技术的研究 被引量:9
8
作者 祝永志 张丹丹 +1 位作者 曹宝香 禹继国 《电子学报》 EI CAS CSCD 北大核心 2012年第11期2206-2210,共5页
针对多核SMP机群的体系结构特点,讨论了MPI+OpenMP混合并行程序设计技术.提出了一种多层次化混合设计新方法.设计了N-body问题的多层次化并行算法,并在曙光5000A机群上与传统的混合算法作了性能方面的比较.结果表明,该层次化混合并行算... 针对多核SMP机群的体系结构特点,讨论了MPI+OpenMP混合并行程序设计技术.提出了一种多层次化混合设计新方法.设计了N-body问题的多层次化并行算法,并在曙光5000A机群上与传统的混合算法作了性能方面的比较.结果表明,该层次化混合并行算法具有更好的扩展性和加速比. 展开更多
关键词 smp机群 层次化 混合编程 性能分析
下载PDF
基于SMP集群的混合并行编程模型研究 被引量:15
9
作者 王惠春 朱定局 +1 位作者 曹学年 樊建平 《计算机工程》 CAS CSCD 北大核心 2009年第3期271-273,共3页
提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件... 提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件下,该混合并行编程模型是SMP集群的最优选择。 展开更多
关键词 smp集群 并行计算 混合编程模型
下载PDF
利用混合编程改善SMP机群上并行矩阵乘法的性能 被引量:6
10
作者 吴建平 王正华 李晓梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期68-72,共5页
针对SMP机群,探讨了分别利用单机优化、OpenMP与MPI从指令级、共享存储级与分布主存级三个层次上改善矩阵并行乘Fox算法性能的方法。并通过调用数学函数库与混合编程的方式,在深腾6800上进行了实验,取得了相当满意的数值效果。
关键词 smp机群 OPENMP MPI 混合编程 Fox算法
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型及有效实现 被引量:33
11
作者 赵永华 迟学斌 《微电子学与计算机》 CSCD 北大核心 2005年第10期7-11,共5页
SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方... SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方法。建立了对称三对角特征问题的多粒度混合并行算法,并在深腾6800超级计算机上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。 展开更多
关键词 smp集群 混合编程模型 特征问题
下载PDF
SMP集群系统上矩阵特征问题并行求解器的有效算法 被引量:5
12
作者 赵永华 迟学斌 程强 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期334-340,共7页
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算... 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 展开更多
关键词 smp集群系统 MPI+OPENMP 混合并行算法 矩阵特征值问题 并行求解器
下载PDF
基于SMP集群的三维网格多粒度混合并行编程模型 被引量:6
13
作者 于方 郑晓薇 孙晓鹏 《计算机应用与软件》 CSCD 2009年第3期138-140,166,共4页
为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP... 为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP混合并行算法,并在SMP集群上同粗粒度MPI(Message Passing Interface)并行算法做了性能比较。结果表明,采用该多粒度混合并行编程模型具有更好的加速比和运行效率。 展开更多
关键词 smp集群 分布/共享内存 MPI+OPENMP 混合编程模型 三维网格
下载PDF
基于SMP集群的激光化学反应模拟效率分析 被引量:2
14
作者 李鸿健 唐红 +1 位作者 豆育升 孙世新 《计算机应用研究》 CSCD 北大核心 2011年第4期1232-1234,1241,共4页
基于半经典分子动力学模型,在SMP集群中实现激光化学反应双层并行模拟系统。结合粗粒度的原子分解算法和细粒度的矩阵并行乘法实现激光化学反应模拟中力计算部分的并行化,分析粒度划分对半经典分子动力学模拟并行效率的影响。在SMP集群... 基于半经典分子动力学模型,在SMP集群中实现激光化学反应双层并行模拟系统。结合粗粒度的原子分解算法和细粒度的矩阵并行乘法实现激光化学反应模拟中力计算部分的并行化,分析粒度划分对半经典分子动力学模拟并行效率的影响。在SMP集群中测试表明,采用128个处理器模拟由500个C原子构成的分子体系,并行效率可达70%。在CPU数量固定的情况下,SMP节点内的细粒度的并行对提高半经典分子动力学模拟并行效率影响较大。该系统能够模拟大分子体系的激光化学反应,在提高加速比的同时保证计算资源的利用效率,满足激光化学反应模拟需求。 展开更多
关键词 激光化学反应 半经典分子动力学 smp集群 加速比 并行效率
下载PDF
访存密集型应用在SMP机群系统中的性能分析 被引量:3
15
作者 顾丽红 吴少刚 《小型微型计算机系统》 CSCD 北大核心 2006年第7期1258-1261,共4页
SM P机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构.这种结点内共享存储、结点间消息传递的两级混合结构是目前并行计算研究的热点.在单个SM P结点中,总线和内存带宽是否满足CPU和I/O的需... SM P机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构.这种结点内共享存储、结点间消息传递的两级混合结构是目前并行计算研究的热点.在单个SM P结点中,总线和内存带宽是否满足CPU和I/O的需求对于访存密集型应用的性能影响很大.本文针对访存密集型应用的特点测试分析了在SM P机群中访存冲突对系统性能的影响,结果表明我们的SM P结点存在性能瓶颈,这种量化分析对于设计大规模的基于SM P的机群系统有很好的指导意义. 展开更多
关键词 访存密集应用 smp机群 OPENMP 软件DSM系统 JIAJIA
下载PDF
如何测量SMP机群可扩放性(英文) 被引量:1
16
作者 何家华 陈国良 单久龙 《软件学报》 EI CSCD 北大核心 2004年第7期977-986,共10页
可扩放性是并行计算的一个重要性能标准,但是传统的可扩放性准则并不适用于SMP机群.如何测量SMP机群的可扩放性?试图提出该问题的一个解决方案.首先找出并验证问题的根源处理器集合不等价性.然后,采用处理器集合的观点来全面、正确地观... 可扩放性是并行计算的一个重要性能标准,但是传统的可扩放性准则并不适用于SMP机群.如何测量SMP机群的可扩放性?试图提出该问题的一个解决方案.首先找出并验证问题的根源处理器集合不等价性.然后,采用处理器集合的观点来全面、正确地观察系统的行为,而并非像传统的做法那样仅仅使用处理器数来描述并行系统.通过引入性能参考因子的概念,扩展了传统的准则以适应SMP机群体系结构.实验结果显示,扩展后的度量准则适用于SMP机群,且具有较高的准确性. 展开更多
关键词 并行计算 性能评测 smp机群 可扩放性
下载PDF
基于Linux的SMP机群环境中并行I/O模型研究 被引量:1
17
作者 曾碧卿 陈志刚 +1 位作者 吕西红 刘安丰 《计算机工程与应用》 CSCD 北大核心 2004年第26期79-81,共3页
提出了一个基于数据通路的波浪推进式并行I/O模型框架,并在基于Linux的SMP机群系统中,根据波浪推进式并行I/O模型框架对各个数据通路进行建模,具体分析了这个波浪推进式并行I/O模型,从思路上解决了刻画并行I/O性能的并行I/O模型问题。
关键词 smp机群 并行I/O模型
下载PDF
SMP超结点机群系统的仿真分析 被引量:1
18
作者 戈弋 武剑锋 +1 位作者 李三立 马群生 《小型微型计算机系统》 CSCD 北大核心 2002年第1期4-8,共5页
通过网络将独立的计算机结点连接起来协同工作 ,机群系统已经成为实现超级计算的一个重要手段 .随着计算机制造工艺的发展 ,处理器的运算能力得到迅速提高 ,使得网络性能成为机群系统的瓶颈问题 .因此 ,采用高频宽网络 ,减少通信开销是... 通过网络将独立的计算机结点连接起来协同工作 ,机群系统已经成为实现超级计算的一个重要手段 .随着计算机制造工艺的发展 ,处理器的运算能力得到迅速提高 ,使得网络性能成为机群系统的瓶颈问题 .因此 ,采用高频宽网络 ,减少通信开销是发展机群系统的首要任务 .采用交换式网络及用户层消息传递机制是提高网络性能的有效手段 .通过建立仿真模型 ,我们对机群系统进行模拟 ,定量分析了交换网络及用户层消息传递对其性能的影响 .本文介绍了交换式机群系统和用户层消息传递的原理及其仿真结构 .本文还描述了对机群系统的仿真测试 。 展开更多
关键词 超结点机群系统 仿真分析 计算机 smp
下载PDF
SMP集群系统上可扩展并行特征问题求解器研究
19
作者 赵永华 迟学斌 姜金荣 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期3-5,共3页
基于对称三对角特征问题的分而治之方法,提出了一个适合SMP集群环境的多级混合并行算法。SMP节点内的并行求解采用了粗粒度和细粒度两种OpenMP并行。为了改善纯MPI算法中的负载不平衡,混合并行算法使用了动态任务分配方法。在深腾6800... 基于对称三对角特征问题的分而治之方法,提出了一个适合SMP集群环境的多级混合并行算法。SMP节点内的并行求解采用了粗粒度和细粒度两种OpenMP并行。为了改善纯MPI算法中的负载不平衡,混合并行算法使用了动态任务分配方法。在深腾6800上的试验表明,混合并行算法具有好的扩展性和加速比。 展开更多
关键词 smp集群 MPI+OPENMP 混合并行 并行求解器
下载PDF
基于SMP机群的航空CFD并行技术应用研究
20
作者 曹平宽 周天孝 李柯 《航空计算技术》 2006年第6期29-32,共4页
针对SMP机群的双层并行体系结构,研制出一种双层并行技术———在计算节点间采用MPI消息传递模式并行,而在计算节点内部采用OpenMP编译器指令模式并行。通过算例测试证明,采用该技术的航空CFD程序,并结合贪婪负载平衡分配技术进行并行计... 针对SMP机群的双层并行体系结构,研制出一种双层并行技术———在计算节点间采用MPI消息传递模式并行,而在计算节点内部采用OpenMP编译器指令模式并行。通过算例测试证明,采用该技术的航空CFD程序,并结合贪婪负载平衡分配技术进行并行计算,其效率可达94%,计算结果与实验值吻合。 展开更多
关键词 smp机群 双层并行体系结构 双层并行技术 负载平衡分配技术
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部