期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于聚类分析的进程拓扑映射优化 被引量:5
1
作者 王涛 卿鹏 +1 位作者 魏迪 漆锋滨 《计算机学报》 EI CSCD 北大核心 2015年第5期1044-1055,共12页
高性能计算机系统规模的持续增大使通信墙问题越来越突出.逻辑进程与物理拓扑的映射优化方法能够提高应用的通信效率,已经成为高性能计算的研究热点之一.传统的进程映射优化模型由于映射粒度过细,导致映射效率低,且易破坏通信密集的进... 高性能计算机系统规模的持续增大使通信墙问题越来越突出.逻辑进程与物理拓扑的映射优化方法能够提高应用的通信效率,已经成为高性能计算的研究热点之一.传统的进程映射优化模型由于映射粒度过细,导致映射效率低,且易破坏通信密集的进程簇的整体性.为此,文中提出了一种聚合的二次分配问题(Aggregated Quadratic Assignment Problem,AQAP)模型,并以AQAP模型为指导,提出了一种新颖的基于聚类分析的进程映射优化方法.该方法首先使用谱聚类算法对进程通信模式进行聚类分析,然后采用自适应聚合进程映射策略实现进程簇到物理拓扑的映射,最后使用聚合Pair-Exchange算法对进程簇映射进行进一步优化.文中提出的优化方法首次将谱聚类分析应用于进程映射问题,可以有效减少远距离通信,增强通信的局部性.NPB基准程序及两道实际应用的实验结果表明,文中提出的进程映射优化方法可以使程序获得明显的性能提升,优于现有的基于Pair-Exchange以及基于图划分的进程映射方法. 展开更多
关键词 通信模式 物理拓扑 进程映射 谱聚类 MPI
下载PDF
POM:一个MPI程序的进程优化映射工具 被引量:1
2
作者 卢兴敬 商磊 陈莉 《计算机工程与科学》 CSCD 北大核心 2009年第A01期201-205,共5页
现代超级计算机具有越来越多的计算结点,同时结点内具有多个处理器核。由于互联带宽的差异,结点间与结点内构成两个通信性能不同的通信层次,后者的通信性能好于前者。但是,目前MPI程序的默认进程映射未考虑该通信层次差异,无法利用结点... 现代超级计算机具有越来越多的计算结点,同时结点内具有多个处理器核。由于互联带宽的差异,结点间与结点内构成两个通信性能不同的通信层次,后者的通信性能好于前者。但是,目前MPI程序的默认进程映射未考虑该通信层次差异,无法利用结点内较好的通信带宽,严重束缚了超级计算机的性能发挥。针对该问题,本文设计实现了能利用层次通信差异的MPI程序自动进程优化映射工具POM,提供了高效、低开销获取MPI程序通信信息的方法,最终通过优化通信在通信层次上的分布提高了程序的通信效率,从而提高了应用程序的性能。本文解决了硬件平台通信层次的抽象、MPI程序通信信息的低开销获取与映射方案的计算三个问题。首先,按照通信能力差异将超级计算机结构抽象为高速互联的不同计算结点与相同结点上的多个处理器核两层。其次,提出了将集合通信转化成点到点通信的简单实现方法。最后,利用无向加权边图来表示MPI程序的进程间通信关系,将MPI程序的进程映射问题转化为图划分问题。在曙光5000A和曙光4000A上的实验结果表明,利用POM工具能够显著提高MPI程序的性能。 展开更多
关键词 进程映射 消息传递接口(MPI) 图划分
下载PDF
基于MPI的进程拓扑感知映射研究
3
作者 李东洋 王云岚 《微电子学与计算机》 CSCD 北大核心 2013年第5期67-71,共5页
本文首先介绍了获取应用程序通信拓扑和物理拓扑的方法,结合进程间通信量和通信频次定义了进程间亲和度,并针对具有分层网络、NUMA效应的硬件系统,设计了相应的进程映射算法.该算法根据进程间的亲和度对进程集合进行划分,在划分过程中... 本文首先介绍了获取应用程序通信拓扑和物理拓扑的方法,结合进程间通信量和通信频次定义了进程间亲和度,并针对具有分层网络、NUMA效应的硬件系统,设计了相应的进程映射算法.该算法根据进程间的亲和度对进程集合进行划分,在划分过程中构造出和物理拓扑树同构的树状结构,随后在两棵同构树的对应节点上做映射来解决应用程序进程到物理节点、处理核心的映射问题.在一个多核集群系统上的实验表明,使用本文提出的进程映射方法可以有效提高并行应用程序的通信效率,显著减少程序的总体执行时间. 展开更多
关键词 通信拓扑 物理拓扑 进程映射 NUMA MPI
下载PDF
基于最小割划分的数模混合仿真系统通信性能优化方法 被引量:2
4
作者 李亿渊 穆清 薛巍 《电子技术应用》 2022年第1期2-11,共10页
数模混合仿真是理解真实电网运行情况,支撑电网安全保障的重要手段。复杂的电网拓扑与硬实时的仿真需求对其计算性能提出了很高的要求。目前数模混合仿真多采用并行计算技术提高计算性能。随着处理器和集群技术的发展,异构集群系统逐渐... 数模混合仿真是理解真实电网运行情况,支撑电网安全保障的重要手段。复杂的电网拓扑与硬实时的仿真需求对其计算性能提出了很高的要求。目前数模混合仿真多采用并行计算技术提高计算性能。随着处理器和集群技术的发展,异构集群系统逐渐成为高性能计算系统的主要构建方式。针对多层次的系统架构,已有的电网划分方式无法充分利用集群计算能力。如何应对多层次核间通信延迟变化问题,及引入设备交互导致的节点资源不对称问题是数模混合仿真任务划分与映射的新挑战。针对中国电力科学研究院自研电磁暂态仿真系统ADPSS,基于最小割划分设计了两阶段的电网划分与进程映射一体化优化算法,在计算负载均衡和最小化通信上取得更好的平衡,进一步降低了电磁暂态仿真的通信时间。同时,该算法有效解决了集群节点资源不对称情况下的任务优化映射问题。通过在西北和华东真实电网算例上的模拟测试,所提出算法较ADPSS默认划分与映射算法取得了平均40%和50%的通信性能提升,平均10%和12%的总体计算性能提升。 展开更多
关键词 数模混合仿真 图划分 最小割 进程映射 异构集群系统
下载PDF
MPI集合通信剖析技术的研究
5
作者 崔奇 谷建华 《计算机技术与发展》 2013年第10期31-35,共5页
将MPI(Message Passing Interface)进程拓扑有效地映射到处理器拓扑上有助于提高MPI程序的通信性能。目前大部分的MPI进程映射只考虑点对点通信,很少考虑到集合通信,原因是获取集合通信的进程拓扑是比较困难的。目前大部分剖析(profili... 将MPI(Message Passing Interface)进程拓扑有效地映射到处理器拓扑上有助于提高MPI程序的通信性能。目前大部分的MPI进程映射只考虑点对点通信,很少考虑到集合通信,原因是获取集合通信的进程拓扑是比较困难的。目前大部分剖析(profiling)工具在剖析集合通信时只考虑了函数的接口语义,而忽视了实现语义,导致这些工具不能正确地获取集合通信进程之间的详细通信情况。文中提出了一套剖析算法,可以准确地计算出参与集合通信的每对进程之间的通信量,并以通信矩阵的形式给出进程拓扑。实验证明了剖析算法的正确性,并且通过这种剖析方法获取的进程拓扑能够提升进程到处理器核的映射实验效果。 展开更多
关键词 MPI 集合通信 通信剖析 进程映射
下载PDF
大规模并行程序通信性能分析 被引量:1
6
作者 翟琰 翟季冬 +1 位作者 薛巍 金之雁 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期71-75,共5页
选取基准测试程序集SPECMPI的4个程序,以及我国研制的天气预报并行应用GRAPES,在消息传递接口层面(MPI)以及不同的平台上对这5个程序的通信性能进行了插装采集和分析,并使用进程映射的方法进行通信优化.实验结果表明上述方法可完成对较... 选取基准测试程序集SPECMPI的4个程序,以及我国研制的天气预报并行应用GRAPES,在消息传递接口层面(MPI)以及不同的平台上对这5个程序的通信性能进行了插装采集和分析,并使用进程映射的方法进行通信优化.实验结果表明上述方法可完成对较大规模的并行程序的性能数据采集,这对于定位和优化并行程序的性能起到重要作用;在通信性能较差的以太网平台上,进程映射的效果较为明显,而在通信性能较高的Infiniband网络上,进程映射的效果不明显,因此,在选择优化方案时,还需要注意目标平台的性能指标. 展开更多
关键词 并行计算 通信性能分析 基准测试程序 气象预报 进程映射
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部