期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
Thread-Oriented Message-Passing Interface
1
作者 Tong Weiqin Zhou Qinghua Gu Zhikui (School of Computer Engineering and Science) 《Advances in Manufacturing》 SCIE CAS 1998年第1期62-64,69,共4页
In this paper the limitations of the standard Message Passing Interface (MPI) are analyzed, then the technique of multithreading is introduced and a stand alone LWP (light weight process) extension to MPI is impleme... In this paper the limitations of the standard Message Passing Interface (MPI) are analyzed, then the technique of multithreading is introduced and a stand alone LWP (light weight process) extension to MPI is implemented. Experimental results show that system overhead is considerably diminished. 展开更多
关键词 thread message passing performance
下载PDF
Development of high performance casting analysis software by coupled parallel computation
2
作者 Sang Hyun CHO Jeong Kil CHOI 《China Foundry》 SCIE CAS 2007年第3期215-219,共5页
Up to now,so much casting analysis software has been continuing to develop the new access way to real casting processes. Those include the melt flow analysis,heat transfer analysis for solidification calculation,mecha... Up to now,so much casting analysis software has been continuing to develop the new access way to real casting processes. Those include the melt flow analysis,heat transfer analysis for solidification calculation,mechanical property predictions and microstructure predictions. These trials were successful to obtain the ideal results comparing with real situations,so that CAE technologies became inevitable to design or develop new casting processes. But for manufacturing fields,CAE technologies are not so frequently being used because of their difficulties in using the software or insufficient computing performances. To introduce CAE technologies to manufacturing field,the high performance analysis is essential to shorten the gap between product designing time and prototyping time. The software code optimization can be helpful,but it is not enough,because the codes developed by software experts are already optimized enough. As an alternative proposal for high performance computations,the parallel computation technologies are eagerly being applied to CAE technologies to make the analysis time shorter. In this research,SMP (Shared Memory Processing) and MPI (Message Passing Interface) (1) methods for parallelization were applied to commercial software "Z-Cast" to calculate the casting processes. In the code parallelizing processes,the network stabilization,core optimization were also carried out under Microsoft Windows platform and their performances and results were compared with those of normal linear analysis codes. 展开更多
关键词 parallel computation message passing interface casting analysis SMP performance improvement
下载PDF
基于MPI的鲲鹏CPU核间通信研究
3
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
一种对基于云上的并行应用的性能分析模型
4
作者 陈亮 陈文智 +2 位作者 张紫徽 曹学锋 杨德华 《计算机应用与软件》 北大核心 2024年第6期45-54,84,共11页
由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息... 由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息传递接口的应用程序在云上的执行时间提供了一个预测器。该预测器基于性能分析模型,将云资源视为排队网络,将并行应用程序视为争夺共享资源的任务。实验表明,所提方法的总体准确率为89%。 展开更多
关键词 高性能计算 云计算 性能分析 消息传递接口
下载PDF
MPI网络并行计算系统通信性能及并行计算性能的研究 被引量:11
5
作者 孟杰 孙彤 李三立 《小型微型计算机系统》 EI CSCD 北大核心 1997年第1期13-18,共6页
本文研究了基于PentiumPC和100Mbps交换式以太网的机群系统的MPI并行计算环境的通信及并行计算性能,并将其模型化。并且通过对典型应用实例的测试,分析了通信性能对并行计算性能(加速比。
关键词 网络计算 并行计算 加速比 并行效率 MR2网络
下载PDF
曙光1000A上消息传递与共享存储的比较 被引量:13
6
作者 唐志敏 施巍松 胡伟武 《计算机学报》 EI CSCD 北大核心 2000年第2期134-140,共7页
分布式共享存储虽然有易于编程的优点 ,但往往被认为效率不高 .完全由软件实现的分布式共享存储系统 (又称为虚拟共享存储系统 )更是如此 .文中以典型的消息传递系统 PVM与分布式共享存储系统 JIAJIA为例 ,分析了这两种并行程序设计环... 分布式共享存储虽然有易于编程的优点 ,但往往被认为效率不高 .完全由软件实现的分布式共享存储系统 (又称为虚拟共享存储系统 )更是如此 .文中以典型的消息传递系统 PVM与分布式共享存储系统 JIAJIA为例 ,分析了这两种并行程序设计环境的特点 ,并用 7个应用程序在曙光 10 0 0 A上分别比较了这两个系统的性能 .实验结果表明 ,JIAJIA的性能与 PVM基本相当 ,但基于 JIAJIA的并行程序设计却比 展开更多
关键词 共享存储 消息传递 PVM JIAJIA 并行程序设计
下载PDF
二维等离子体模拟粒子云网格方法的并行计算与性能分析 被引量:9
7
作者 莫则尧 许林宝 +1 位作者 张宝琳 沈隆钧 《计算物理》 CSCD 北大核心 1999年第5期496-504,共9页
在共享和 分布式存储两种 并行计算环境 下,组织了二 维等离 子体模 拟粒子 云网 格法程 序(2 D C I C) 的并 行计算。首先,通 过分 析串 行算法 和2 D C I C 程序 的单 机执 行特 征,设 计了 并 行算 法和 实现策略... 在共享和 分布式存储两种 并行计算环境 下,组织了二 维等离 子体模 拟粒子 云网 格法程 序(2 D C I C) 的并 行计算。首先,通 过分 析串 行算法 和2 D C I C 程序 的单 机执 行特 征,设 计了 并 行算 法和 实现策略;然后 ,基于共享存储和 消息传递两种 并行程序设 计方式, 在四种 共享和 分布 式存储 并行 机上,组织了具 体的并行计算,对 性能结果进行 了详细的比较分 析,获得了若干 重要结论。 展开更多
关键词 粒子云网格方法 并行计算 性能分析 等离子体
下载PDF
基于并行模拟的多核集群系统性能预测和分析 被引量:6
8
作者 徐传福 车永刚 王正华 《国防科技大学学报》 EI CAS CSCD 北大核心 2010年第5期62-68,共7页
针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内... 针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。 展开更多
关键词 多核集群 消息传递 并行模拟 性能预测
下载PDF
并行遗传/模拟退火混合算法及其应用 被引量:6
9
作者 温平川 徐晓东 何先刚 《计算机科学》 CSCD 北大核心 2003年第3期86-89,共4页
1 引言人们常常应用随机优化方法,例如:遗传算法GA(Genetic Algorithms),模拟退火算法SA(Simulated Annealing),爬山算法HC(Hill Climbing),Tabu算法等,解决复杂的非线性函数优化问题。这些方法通常需要大量的计算,从而导致运行时间开... 1 引言人们常常应用随机优化方法,例如:遗传算法GA(Genetic Algorithms),模拟退火算法SA(Simulated Annealing),爬山算法HC(Hill Climbing),Tabu算法等,解决复杂的非线性函数优化问题。这些方法通常需要大量的计算,从而导致运行时间开销较大。随着计算机及网络技术的高速发展,在高性能计算平台上并行化随机优化方法成为当今研究领域的热门。特别是Beowulf PCs Cluster技术的成熟。 展开更多
关键词 混合算法 并行遗传算法 模拟退火算法 随机优化算法 计算机
下载PDF
异构环境下MPI通信技术研究 被引量:3
10
作者 蒋艳凰 赵强利 卢宇彤 《小型微型计算机系统》 CSCD 北大核心 2009年第9期1724-1729,共6页
异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进... 异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进行了详细阐述,分析它们对MPI通信的影响;然后基于Open MPI系统,对这两类异构问题的具体实现进行介绍,测试并分析它们对通信性能的影响;最后展望了这一研究方向的技术难点与发展趋势. 展开更多
关键词 高性能计算 MPI 集群 网络异构 处理器异构
下载PDF
马尔科夫链蒙特卡洛算法并行化及其应用 被引量:2
11
作者 屈志勇 陈亭 +2 位作者 王铁强 孙辰军 周纯葆 《计算机工程与设计》 北大核心 2016年第7期1811-1816,1826,共7页
为使高性能计算助力群体遗传学和系统地理学研究,提出一种基于MPI(message passing interface)的群体遗传学分析软件,利用集群中多个CPU核心的计算能力加速群体遗传学分析。进行正确性验证,对并行加速比和并行效率进行评估,在保证计算... 为使高性能计算助力群体遗传学和系统地理学研究,提出一种基于MPI(message passing interface)的群体遗传学分析软件,利用集群中多个CPU核心的计算能力加速群体遗传学分析。进行正确性验证,对并行加速比和并行效率进行评估,在保证计算结果正确性前提下,利用256个CPU核心时可以得到最好的并行加速比(185.16),在利用128个CPU核心时可以得到最好的并行效率(93.68%)。实验结果表明,利用高性能计算能够进行快速有效的群体遗传学分析。 展开更多
关键词 群体遗传学 系统地理学 IM模型 高性能计算 消息传递接口
下载PDF
基于FC-TR网络的MPI通信性能优化研究 被引量:2
12
作者 曾小荟 刘清 +1 位作者 罗文浪 康继昌 《计算机应用研究》 CSCD 北大核心 2011年第4期1505-1508,共4页
为了给上层的MPI并行应用程序提供更快的基于信令寻径式光纤通道交换网络(FC-TR网络)的通信支持,针对FC-VIA-MPI进行了通信性能优化,对点对点通信的实现提出了新的优化方法,尽量把同一节点内进程之间的网络通信转换为内存操作;同时,根... 为了给上层的MPI并行应用程序提供更快的基于信令寻径式光纤通道交换网络(FC-TR网络)的通信支持,针对FC-VIA-MPI进行了通信性能优化,对点对点通信的实现提出了新的优化方法,尽量把同一节点内进程之间的网络通信转换为内存操作;同时,根据底层的FC-TR网络软硬件特性,对MPI的部分组通信(如MPI_Bcast、MPI_Allreduce等)的实现也提出了新的优化算法。实验结果表明,优化的FC-VIA-MPI通信性能总体上提高了10%左右。 展开更多
关键词 光纤通道通信 消息传递接口 网络通信 通信性能优化
下载PDF
基于多核集群系统的并行编程模型的研究 被引量:6
13
作者 胡晨骏 王晓蔚 《计算机技术与发展》 2008年第4期70-73,共4页
并行计算技术是计算机技术发展的重要方向之一。当前并行程序模型主要有消息传递模型和共享存储模型两种。随着处理器多核技术的发展,在一枚多核处理器中集成两个或多个完整的计算引擎(内核),并充分利用多核计算机的特性,发挥多核计算... 并行计算技术是计算机技术发展的重要方向之一。当前并行程序模型主要有消息传递模型和共享存储模型两种。随着处理器多核技术的发展,在一枚多核处理器中集成两个或多个完整的计算引擎(内核),并充分利用多核计算机的特性,发挥多核计算机的性能成为一个很重要的研究方向。介绍一种新的MPI实现机制,这种机制集成了共享存储模型和消息通信模型的优点,在节点内使用共享存储模型,在节点间使用消息传递模型,并且通过自动生成线程级的任务来获得更好的性能。 展开更多
关键词 并行编程模型 消息传递模型 共享存储模型 MPI 线程
下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
14
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建块
下载PDF
基于JIAJIA系统的消息传递和共享存储编程模式比较 被引量:1
15
作者 曾丽芳 杨学军 +2 位作者 黄春 赵克佳 曾劲松 《计算机工程》 CAS CSCD 北大核心 2002年第10期102-104,188,共4页
为了研究基于软件DSM系统的OpenMP实现,该文以一类具有代表性的用户题为例,分别测试了其基于JIAJIA系统的两种实现方式的加速比:一种是用JIAJIA提供的消息传递系统调用,实现一个类MPI版本(方式1);另一种是用多个处理机对共享数... 为了研究基于软件DSM系统的OpenMP实现,该文以一类具有代表性的用户题为例,分别测试了其基于JIAJIA系统的两种实现方式的加速比:一种是用JIAJIA提供的消息传递系统调用,实现一个类MPI版本(方式1);另一种是用多个处理机对共享数组的读写来替代消息传递系统调用(方式2)。测试结果发现,对少量处理机系统,两种方式还具有可比性,但是,随着处理机数的增多,共享存储应用的性能急剧下降。通过对测试结果的分析及对用户题的进一步测试,发现方式2的时间主要花费在做一致性处理和缺页中断处理而导致的大量小消息通信上。测试表明,JIAJIA共享存储程序一般会比MPI程序导致更重的网络负载。要在JIAJIA共享存储基础之上建立一种实用的共享并行计算环境,尤其在支持OpenMP等共享编程语言方面,还有待进一步工作。 展开更多
关键词 JIAJIA系统 消息传递 共享存储编程模式 程序设计
下载PDF
一种实现RapidIO用户态通信接口的改进方法 被引量:3
16
作者 冀映辉 王长清 +1 位作者 张建东 蔡惠智 《计算机工程与应用》 CSCD 北大核心 2011年第5期73-76,共4页
提出了基于TIPC透明进程间通信协议实现RapidIO用户态通信接口的新方法。通过分析RapidIO消息传递模式的特点和TIPC底层发送-接收数据的实现机制,将发送端和接收端传输数据的内存拷贝次数均减少为一次,从而有效地提高了RapidIO通信接口... 提出了基于TIPC透明进程间通信协议实现RapidIO用户态通信接口的新方法。通过分析RapidIO消息传递模式的特点和TIPC底层发送-接收数据的实现机制,将发送端和接收端传输数据的内存拷贝次数均减少为一次,从而有效地提高了RapidIO通信接口的数据吞吐量,降低了通信延迟。介绍的实现方法有较强的工程应用价值。 展开更多
关键词 RapidIO高性能互联协议 消息传递 数字信号处理平台 TIPC透明进程间通信协议 通信接口
下载PDF
Agent通信原型的设计与实现 被引量:2
17
作者 邓曙光 王斌 陈松乔 《计算机工程与应用》 CSCD 北大核心 2003年第17期170-173,共4页
Agent通信一直被认为是多Agent系统协作的核心。该文以人工智能领域中黑板模型结构和消息传送结构作为多Agent系统的基本通信结构,对树形拓扑的多Agent原型系统进行了研究与构造。为适应日益广泛的多Agent系统应用需求,在Agent通信报文... Agent通信一直被认为是多Agent系统协作的核心。该文以人工智能领域中黑板模型结构和消息传送结构作为多Agent系统的基本通信结构,对树形拓扑的多Agent原型系统进行了研究与构造。为适应日益广泛的多Agent系统应用需求,在Agent通信报文设计中考虑了不同网络服务质量及安全参数。文章给出了不同类型的Agent通信实例及通信过程描述,并详述了Agent通信调度算法。最后,对多线程和动态负载平衡等实现原型系统的关键技术进行了分析。 展开更多
关键词 树形多Agent系统 黑板模型结构 消息传送结构 多线程 负载平衡
下载PDF
基于PVM的安全线程机制的研究 被引量:1
18
作者 鲁宏伟 武浩 肖永玲 《计算机工程与应用》 CSCD 北大核心 2004年第10期101-103,共3页
PVM并行虚拟机是一种广为使用的分布并行消息库,使用进程作为并行任务的基本单位。但是PVM不支持安全的线程机制。在研究借鉴先前研究经验的基础上,研究支持PVM线程安全的机制,在PVM库和POSIX线程库之上设计了支持PVM线程应用的库PTL,... PVM并行虚拟机是一种广为使用的分布并行消息库,使用进程作为并行任务的基本单位。但是PVM不支持安全的线程机制。在研究借鉴先前研究经验的基础上,研究支持PVM线程安全的机制,在PVM库和POSIX线程库之上设计了支持PVM线程应用的库PTL,使基于进程的消息传递模型可以基于线程来实现。阐述了其设计原理,给出了程序设计示例,最后给出总结。 展开更多
关键词 并行虚拟机(PVM) 消息传递 线程安全
下载PDF
并行程序环境及其系统移植实现 被引量:1
19
作者 温钰洪 沈美明 +1 位作者 郑纬民 王鼎兴 《小型微型计算机系统》 EI CSCD 北大核心 1996年第1期13-19,共7页
并行程序设计环境作为分布并行系统中,并行应用程序开发设计与调试运行控制的工具,对于并行处理技术的研究发展与推广应用,具有重要的作用、本文将分析讨论并行程序环境Express与PVM的系统特点及其实现方法,同时,介绍E... 并行程序设计环境作为分布并行系统中,并行应用程序开发设计与调试运行控制的工具,对于并行处理技术的研究发展与推广应用,具有重要的作用、本文将分析讨论并行程序环境Express与PVM的系统特点及其实现方法,同时,介绍Express系统在并行图归约智能工作站上的系统移植实现。 展开更多
关键词 并行程序环境 消息通讯 任务分配 性能分析
下载PDF
PDSM:一个可移植的分布式共享存储系统 被引量:1
20
作者 徐大杰 章锋 +1 位作者 李宁峰 陈国良 《计算机科学》 CSCD 北大核心 1999年第2期18-22,共5页
1.引言科学计算是一门迅速发展的学科,传统上,这些问题是用超级计算机或工作站机群来解决的。在互相独立的计算机上的并行程序设计是在PVM这样的网络并行计算和分布式编程环境下通过消息传递实现结点通信的。但是,由于编程者要了解底层... 1.引言科学计算是一门迅速发展的学科,传统上,这些问题是用超级计算机或工作站机群来解决的。在互相独立的计算机上的并行程序设计是在PVM这样的网络并行计算和分布式编程环境下通过消息传递实现结点通信的。但是,由于编程者要了解底层消息传递的细节,基于PVM的并行编程十分困难,而科学家们又没有很多精力用于细致的程序设计。DSM(分布式共享内存)通过在工作站机群上建立一个共享内存的抽象层来降低这种程序设计的复杂度。 展开更多
关键词 PDSM 共享存储系统 UNIX 操作系统
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部