期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
提高预处理共轭梯度法计算大型电网潮流时并行性能的方法 被引量:13
1
作者 丁明 张晋波 汪兴强 《电网技术》 EI CSCD 北大核心 2008年第13期15-19,共5页
研究了如何提高预处理共轭梯度(preconditioned conjugate gradient,PCG)法计算大网络交流潮流时的并行性能,提出了一种新的并行处理方法——并行节点分配法,即将节点导纳矩阵和节点出力的数据以节点为单位分派给各个处理器,在各个处理... 研究了如何提高预处理共轭梯度(preconditioned conjugate gradient,PCG)法计算大网络交流潮流时的并行性能,提出了一种新的并行处理方法——并行节点分配法,即将节点导纳矩阵和节点出力的数据以节点为单位分派给各个处理器,在各个处理器中完成余下的计算处理部分。算例分析表明,在使用PCG法进行大网络交流潮流计算时,并行节点分配法在并行性能上具有一定的优势,进而为PCG法在大网络交流潮流并行计算中的应用提供了可借鉴的经验。 展开更多
关键词 并行节点分配法 潮流计算 BEOWULF集群 预处理共轭梯度法 并行性能
下载PDF
一类求解非线性方程组算法的并行性能分析 被引量:10
2
作者 杨庚 《计算机学报》 EI CSCD 北大核心 2000年第10期1035-1039,共5页
讨论了一类求解非线性方程组算法的并行性能 .与传统的算法不同之处是用一个块对角矩阵作为迭代矩阵 ,且该矩阵可由一个仅包含向量内积和矩阵与向量乘积的递推关系简便计算得到 .在对算法进行描述之后 ,分析了算法的并行执行过程 ,给出... 讨论了一类求解非线性方程组算法的并行性能 .与传统的算法不同之处是用一个块对角矩阵作为迭代矩阵 ,且该矩阵可由一个仅包含向量内积和矩阵与向量乘积的递推关系简便计算得到 .在对算法进行描述之后 ,分析了算法的并行执行过程 ,给出了算法的并行加速比和对存储的需求分析 ,数值计算表明理论分析与数值结果相符合 ,算法具有较好的并行度和较低的存储要求 . 展开更多
关键词 非线性方程组 数值计算 算法 并行性能
下载PDF
求解一类线性问题的两种迭代算法的并行性能分析 被引量:1
3
作者 罗掌华 《广西师范大学学报(自然科学版)》 CAS 2001年第1期43-47,共5页
讨论了针对求解线性问题 Y=(A B) Y+Φ1 的 OOPI算法和 MPID算法的并行性能 .在对算法的并行执行过程进行描述之后 ,文中给出了两种算法的存储性能要求和并行加速比 .通过分析之后发现 ,OOPI算法的并行性能依赖于对 m× m阶矩阵分... 讨论了针对求解线性问题 Y=(A B) Y+Φ1 的 OOPI算法和 MPID算法的并行性能 .在对算法的并行执行过程进行描述之后 ,文中给出了两种算法的存储性能要求和并行加速比 .通过分析之后发现 ,OOPI算法的并行性能依赖于对 m× m阶矩阵分解 ,而 MPID算法却难以在处理机之间平均分配负载 ,这降低了并行机的有效利用率 ,为克服这两种算法在并行计算上的缺陷 ,提出了 OMPID算法 。 展开更多
关键词 迭代算法 并行计算 最佳多参数迭代法 收敛性 并行性能 线性问题 存储性能
下载PDF
网络处理器并行性能模型及多线程停顿特性
4
作者 时向泉 苏金树 +1 位作者 陈一骄 吴纯青 《通信学报》 EI CSCD 北大核心 2007年第9期53-59,共7页
对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了... 对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了验证,并给出了相关的结论。 展开更多
关键词 网络处理器 并行性能模型 多线程 停顿
下载PDF
一种并行性能模拟中LP到PP的高效映射方法
5
作者 方建滨 徐传福 +2 位作者 车永刚 翁玉芬 王正华 《计算机工程与科学》 CSCD 北大核心 2009年第A01期218-220,233,共4页
LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取合适的映射方式。实... LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取合适的映射方式。实验表明,相对于常规映射方法,A2-LP3M减少并行模拟时间最多可达16.2%。 展开更多
关键词 并行性能模拟 映射 通信优化 负载平衡
下载PDF
Trace生成对大规模并行性能模拟的影响及其改进策略
6
作者 徐传福 王荣 +1 位作者 车永刚 王正华 《计算机工程与科学》 CSCD 北大核心 2012年第3期67-73,共7页
Trace生成是trace驱动体系结构模拟中不可或缺的步骤。Trace不仅需要占用大量存储空间,其生成过程还可能对目标应用程序的模拟执行产生一定程度的干扰,导致性能数据误差。Trace驱动并行性能模拟器由于其设计实现特点和所运行的宿主并行... Trace生成是trace驱动体系结构模拟中不可或缺的步骤。Trace不仅需要占用大量存储空间,其生成过程还可能对目标应用程序的模拟执行产生一定程度的干扰,导致性能数据误差。Trace驱动并行性能模拟器由于其设计实现特点和所运行的宿主并行平台的多样性,使得trace生成的影响具有其独特性。本文选取典型并行模拟器BigSim和若干具有不同计算通信比的目标并行程序,在三个支持不同traceI/O方式的宿主机平台上设计实验评估了trace生成对并行性能模拟的影响,结果表明trace生成对模拟效率和精度均有较大的影响,并分析了这种影响与并行模拟器实现和宿主机平台I/O方式的关系,进而讨论了几种可行的改进方案,对trace驱动并行模拟器设计、实现和使用具有一定的指导意义。 展开更多
关键词 踪迹 并行性能模拟 踪迹I/O 体系结构
下载PDF
Krylov子空间方法解线性方程组的并行性能分析及应用
7
作者 刘青昆 舒继武 张德富 《计算机工程与应用》 CSCD 北大核心 1999年第6期33-36,共4页
许多并行计算问题,在结合并行机的特有体系结构时,要对算法的并行性能及其可扩展性进行分析。它决定了该算法解决有关问题是否有效,并进一步判断所用的并行计算系统是否符合求解问题的要求。文章通过对Krylov子空间中两种有效... 许多并行计算问题,在结合并行机的特有体系结构时,要对算法的并行性能及其可扩展性进行分析。它决定了该算法解决有关问题是否有效,并进一步判断所用的并行计算系统是否符合求解问题的要求。文章通过对Krylov子空间中两种有效算法-PCG算法和GMRES(m)算法在一类并行系统中形成的并行算法的性能进行了分析,给出了其求解问题规模与处理机数与加速比的关系结果表明。GMRES(m)算法比PCG算法更适合于并行。 展开更多
关键词 KRYLOV子空间 线性方程组 并行性能
下载PDF
消息传递模型的并行性能研究 被引量:1
8
作者 郭红霞 潘斌 《成都大学学报(自然科学版)》 2007年第1期30-32,36,共4页
消息传递模式因其通用性、可描述性、易于调试性和高性能的优点在并行程序设计中得到广泛应用.以MPICH 2构建并行计算环境下对消息传递模式的点对点性能、组通讯性能进行研究,将网络并行计算系统中的性能指标模型化,以期对分析整个系统... 消息传递模式因其通用性、可描述性、易于调试性和高性能的优点在并行程序设计中得到广泛应用.以MPICH 2构建并行计算环境下对消息传递模式的点对点性能、组通讯性能进行研究,将网络并行计算系统中的性能指标模型化,以期对分析整个系统的并行性能提供帮助. 展开更多
关键词 消息传递模式 并行性能模型 点对点通信 组通信
下载PDF
Linpack并行性能模型及其预测 被引量:6
9
作者 王申 漆锋滨 +1 位作者 谷洪峰 潘治 《计算机工程》 CAS CSCD 2012年第16期81-84,共4页
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Lin... 通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Linpack并行性能的影响,尤其在大规模矩阵情况下预测误差不到1%。 展开更多
关键词 Linpack测试 并行性能模型 预测 矩阵规模 网络带宽
下载PDF
S2E测试平台及并行性能分析 被引量:4
10
作者 王学 李学新 +1 位作者 周智鹏 袁耀文 《信息网络安全》 2012年第7期16-19,共4页
S2E是一款开源的基于Qemu虚拟机并结合KLEE以及LLVM的软件安全测试平台,其主要优越性体现为:支持全系统控制;支持多平台分析;支持多核以提高分析效率。分析研究该平台,对软件测试、漏洞挖掘都具有现实意义。S2E的成功得益于对符号执行... S2E是一款开源的基于Qemu虚拟机并结合KLEE以及LLVM的软件安全测试平台,其主要优越性体现为:支持全系统控制;支持多平台分析;支持多核以提高分析效率。分析研究该平台,对软件测试、漏洞挖掘都具有现实意义。S2E的成功得益于对符号执行、动态二进制翻译和虚拟机技术的运用。文章着重介绍S2E的架构,插件的使用实例,并结合实例分析S2E的并行性能。 展开更多
关键词 S2E 软件测试 漏洞挖掘 Qemu虚拟机 并行性能分析
下载PDF
中尺度数值气象预报模式MM5并行性能分析与优化 被引量:3
11
作者 刘艳贤 刘钟 黄洁 《计算技术与自动化》 2004年第4期96-98,共3页
气象预报模型的准确度与实时性是防震减灾工作的关键支持。MM5是成熟的并行化的中尺度数值气象预报模型。本文在阐述MM5并行模式及并行实现的基础上,具体分析了MM5在IBMeServerpSeries690主机上并行性能,并给出相应的优化方案。
关键词 并行性能 并行实现 实时性 IBM 并行模式 数值 主机 模型 支持 气象预报
下载PDF
一种Trace驱动的多核SMP集群并行性能模拟方法
12
作者 翁玉芬 徐传福 +2 位作者 车永刚 方建滨 王正华 《计算机工程与科学》 CSCD 北大核心 2009年第A01期172-175,共4页
基于新型多核SMP集群的层次化性能模型,本文在BigSim并行性能模拟器基础上实现了一个Trace驱动的多核SMP集群并行性能模拟器Sim-MSC。在一个InfiniBand多核SMP集群的宿主机平台上采用jacobi3D程序进行了测试,结果表明Sim-MSC能够模拟MP... 基于新型多核SMP集群的层次化性能模型,本文在BigSim并行性能模拟器基础上实现了一个Trace驱动的多核SMP集群并行性能模拟器Sim-MSC。在一个InfiniBand多核SMP集群的宿主机平台上采用jacobi3D程序进行了测试,结果表明Sim-MSC能够模拟MPI消息传递并行应用程序在多核SMP集群上的执行特征,精确预测系统和应用性能。 展开更多
关键词 多核SMP集群 trace驱动模拟器 并行性能模拟
下载PDF
PETSC库在自强2000上的移植及其并行性能分析
13
作者 潘楷钱 雷咏梅 《计算机工程》 CAS CSCD 北大核心 2004年第3期96-98,共3页
论述了PETSC在自强2000集群式高性能计算机上的移植与实现,结合五对角线性方程问题实例,分析了其在高性能计算机上的并行性能。
关键词 PETSC 可扩展 性能计算机 并行性能
下载PDF
大规模面向对象有限元程序的并行性能监测
14
作者 王海兵 《计算机应用》 CSCD 北大核心 2011年第A01期172-173,176,共3页
通过重载MPI消息传递函数,在重载的MPI函数中调用MPE库中各日志记录函数,实现了大规模面向对象有限元程序自定义并行性能监测。对一个典型冲击动力学问题进行了16 CPU的并行有限元模拟,通过并行性能监测对其有限元并行算法进行了分析。
关键词 多处理环境 并行性能监测 有限元 并行计算
下载PDF
高性能并行计算在科学计算领域的应用与优化
15
作者 石学鹏 《数字通信世界》 2024年第1期125-127,共3页
高性能并行计算在科学计算领域扮演着至关重要的角色,其应用和优化对于推动科学研究和解决复杂问题具有重大意义。文章旨在探讨高性能并行计算在科学计算领域的应用及其优化方法,首先介绍了高性能并行计算的基本概念。然后,详细讨论了... 高性能并行计算在科学计算领域扮演着至关重要的角色,其应用和优化对于推动科学研究和解决复杂问题具有重大意义。文章旨在探讨高性能并行计算在科学计算领域的应用及其优化方法,首先介绍了高性能并行计算的基本概念。然后,详细讨论了高性能并行计算在科学计算中的应用情况。接下来,探讨了高性能并行计算的优化方法和策略,包括并行算法设计、任务划分、数据通信和同步机制等方面,希望可以为相关研究人员提供一定借鉴。 展开更多
关键词 性能并行计算 科学计算 优化研究
下载PDF
数据挖掘网格中决策树并行算法设计及性能分析 被引量:3
16
作者 陈平 乔秀全 +1 位作者 刘臻 田小萍 《北京邮电大学学报》 EI CAS CSCD 北大核心 2009年第B04期49-52,共4页
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘.采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法... 提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘.采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题.并给出了指导该并行算法高效计算的方法.数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比. 展开更多
关键词 数据挖掘 网格计算 决策树 并行性能
下载PDF
FFT算法的并行化性能分析
17
作者 王璐 梁涛 王文义 《中原工学院学报》 CAS 2010年第5期30-32,41,共4页
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其... 以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其通信开销明显较低,具有较高性价比和较好的应用前景. 展开更多
关键词 并行性能 CUFFT MPI FFTW
下载PDF
求解Boltzmann模型方程高性能并行算法在航天跨流域空气动力学应用研究 被引量:9
18
作者 李志辉 蒋新宇 +2 位作者 吴俊林 徐金秀 白智勇 《计算机学报》 EI CSCD 北大核心 2016年第9期1801-1811,共11页
对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统... 对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统一算法变量依赖关系,建立可扩展并行计算方案;研究数据并行分布与并行执行特征,开展大规模并行化程序设计,并在小、中、大规模256-512、4096-20 625CPU及异构计算机500-45 000、3125-112 500进程并行算法测试,建立稳定运行于国产千万亿次超级计算机高性能可扩展大规模并行算法与航天器再入跨流域复杂气动力/热绕流问题并行化软件应用平台.通过对稀薄流到连续流再入飞行不同高度可回收返回式卫星飞行器、近空间大尺度机动飞行器跨流域绕流环境不同粒度高性能计算与验证,揭示大尺度复杂结构飞行器跨流区飞行稀薄过渡流区热流系数比连续、近连续流区热流系数随物面变化剧烈得多、大得多,发现该类飞行器后端面热流最大值发生在水平舵外侧拐角处,达驻点热流六分之一量级,提供了一个可靠求解航天器再入各流域高超声速绕流问题统一算法高性能并行计算应用研究方向. 展开更多
关键词 航天器 跨流域空气动力学 BOLTZMANN模型方程 统一算法 区域分解 性能并行计算
下载PDF
一种高性能并行计算网络—RHiNET
19
作者 夏秦 董小社 +1 位作者 贾志国 吴维刚 《计算机应用研究》 CSCD 北大核心 2002年第7期10-12,共3页
RHiNET是用于构建高性能分布式并行计算系统的光互联网络 ,它由协议、网络接口、交换机和光链路四部分组成 ,有三代实验产品面世。在全面介绍以上各部分的结构、特点后 ,还与其它一些高性能互联网络和标准进行了比较。
关键词 计算机网络 光互联网 性能并行计算网络 RHiNET
下载PDF
高性能并行仿真中持久性研究
20
作者 王学慧 张磊 +1 位作者 陈国强 方粮 《计算机与数字工程》 2014年第10期1749-1751,1757,共4页
随着分布式仿真规模的日益扩大,高性能计算的不断发展,高性能仿真技术逐渐成为仿真领域新的研究热点,其中持久性框架及其实现机制是高性能仿真引擎中至关重要的一层支撑技术,它不但用于系统的负载平衡而且用于检查点及恢复操作。该文针... 随着分布式仿真规模的日益扩大,高性能计算的不断发展,高性能仿真技术逐渐成为仿真领域新的研究热点,其中持久性框架及其实现机制是高性能仿真引擎中至关重要的一层支撑技术,它不但用于系统的负载平衡而且用于检查点及恢复操作。该文针对高性能仿真持久性问题,先提出了持久框架的结构,重点研究了两种持久库对持久框架性能的影响,通过实验数据对其性能差异进行分析,得出基于C++模板的持久框架更具优越性的结论。 展开更多
关键词 性能并行仿真 持久性 优越性
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部