期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于消息传递的时域分解并行算法研究
1
作者 李永刚 欧阳洁 《计算机工程与应用》 CSCD 北大核心 2006年第18期32-36,共5页
将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有... 将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有较高的加速性能以及良好的可扩展性,体现了时域分解的独特优势。 展开更多
关键词 时域分解 主从模式 消息传递 并行算法
下载PDF
介于消息传递界面和并行应用之间的通信库系统功能分析 被引量:1
2
作者 熊玉庆 《微电子学与计算机》 CSCD 北大核心 2006年第z1期165-166,170,共3页
介于消息传递界面和并行应用之间的通信库系统对开发高性能的可靠、易维护的大型并行应用提供了支持。文章以BLACS和OilCL为例,从进程抽象命名,基于源的消息选择,非阻塞通信和集体通信等方面分析了介于消息传递系统和并行应用之间的通... 介于消息传递界面和并行应用之间的通信库系统对开发高性能的可靠、易维护的大型并行应用提供了支持。文章以BLACS和OilCL为例,从进程抽象命名,基于源的消息选择,非阻塞通信和集体通信等方面分析了介于消息传递系统和并行应用之间的通信库系统功能。 展开更多
关键词 分布存储并行计算 消息传递界面 MPI PVM 通信库 并行应用
下载PDF
消息传递界面PVM和MPI的现状与发展趋势 被引量:10
3
作者 秦忠国 姜弘道 《计算机研究与发展》 EI CSCD 北大核心 1998年第6期496-499,共4页
PVM和MPI是目前国际上最有影响的两种消息传递并行计算环境,两者都能在MPP和工作站网络上运行.由于设计背景和侧重点不同,使得这两种界面既有共同点,又各具特色.文中就性能和发展趋势对两者进行叙述和比较,可供并行程序... PVM和MPI是目前国际上最有影响的两种消息传递并行计算环境,两者都能在MPP和工作站网络上运行.由于设计背景和侧重点不同,使得这两种界面既有共同点,又各具特色.文中就性能和发展趋势对两者进行叙述和比较,可供并行程序开发者选择并行计算环境时参考. 展开更多
关键词 并行计算 消息传递界面 并行计算机 PVM MPI
下载PDF
一个基于消息传递接口和面向对象的图像信号处理并行向量库 被引量:1
4
作者 姜春茂 吴翔虎 +3 位作者 段莹 曲明成 刘敏 李志聪 《计算机应用研究》 CSCD 北大核心 2012年第12期4560-4563,4570,共5页
传统并行软件系统的设计和实现存在着开发效率低、质量难以保证和可移植性差等问题。针对这些问题,采用开发标准并行库的方法加以解决。借鉴高性能嵌入式计算软件计划(high performance embedded computing software initiative,HPEC_SI... 传统并行软件系统的设计和实现存在着开发效率低、质量难以保证和可移植性差等问题。针对这些问题,采用开发标准并行库的方法加以解决。借鉴高性能嵌入式计算软件计划(high performance embedded computing software initiative,HPEC_SI)的解决方法,基于消息传递接口(message passing interface,MPI)的消息传递机制,对图像/信号处理中的一些典型并行算法以类组件的方式进行封装,设计和实现了具有面向对象特征的、用于图像/信号处理的并行向量库,提供给应用软件开发人员一个良好的开发环境。通过测试和实验证明,该库可以高效地实现相应的向量矩阵并行算法,并具有简单易用、可复用性和可移植性强、效率高的特点。 展开更多
关键词 面向对象 消息传递机制 层次型结构 并行算法
下载PDF
若干发展的消息传递界面:PVMPI,IMPI与FT-MPI 被引量:1
5
作者 魏兵海 《计算机科学》 CSCD 北大核心 2004年第3期161-162,169,共3页
本文介绍了诸如PVMPI、IMPI的改进型消息传递界面(在异构环境中不同的MPI实现能够彼此互操作),也介绍了具有容错能力的FI-MPI。分析了MPI的特征和体系结构及其性能。
关键词 消息传递界面 PVMPI IMPI FT-MPI 并行虚拟机 操作系统
下载PDF
平面点集凸包的并行算法研究 被引量:6
6
作者 郝小柱 胡祥云 +2 位作者 戴光明 张荣 程红杰 《计算机应用》 CSCD 北大核心 2005年第10期2462-2464,共3页
提出了在基于有序简单多边形的平面点集凸包快速求取算法基础上改进的并行算法,该算法的时间复杂度达到了O(n)。在PC机互连构成的机群(COW)并行计算系统上以消息传递方式执行该算法,通过与原串行算法对比验证了该算法的可行性、正确性... 提出了在基于有序简单多边形的平面点集凸包快速求取算法基础上改进的并行算法,该算法的时间复杂度达到了O(n)。在PC机互连构成的机群(COW)并行计算系统上以消息传递方式执行该算法,通过与原串行算法对比验证了该算法的可行性、正确性和高效性。 展开更多
关键词 点集凸包 并行算法 机群 消息传递界面
下载PDF
直接数值模拟中三对角方程组并行算法研究 被引量:2
7
作者 周俊虎 朱晨洁 +3 位作者 王智化 张彦威 樊建人 岑可法 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第9期1439-1444,共6页
为了提高大规模直接数值模拟(DNS)中三对角方程组的并行求解效率,提出了一种并行分裂算法.该算法基于Wang 的分裂算法,采用平均分配策略划分三对角方程组,利用非阻塞通信模式取代阻塞通信模式,以原有空间存储新的计算结果.在Linux集群... 为了提高大规模直接数值模拟(DNS)中三对角方程组的并行求解效率,提出了一种并行分裂算法.该算法基于Wang 的分裂算法,采用平均分配策略划分三对角方程组,利用非阻塞通信模式取代阻塞通信模式,以原有空间存储新的计算结果.在Linux集群服务器上进行了两种不同规模三对角方程组的实现,并研究了不同节点数目与计算规模下的计算时间和加速比.结果表明,该算法的计算与通信重叠度高,计算步骤和存储开销小,具有较高的并行计算效率.在百兆网络条件下,从1×105规模矩阵开始具有明显并行优势,并且随矩阵规模增大,加速比不断提高.该算法适用于大规模三对角矩阵的并行计算. 展开更多
关键词 三对角方程组 并行算法 消息传递接口 加速比
下载PDF
典型并行算法的实现性能分析 被引量:5
8
作者 雷英杰 霍红卫 《空军工程大学学报(自然科学版)》 CSCD 2003年第5期67-70,74,共5页
讨论和分析了几种典型的并行算法及其各种处理方法在基于WindowsXP环境、消息传递接口MPI并行编程环境支持和C++语言描述的编程实现问题,给出了相应并行程序详尽的计算结果,对比分析了它们的计算性能,以及它们对计算精度产生的影响。分... 讨论和分析了几种典型的并行算法及其各种处理方法在基于WindowsXP环境、消息传递接口MPI并行编程环境支持和C++语言描述的编程实现问题,给出了相应并行程序详尽的计算结果,对比分析了它们的计算性能,以及它们对计算精度产生的影响。分析结论以相应并行算法的实际编程实现和试验计算数据为基础,可信度高。设计实例表明,分析方法是有效的。 展开更多
关键词 并行计算 消息传递接口 并行算法 高性能计算
下载PDF
基于MPI的地下水数值模拟并行算法研究 被引量:3
9
作者 黄林显 邵景力 +2 位作者 崔亚莉 李玲 程汤培 《安徽农业科学》 CAS 2012年第12期7356-7358,共3页
地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销... 地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销的PCG并行算法。通过在具有4个处理核心的Linux集群环境中的测试可知,该程序运行所获得的加速比会随着处理核心数的增加而不断增大,并在4个处理核心数的时候获得最大加速比2.21,说明所设计的PCG并行算法具有较好的加速效果和可扩展性。 展开更多
关键词 地下水数值模拟 并行算法 消息传递标准MPI 预处理共轭梯度法
下载PDF
一种基于MPICH的高效矩阵相乘并行算法 被引量:2
10
作者 剡公孝 申卫昌 +1 位作者 刘骊 刘伟明 《计算机工程与应用》 CSCD 北大核心 2009年第26期72-73,117,共3页
根据MPICH并行编程环境中任务间通信的特点,设计了一种基于MPICH的矩阵相乘并行算法。根据运行在COW(工作站机群)上的进程数目将矩阵A按行划分成相应数目的子矩阵,每个进程完成一个子矩阵与矩阵B的相乘运算。实验结果表明,该算法提高了... 根据MPICH并行编程环境中任务间通信的特点,设计了一种基于MPICH的矩阵相乘并行算法。根据运行在COW(工作站机群)上的进程数目将矩阵A按行划分成相应数目的子矩阵,每个进程完成一个子矩阵与矩阵B的相乘运算。实验结果表明,该算法提高了机群并行环境中资源的利用率,提高了程序的运行效率。 展开更多
关键词 一种消息传递接口的实现(MPICH) 矩阵相乘并行算法 工作站机群
下载PDF
基于并行算法的生命游戏分解策略的性能分析
11
作者 彭嵩松 刘波勇 《井冈山学院学报(综合版)》 2005年第12M期21-23,31,共4页
对GoL问题采用数据划分的并行算法分析,提出两种分解策略并基于MPI2.0设计模拟程序。给出了两种分解策略程序的试验性能结果和比较,得出二维分解对GoL问题不是最优分解策略。最后指出了数据划分在解决并行问题中的重要性。
关键词 并行算法 COL 消息传递接口 数据划分
下载PDF
随机模式匹配并行算法在工作站机群上的实现
12
作者 薛淞文 申卫昌 +1 位作者 剡公孝 乔龙 《计算机工程与应用》 CSCD 北大核心 2010年第21期129-131,共3页
对随机模式匹配算法进行了改进,并根据MPICH并行编程环境中任务间通信的特点,设计了一种基于MPICH的改进的随机模式匹配并行算法。根据运行在COW(工作站机群)上的进程数目将文本串进行重叠划分,每个进程完成一个文本子串的模式匹配。实... 对随机模式匹配算法进行了改进,并根据MPICH并行编程环境中任务间通信的特点,设计了一种基于MPICH的改进的随机模式匹配并行算法。根据运行在COW(工作站机群)上的进程数目将文本串进行重叠划分,每个进程完成一个文本子串的模式匹配。实验结果表明,该改进的随机模式匹配并行算法有效地加快了模式匹配的速度,提高了工作站机群的资源利用率。 展开更多
关键词 模式匹配 消息传递编程标准的一种实现(MPICH) 并行算法 工作站机群
下载PDF
基于静态双重区域分解的两种接触并行算法
13
作者 姜玉曦 周海兵 熊俊 《气体物理》 2019年第2期44-54,共11页
CHAP3D是北京应用物理与计算数学研究所自主研发的Lagrange通用弹塑性流体力学分析程序.文章介绍了在CHAP3D程序中使用的、针对多处理器集群的、基于静态双重区域分解的两种接触并行算法.第一种是分配单个完整接触面的接触并行算法,此... CHAP3D是北京应用物理与计算数学研究所自主研发的Lagrange通用弹塑性流体力学分析程序.文章介绍了在CHAP3D程序中使用的、针对多处理器集群的、基于静态双重区域分解的两种接触并行算法.第一种是分配单个完整接触面的接触并行算法,此算法将一对完整的接触面分配到一个处理器上,并建立计算域与接触域的通信关系.此接触并行算法的优点是简单,在具有接触面的处理器上可以直接使用串行的接触搜索算法和接触力耦合计算算法.另一种是主面剖分区域分解的接触并行算法,此算法将所有接触面的主面区域分解到所有处理器上.须建立计算域与接触域以及接触域内各处理器间的两种通信关系.该接触并行算法是一个负载平衡的并行算法,具有很好的并行效率和可扩展性.数值算例显示,这两种接触并行算法都能够很好地模拟多种不同类型的接触问题. 展开更多
关键词 接触并行算法 接触算法 区域分解 消息传递接口 Lagrange数值模拟
下载PDF
面向语音分离的深层转导式非负矩阵分解并行算法
14
作者 李雨蓉 刘杰 +2 位作者 刘亚林 龚春叶 王勇 《计算机科学》 CSCD 北大核心 2020年第8期49-55,共7页
非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算... 非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算问题,文中提出深层转导式非负矩阵分解并行算法,综合考虑迭代更新过程的数据关联性,设计了一种任务间和任务内多级并行算法。该并行算法在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务进行并行计算;在任务内部进程级把矩阵按行列划分,主进程把矩阵块分发到从进程,从进程接收当前矩阵块并计算结果矩阵子块,然后将当前进程矩阵块发送到下一进程,实现第二个矩阵中每一个矩阵块在所有进程的遍历,并计算结果矩阵对应子块的乘积,最后由主进程收集从进程数据块;在线程级子矩阵乘法运算的过程中,采取生成多线程,通过共享内存交换数据计算子矩阵块的加速策略。该算法为首个实现深层转导式非负矩阵分解的并行算法。在天河二号平台上的测试结果表明,在分离多说话人混合语音信号时,相比串行程序,所提出的并行算法能在不改变分离效果的前提下,使得预训练过程中使用64个进程的加速比为18,分离过程使用64个进程的对应加速比为24。相较于串行及MPI模型分离,混合模型分离时间大大缩短,从而证明了设计的并行算法可有效提高语音分离的效率。 展开更多
关键词 深层转导式非负矩阵分解并行算法 乘性迭代更新规则加速算法 消息传递接口 共享存储并行编程 语音分离
下载PDF
作物生育期模拟并行调度算法的研究与设计 被引量:5
15
作者 姜海燕 彭川阳 +2 位作者 尹言 朱艳 曹卫星 《江苏农业学报》 CSCD 北大核心 2010年第6期1210-1216,共7页
探明作物生育期模拟在PC集群环境下的并行调度算法,有助于提高模型的计算效率。该研究综合应用划分策略和流水线技术,具体分析了已有作物的生长发育和物候期模拟算法的输入输出参数特性,确定了作物生育期模拟通用算法框架,包括热效应、... 探明作物生育期模拟在PC集群环境下的并行调度算法,有助于提高模型的计算效率。该研究综合应用划分策略和流水线技术,具体分析了已有作物的生长发育和物候期模拟算法的输入输出参数特性,确定了作物生育期模拟通用算法框架,包括热效应、光周期效应、春化效应、有效积温、生理发育时间和物候期共6个计算单元;进一步明确了具有独立、自依赖和相互依赖关系的作物模型的计算任务划分和数据分解方法。为达到数据通讯和同步开销最小的目标,设计了多节点混合调度的优化模型。该研究提出了基于OpenMP的多处理机并行调度算法和基于MPI/OpenMP混合的多节点并行调度算法,并在Windows Compute Cluster Server2003组成的PC集群环境下,在加速比、计算缓冲区大小和计算节点个数等方面进行了性能度量与比较。结果表明:两种并行调度算法均可有效提高小麦生育期模拟的计算效率,第1种算法简单易行,平均加速比为1.55,对集群计算资源的利用率有限;第2种算法的平均加速比是3.37,当计算量较大时,具有更好的计算性能。 展开更多
关键词 生长发育与物候期 模拟模型 小麦 并行算法 共享内存 消息传递
下载PDF
分布式并行混合遗传算法在无功优化中的应用 被引量:9
16
作者 李运华 吴宏昺 +1 位作者 盛万兴 刘科研 《电力系统及其自动化学报》 CSCD 北大核心 2008年第2期36-41,共6页
将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标... 将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标准数据运算,证明了这种算法在电力系统无功优化计算中具有很高的稳定性和快速求解能力。 展开更多
关键词 无功优化 消息传递界面 分布式并行混合遗传算法 模拟退火 个体迁移 最优值恢复
下载PDF
激光辐照下树脂基复合材料温度场MSPH算法的并行化
17
作者 陈敏孙 江厚满 刘泽金 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第6期120-123,共4页
改进的光滑粒子方法在模拟激光对树脂基复合材料的辐照效应时具有明显优势,但串行计算通常难以满足需求。为了提高程序的运行效率,基于消息传递界面并行编程环境实现了串行程序的并行化。将个人电脑完成的串行计算结果与峰值5万亿次的... 改进的光滑粒子方法在模拟激光对树脂基复合材料的辐照效应时具有明显优势,但串行计算通常难以满足需求。为了提高程序的运行效率,基于消息传递界面并行编程环境实现了串行程序的并行化。将个人电脑完成的串行计算结果与峰值5万亿次的计算机集群完成的并行计算结果进行了比较,并对并行程序的加速比和并行效率进行了测试。数值计算表明,并行计算结果与串行计算结果一致,且并行效果显著,说明基于消息传递界面的并行化是成功的。 展开更多
关键词 激光辐照 树脂基复合材料 改进的光滑粒子方法 消息传递界面 并行
下载PDF
PDD算法在对称多处理器高性能计算机上的并行实现 被引量:1
18
作者 程海英 《重庆工商大学学报(自然科学版)》 2003年第1期31-32,46,共3页
使用基于MPI并行编程方法,对PDD算法进行了并行处理及fortran编程,给出了并行代码在上海大学计算机学院自强2000集群式高性能计算机上的运行结果,以及与串行程序相比较的并行加速比。
关键词 PDD算法 对称多处理器 并行计算 并行算法 消息传递 MPI编程 并行加速比 集群式高性能计算机
下载PDF
并行ATPG算法理论与原型系统设计技术研究
19
作者 刘蓬侠 《计算机工程与科学》 CSCD 2003年第5期109-109,共1页
目前,制约并行ATPG算法实用化的原因是算法的可移植性。因此,我们首选提出了基于消息传递系统-并行虚拟机的并行ATPG原型系统框架,并根据它构建了一个实验系统HappyTest。由于PVM良好的可移植性。
关键词 并行ATPG算法 消息传递系统 原型系统 设计 并行算法 FS算法
下载PDF
一种基于MPI的并行体绘制算法 被引量:5
20
作者 梁峰 鲁强 曾绍群 《计算机工程》 CAS CSCD 北大核心 2005年第13期171-173,共3页
介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国... 介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国人女性一号(VCH-F1)的头部和脚部数据集的重建,表明该算法在任务规模和节点规模上具有较好的可扩展性。 展开更多
关键词 并行算法 消息传递接口 体绘制 虚拟中国人
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部