期刊文献+
共找到170篇文章
< 1 2 9 >
每页显示 20 50 100
基于CGA的MPI程序分支覆盖测试套件生成
1
作者 袁剑锋 刘佳 郭建卫 《计算机技术与发展》 2024年第7期78-86,共9页
针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutiona... 针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutionary Genetic Algorithm,CGA)的测试套件生成方法(简称为:CGA生成法),该方法具有不受不可行分支影响的优势。首先,基于收集覆盖信息的探针,定义最小归一化分支距离,并以此设计出相应的适应度值函数;然后,使用CGA生成进化个体,并基于设计的适应度值函数,计算这些个体的适应值;最后,基于计算的适应值,选择子种群中代表个体,以构成合作种群。所提CGA生成法应用于7个基准MPI程序,并与其他多种方法进行比较。实验结果表明,CGA生成法的覆盖率通常高于其他搜索算法。 展开更多
关键词 消息传递接口程序 协同进化遗传算法 分支覆盖测试 测试套件生成 适应度值函数
下载PDF
An MPI parallel DEM-IMB-LBM framework for simulating fluid-solid interaction problems 被引量:2
2
作者 Ming Xia Liuhong Deng +3 位作者 Fengqiang Gong Tongming Qu Y.T.Feng Jin Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第6期2219-2231,共13页
The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive comp... The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive computational costs.To overcome this limitation,a message passing interface(MPI)parallel DEM-IMB-LBM framework is proposed aimed at enhancing computation efficiency.This framework utilises a static domain decomposition scheme,with the entire computation domain being decomposed into multiple subdomains according to predefined processors.A detailed parallel strategy is employed for both contact detection and hydrodynamic force calculation.In particular,a particle ID re-numbering scheme is proposed to handle particle transitions across sub-domain interfaces.Two benchmarks are conducted to validate the accuracy and overall performance of the proposed framework.Subsequently,the framework is applied to simulate scenarios involving multi-particle sedimentation and submarine landslides.The numerical examples effectively demonstrate the robustness and applicability of the MPI parallel DEM-IMB-LBM framework. 展开更多
关键词 Discrete element method(DEM) Lattice Boltzmann method(LBM) Immersed moving boundary(IMB) Multi-cores parallelization Message passing interface(mpi) CPU Submarine landslides
下载PDF
基于MPI的鲲鹏CPU核间通信研究
3
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
高分三号数据分布式负载均衡并行转换算法
4
作者 邱祥峰 《厦门理工学院学报》 2024年第5期33-39,共7页
针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,... 针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,中间层采用MapReduce按景并行处理,内层采用OpenMP按极化方式并行计算,并采用“Z”字形数据负载均衡策略,将高分三号不同成像模式下的多极化数据快速精确定标及格式转换,以抗数据偏斜。实际数据的测试结果表明,该算法的整体性能提升了约50%,验证了算法的可行性、高效性和正确性。 展开更多
关键词 高分三号卫星 合成孔径雷达 分布式负载均衡 并行转换算法 共享存储并行编程 映射归约编程模型 消息传递接口
下载PDF
MPI程序同步通信基本模型死锁检测 被引量:6
5
作者 廖名学 范植华 《电子学报》 EI CAS CSCD 北大核心 2008年第2期402-407,共6页
本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,... 本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,它们对两种简化模型可以在程序编译前确定是否死锁,对另外一种模型,在编译前可静态确定部分死锁,运行中可确定其他死锁.我们的理论可以证明MPI程序死锁检测主流算法的正确性,其方法可以减少它们对客户源代码或MPI profiling接口的修改量,从而大大降低死锁检测开销,并可在运行前判定死锁. 展开更多
关键词 mpi(Message PASSING interface) 死锁 同步通信
下载PDF
基于MPI的云计算模型 被引量:38
6
作者 郭本俊 王鹏 +1 位作者 陈高云 黄健 《计算机工程》 CAS CSCD 北大核心 2009年第24期84-86,共3页
根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为... 根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为算法分布化及并行化提供新思路。 展开更多
关键词 云计算 消息传递接口 机群系统 Hadoop架构
下载PDF
PC机群上JIAJIA与MPI的比较 被引量:5
7
作者 胡明昌 史岗 +2 位作者 胡伟武 唐志敏 张福新 《软件学报》 EI CSCD 北大核心 2003年第7期1187-1194,共8页
对JIAJIA 和MPI (message passing interface)是进行了比较.JIAJIA 和MPI 分别代表共享存储和消息传递的编程模式.MPI 显式进行数据传输,编程复杂;JIAJIA 由底层维护数据一致性,并附加提供简单的消息传递函数,编程容易、灵活.JIAJIA 分... 对JIAJIA 和MPI (message passing interface)是进行了比较.JIAJIA 和MPI 分别代表共享存储和消息传递的编程模式.MPI 显式进行数据传输,编程复杂;JIAJIA 由底层维护数据一致性,并附加提供简单的消息传递函数,编程容易、灵活.JIAJIA 分配共享内存时开销较大,初始化时间比MPI 长.提出了一个关于并行加速比与进程数目之间关系的近似经验公式,推出JIAJIA 和MPI 性能差距随着进程数目的增多而增大的结论.测试结果表明,大部分应用程序的JIAJIA 和MPI 版本的并行性能差距不超过10%.对于通信量很小的应用程序,其JIAJIA 和MPI 的性能差距较小,而通信量本身较大的应用程序,其JIAJIA 和MPI 的性能差距主要取决于运行时产生的实际通信量. 展开更多
关键词 JIAJIA mpi(message PASSING interface) 共享虚拟存储 消息传递 加速比 并行性能 通信量 PC机群
下载PDF
基于MPI+OpenMP混合编程模型的城市路网最短路径并行算法 被引量:11
8
作者 杨庆芳 刘冬 杨兆升 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1581-1584,共4页
针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效... 针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效改善系统性能,提高系统计算速度。经由长春市路网验证可知,混合模型比MPI模型具有更好的加速比和运算效率,并且随着计算节点个数的增加,加速比提高幅度更大,表明MPI+OpenMP混合模型有着更好的可扩展性。 展开更多
关键词 交通运输系统工程 消息传递接口 mpi+OpenMP混合模型 最短路径 FLOYD算法
下载PDF
基于MPI的大规模栅格影像并行瓦片化算法 被引量:7
9
作者 刘世永 陈荦 +2 位作者 熊伟 吴烨 李军 《计算机工程与应用》 CSCD 北大核心 2018年第1期48-53,111,共7页
当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化... 当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化方面的不足,提出一种名为ParaTile的高效栅格影像快速瓦片化方法,ParaTile基于MPI共享外存的并行技术,利用多进程对原始栅格影像进行数据划分,每个进程对其所划分的区域进行独立读写和计算,而后再按照TMS或者Google Tile定义的标准将瓦片进行编码输出。实验采用不同级别大小的遥感影像进行测试,结果表明ParaTile在面对不同规模的数据时,无论从速度还是算法稳定性上都较现有算法和工具具有显著优势,特别是当数据量越大时,这种优势愈加明显。 展开更多
关键词 栅格影像 并行瓦片化 消息传递接口(mpi)
下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
10
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
下载PDF
MPI_ALLGATHER实现算法的改进与性能分析 被引量:2
11
作者 李占胜 毕会娟 +1 位作者 都志辉 焦青 《计算机工程与应用》 CSCD 北大核心 2007年第27期66-71,共6页
首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好... 首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好的通信局部性。通过在高性能机群系统中的测试,发现新算法在多种情况下比邻居交换算法具有更优的性能,在中等长度消息通信时具有最优的性能,在长消息通信时性能比递归倍增算法和Bruck算法的性能更优,且在长消息通信时多数情况下性能最优。 展开更多
关键词 并行编程 mpi 组通信 mpi_ALLGATHER算法
下载PDF
PROFIBUS-DP和MPI在造纸生产通信网络中的应用 被引量:3
12
作者 葛锁良 卫胤强 方唐利 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第7期1024-1026,1039,共4页
针对某造纸厂生产线改造项目,文章介绍一种基于MPI和PROFIBUS-DP通信网络控制系统,该通信网络控制系统包括监控级和现场级,监控级采用MPI通信总线,现场级采用PROFIBUS-DP通信总线,系统可靠性高、开放性好。文中介绍了通信网络的整体结构... 针对某造纸厂生产线改造项目,文章介绍一种基于MPI和PROFIBUS-DP通信网络控制系统,该通信网络控制系统包括监控级和现场级,监控级采用MPI通信总线,现场级采用PROFIBUS-DP通信总线,系统可靠性高、开放性好。文中介绍了通信网络的整体结构,详细阐述了上位机中WinCC监控系统的实现方式和现场级网络中DP主站和DP从站的通信过程及网络设置,并给出相关的软件实现。经过现场安装和调试,整个系统运行稳定。 展开更多
关键词 PROFIBUS-DP 多点接口 WINCC 通信网络
下载PDF
异构环境下MPI通信技术研究 被引量:3
13
作者 蒋艳凰 赵强利 卢宇彤 《小型微型计算机系统》 CSCD 北大核心 2009年第9期1724-1729,共6页
异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进... 异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进行了详细阐述,分析它们对MPI通信的影响;然后基于Open MPI系统,对这两类异构问题的具体实现进行介绍,测试并分析它们对通信性能的影响;最后展望了这一研究方向的技术难点与发展趋势. 展开更多
关键词 高性能计算 mpi 集群 网络异构 处理器异构
下载PDF
基于MPI的并行蚁群算法的研究与实现 被引量:4
14
作者 刘东 常静 +1 位作者 魏文红 赵洁 《广东工业大学学报》 CAS 2008年第1期38-42,共5页
在消息传递接口(message passing interface,MPI)的基础上,采用划分蚁群的策略,实现了基于MPI的并行蚁群算法,并对该算法采用旅行商问题进行了实验.实验结果表明,使用并行计算技术,可以很好地提高运行速度.
关键词 蚁群算法 消息传递接口 旅行商问题
下载PDF
基于MPI的并行PSO混合K均值聚类算法 被引量:13
15
作者 吕奕清 林锦贤 《计算机应用》 CSCD 北大核心 2011年第2期428-431,437,共5页
传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算... 传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。 展开更多
关键词 消息传递接口集群 粒子群优化算法 K均值算法 并行聚类
下载PDF
基于曙光-2000的MPI循环并行方法 被引量:1
16
作者 韩丛英 贺国平 张广梅 《计算机工程》 CAS CSCD 北大核心 2003年第3期47-49,共3页
曙光-2000并行机系统是分布式存储系统,在此类系统上直接写并行程序是很困 难的。该文通过详细分析书写MPI程序的各种模式,结合曙光-2000并行机,给出一种将串行 程序改写成MPI并行程序的方法:分析串行程序的循环体,考虑数据依赖关... 曙光-2000并行机系统是分布式存储系统,在此类系统上直接写并行程序是很困 难的。该文通过详细分析书写MPI程序的各种模式,结合曙光-2000并行机,给出一种将串行 程序改写成MPI并行程序的方法:分析串行程序的循环体,考虑数据依赖关系,加以适当的 M PI函数,使之并行化。 展开更多
关键词 曙光—2000 消息传送接口 数据依赖 mpi 循环并行方法 分布式存储系统 并行计算机
下载PDF
基于MPI的三维CT并行重建实现 被引量:1
17
作者 孙翠丽 路宏年 +1 位作者 杨民 赵飞 《计算机工程与应用》 CSCD 北大核心 2006年第4期213-214,221,共3页
分析了三维CT近似重建FDK快速算法理论基础,采用基于MPI并行环境地并行实现方案实现三维CT的并行重建,得到比较理想的重建时间结果和比较理想的加速比与效率。
关键词 三维CT 并行处理 消息传递接口
下载PDF
基于CELL宽带引擎架构的MPI研究与实现 被引量:1
18
作者 徐祯 孙济洲 +2 位作者 于策 亓大志 张旭明 《计算机应用研究》 CSCD 北大核心 2010年第7期2526-2529,共4页
研究了在CBEA上移植MPI消息传递编程模型和标准接口的可行性,并利用IBM CELL SDK 3.0实现了一组常用的MPI编程接口。实验结果表明,该组MPI接口可满足CBEA上应用开发的数据传输性能要求,并且其性能已接近现有DMA数据传输模式。该组MPI接... 研究了在CBEA上移植MPI消息传递编程模型和标准接口的可行性,并利用IBM CELL SDK 3.0实现了一组常用的MPI编程接口。实验结果表明,该组MPI接口可满足CBEA上应用开发的数据传输性能要求,并且其性能已接近现有DMA数据传输模式。该组MPI接口为CELL应用开发人员提供了一种通用编程接口解决方案。 展开更多
关键词 CELL宽带引擎架构 异构多核处理器 mpi接口 数据传输 高性能计算
下载PDF
基于MPI的伪谱法DNS并行计算方法研究 被引量:3
19
作者 肖红林 王连生 《计算机工程与应用》 CSCD 2012年第4期54-55,60,共3页
使用伪谱方法的直接数值模拟准确、高效,但在高雷诺数情况下,计算量非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法直接数值模拟的并行计算方法。通过... 使用伪谱方法的直接数值模拟准确、高效,但在高雷诺数情况下,计算量非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法直接数值模拟的并行计算方法。通过实例验证,该方法准确、易行、稳健,并且可以大幅提高计算速度,节省计算时间,这对直接模拟在科学研究和工程实际中的广泛应用都具有重要意义。 展开更多
关键词 直接数值模拟 谱方法 傅里叶展开 消息传递接口(mpi) 并行计算
下载PDF
基于MPI+CUDA异步模型的并行矩阵乘法 被引量:2
20
作者 刘青昆 马名威 阎慰椿 《计算机应用》 CSCD 北大核心 2011年第12期3327-3330,共4页
矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能。现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间。针对上述问题,提出一种基于MPI+CUDA异步模型... 矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能。现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间。针对上述问题,提出一种基于MPI+CUDA异步模型的并行矩阵乘法。该模型避免了主机端进入等待状态,并采用CUDA流技术解决数据量超过GPU内存问题。通过分析异步模型的加速比和效率,实验结果表明,此方法显著提高了并行效率和大型矩阵乘法的运算速度,充分发挥了节点间分布式存储和节点内共享内存的优势,是一种有效可行的并行策略。 展开更多
关键词 矩阵乘法 并行计算 混合编程 消息传递接口 统一计算设备架构
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部