期刊文献+
共找到255篇文章
< 1 2 13 >
每页显示 20 50 100
基于CGA的MPI程序分支覆盖测试套件生成
1
作者 袁剑锋 刘佳 郭建卫 《计算机技术与发展》 2024年第7期78-86,共9页
针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutiona... 针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutionary Genetic Algorithm,CGA)的测试套件生成方法(简称为:CGA生成法),该方法具有不受不可行分支影响的优势。首先,基于收集覆盖信息的探针,定义最小归一化分支距离,并以此设计出相应的适应度值函数;然后,使用CGA生成进化个体,并基于设计的适应度值函数,计算这些个体的适应值;最后,基于计算的适应值,选择子种群中代表个体,以构成合作种群。所提CGA生成法应用于7个基准MPI程序,并与其他多种方法进行比较。实验结果表明,CGA生成法的覆盖率通常高于其他搜索算法。 展开更多
关键词 消息传递接口程序 协同进化遗传算法 分支覆盖测试 测试套件生成 适应度值函数
下载PDF
An MPI parallel DEM-IMB-LBM framework for simulating fluid-solid interaction problems 被引量:1
2
作者 Ming Xia Liuhong Deng +3 位作者 Fengqiang Gong Tongming Qu Y.T.Feng Jin Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第6期2219-2231,共13页
The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive comp... The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive computational costs.To overcome this limitation,a message passing interface(MPI)parallel DEM-IMB-LBM framework is proposed aimed at enhancing computation efficiency.This framework utilises a static domain decomposition scheme,with the entire computation domain being decomposed into multiple subdomains according to predefined processors.A detailed parallel strategy is employed for both contact detection and hydrodynamic force calculation.In particular,a particle ID re-numbering scheme is proposed to handle particle transitions across sub-domain interfaces.Two benchmarks are conducted to validate the accuracy and overall performance of the proposed framework.Subsequently,the framework is applied to simulate scenarios involving multi-particle sedimentation and submarine landslides.The numerical examples effectively demonstrate the robustness and applicability of the MPI parallel DEM-IMB-LBM framework. 展开更多
关键词 Discrete element method(DEM) Lattice Boltzmann method(LBM) Immersed moving boundary(IMB) multi-cores parallelization message passing interface(MPI) CPU Submarine landslides
下载PDF
基于MPI的鲲鹏CPU核间通信研究
3
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
Static Analysis Techniques for Fixing Software Defects in MPI-Based Parallel Programs
4
作者 Norah Abdullah Al-Johany Sanaa Abdullah Sharaf +1 位作者 Fathy Elbouraey Eassa Reem Abdulaziz Alnanih 《Computers, Materials & Continua》 SCIE EI 2024年第5期3139-3173,共35页
The Message Passing Interface (MPI) is a widely accepted standard for parallel computing on distributed memorysystems.However, MPI implementations can contain defects that impact the reliability and performance of par... The Message Passing Interface (MPI) is a widely accepted standard for parallel computing on distributed memorysystems.However, MPI implementations can contain defects that impact the reliability and performance of parallelapplications. Detecting and correcting these defects is crucial, yet there is a lack of published models specificallydesigned for correctingMPI defects. To address this, we propose a model for detecting and correcting MPI defects(DC_MPI), which aims to detect and correct defects in various types of MPI communication, including blockingpoint-to-point (BPTP), nonblocking point-to-point (NBPTP), and collective communication (CC). The defectsaddressed by the DC_MPI model include illegal MPI calls, deadlocks (DL), race conditions (RC), and messagemismatches (MM). To assess the effectiveness of the DC_MPI model, we performed experiments on a datasetconsisting of 40 MPI codes. The results indicate that the model achieved a detection rate of 37 out of 40 codes,resulting in an overall detection accuracy of 92.5%. Additionally, the execution duration of the DC_MPI modelranged from 0.81 to 1.36 s. These findings show that the DC_MPI model is useful in detecting and correctingdefects in MPI implementations, thereby enhancing the reliability and performance of parallel applications. TheDC_MPImodel fills an important research gap and provides a valuable tool for improving the quality ofMPI-basedparallel computing systems. 展开更多
关键词 High-performance computing parallel computing software engineering software defect message passing interface DEADLOCK
下载PDF
一种对基于云上的并行应用的性能分析模型
5
作者 陈亮 陈文智 +2 位作者 张紫徽 曹学锋 杨德华 《计算机应用与软件》 北大核心 2024年第6期45-54,84,共11页
由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息... 由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息传递接口的应用程序在云上的执行时间提供了一个预测器。该预测器基于性能分析模型,将云资源视为排队网络,将并行应用程序视为争夺共享资源的任务。实验表明,所提方法的总体准确率为89%。 展开更多
关键词 高性能计算 云计算 性能分析 消息传递接口
下载PDF
基于分布式数据集的并行计算框架内存优化方法 被引量:3
6
作者 夏立斌 刘晓宇 +1 位作者 姜晓巍 孙功星 《计算机工程》 CAS CSCD 北大核心 2023年第4期43-51,共9页
随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型... 随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型和计算框架难以兼顾易用性和计算性能,并且在数据格式定义、内存分配、内存使用效率等方面存在不足。提出一种基于分布式数据集的并行计算方法,分别从模型理论和系统开销两个角度对内存计算进行优化。在理论上,通过对计算过程进行建模分析,以解决Spark在科学计算环境下表达能力不足的问题,同时给出计算框架的开销模型,为后续性能优化提供支持。在系统上,提出一种框架级的内存优化方法,该方法主要包括对跨语言分布式内存数据集的重构、分布式共享内存的管理、消息传递过程的优化等模块。实验结果表明,基于该优化方法实现的并行计算框架可以显著提升数据集的内存分配效率,减少序列化/反序列化开销,缓解内存占用压力,应用测试的执行时间相比Spark减少了69%~92%。 展开更多
关键词 内存计算 并行计算 内存优化 Spark框架 消息传递接口
下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:2
7
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
下载PDF
基于“嵩山”超级计算机的UCX库分析与优化
8
作者 刘康 万伟 +2 位作者 刘波 李俊宏 李柱 《计算机工程》 CAS CSCD 北大核心 2023年第12期274-281,共8页
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能... UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。 展开更多
关键词 UCX框架 高性能计算 集合通信 InfiniBand协议 共享内存 消息传递接口 高速网络
下载PDF
三维声传播模型BELLHOP3D的信息传递接口并行优化
9
作者 周益清 骆文于 吴双林 《应用声学》 CSCD 北大核心 2023年第1期93-99,共7页
近些年,我国对海洋不断深入的探索对复杂环境中声场的快速预报提出了越来越高的需求。BELLHOP3D是一种基于射线法的三维声传播计算模型,在海洋声学中应用十分广泛。BELLHOP3D的计算效率比其他常用模型高,但是仍然有非常大的提升空间。... 近些年,我国对海洋不断深入的探索对复杂环境中声场的快速预报提出了越来越高的需求。BELLHOP3D是一种基于射线法的三维声传播计算模型,在海洋声学中应用十分广泛。BELLHOP3D的计算效率比其他常用模型高,但是仍然有非常大的提升空间。该文使用信息传递接口对BELLHOP3D进行粗粒度的并行优化,并行后的程序计算结果稳定可靠,并行效率高,更适合在实际应用中实现快速的声场预报。并行BELLHOP3D程序可以在https://github.com/nj-zyq/BELLHOP3D_MPI.git下载。 展开更多
关键词 海洋声学 水下声传播 射线法 BELLHOP3D 信息传递接口并行
下载PDF
基于MPI+OpenMP的雷达信号脉内分析并行加速方法
10
作者 姚群 童真 柴恒 《舰船电子对抗》 2023年第4期66-69,79,共5页
雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节... 雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节点内并行的特点,实现了雷达信号脉内分析的高性能脉冲级并行处理。在基于IntelXeon2640构建的多节点集群系统上的测试结果表明,该方法显著的提高了脉内分析的处理速度。 展开更多
关键词 信号处理 消息传递接口 OPENMP 脉内分析
下载PDF
并行最短路径搜索算法的设计与实现 被引量:21
11
作者 卢照 师军 《计算机工程与应用》 CSCD 北大核心 2010年第3期69-71,共3页
针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,... 针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,该算法搜索速度快且性能稳定,当结点数目相当庞大时,算法的优越性更加明显。 展开更多
关键词 最短路径 并行机环境 message passing interface(MPI) 并行搜索算法
下载PDF
滑翔增程火箭弹弹道优化算法研究 被引量:4
12
作者 田晓丽 陈国光 阚卫东 《应用基础与工程科学学报》 EI CSCD 2007年第1期137-141,共5页
在分析影响滑翔增程火箭弹射程的主要弹道因素的基础上,提出了一种滑翔增程火箭弹最优化弹道的求解算法,并给出滑翔增程火箭弹的弹道优化计算模型.针对计算模型求解规模较大的问题,给出了用分布式并行集群计算服务器求解的进程调度方法... 在分析影响滑翔增程火箭弹射程的主要弹道因素的基础上,提出了一种滑翔增程火箭弹最优化弹道的求解算法,并给出滑翔增程火箭弹的弹道优化计算模型.针对计算模型求解规模较大的问题,给出了用分布式并行集群计算服务器求解的进程调度方法,弹道优化算法的仿真计算结果表明:滑翔增程弹的增程率高于100%,滑翔增程火箭弹的弹道优化算法有较好的收敛性质,并行求解方法效率较高. 展开更多
关键词 火箭弹 滑翔增程 优化 message passing interface
下载PDF
PC机群上JIAJIA与MPI的比较 被引量:5
13
作者 胡明昌 史岗 +2 位作者 胡伟武 唐志敏 张福新 《软件学报》 EI CSCD 北大核心 2003年第7期1187-1194,共8页
对JIAJIA 和MPI (message passing interface)是进行了比较.JIAJIA 和MPI 分别代表共享存储和消息传递的编程模式.MPI 显式进行数据传输,编程复杂;JIAJIA 由底层维护数据一致性,并附加提供简单的消息传递函数,编程容易、灵活.JIAJIA 分... 对JIAJIA 和MPI (message passing interface)是进行了比较.JIAJIA 和MPI 分别代表共享存储和消息传递的编程模式.MPI 显式进行数据传输,编程复杂;JIAJIA 由底层维护数据一致性,并附加提供简单的消息传递函数,编程容易、灵活.JIAJIA 分配共享内存时开销较大,初始化时间比MPI 长.提出了一个关于并行加速比与进程数目之间关系的近似经验公式,推出JIAJIA 和MPI 性能差距随着进程数目的增多而增大的结论.测试结果表明,大部分应用程序的JIAJIA 和MPI 版本的并行性能差距不超过10%.对于通信量很小的应用程序,其JIAJIA 和MPI 的性能差距较小,而通信量本身较大的应用程序,其JIAJIA 和MPI 的性能差距主要取决于运行时产生的实际通信量. 展开更多
关键词 JIAJIA MPI(message passing interface) 共享虚拟存储 消息传递 加速比 并行性能 通信量 PC机群
下载PDF
MPI程序同步通信基本模型死锁检测 被引量:6
14
作者 廖名学 范植华 《电子学报》 EI CAS CSCD 北大核心 2008年第2期402-407,共6页
本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,... 本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,它们对两种简化模型可以在程序编译前确定是否死锁,对另外一种模型,在编译前可静态确定部分死锁,运行中可确定其他死锁.我们的理论可以证明MPI程序死锁检测主流算法的正确性,其方法可以减少它们对客户源代码或MPI profiling接口的修改量,从而大大降低死锁检测开销,并可在运行前判定死锁. 展开更多
关键词 MPI(message passing interface) 死锁 同步通信
下载PDF
基于MPI的云计算模型 被引量:38
15
作者 郭本俊 王鹏 +1 位作者 陈高云 黄健 《计算机工程》 CAS CSCD 北大核心 2009年第24期84-86,共3页
根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为... 根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为算法分布化及并行化提供新思路。 展开更多
关键词 云计算 消息传递接口 机群系统 Hadoop架构
下载PDF
集群计算在数字流域模型中的应用 被引量:19
16
作者 李铁键 刘家宏 +1 位作者 和杨 王光谦 《水科学进展》 EI CAS CSCD 北大核心 2006年第6期841-846,共6页
随着计算机技术的发展,以消息传递接口(MPI)标准为代表的高性价比集群计算技术使并行计算在大量传统的专业领域也得到了广泛应用。数字流域模型因需要对大范围流域进行分布式的水文、泥沙过程模拟而提出了较大规模的计算需求。同时,基... 随着计算机技术的发展,以消息传递接口(MPI)标准为代表的高性价比集群计算技术使并行计算在大量传统的专业领域也得到了广泛应用。数字流域模型因需要对大范围流域进行分布式的水文、泥沙过程模拟而提出了较大规模的计算需求。同时,基于分水岭的单元划分方式和专门的河网编码方法使数字流域模型的并行化计算具有先天优势。提出了一种典型的并行调度流程,用于完成产汇流计算的动态任务分配。在自主搭建的MPI计算集群上进行的应用实验表明,集群计算提高了数字流域模型的计算效率,能够作为模型的计算平台。最后指出了此应用计算平台的发展方向。 展开更多
关键词 数字流域模型 集群计算 消息传递接口
下载PDF
基于模式记忆并行蚁群算法的输电网规划 被引量:35
17
作者 翟海保 程浩忠 +2 位作者 吕干云 陈小良 马则良 《中国电机工程学报》 EI CSCD 北大核心 2005年第9期17-22,共6页
该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上... 该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上,设计了一种基于模式记忆的并行蚁群算法,该算法通过模式记忆实现了解空间分解,能够有效地识别、记忆和跳出局部最优解;通过局部细化搜索进一步加强了局部搜索能力;通过并行计算提高了计算速度。某实际77 节点的算例分析表明了该算法具有很高的计算效率和优秀的局部、全局收敛性,有效克服了现代启发式算法在求解输电网规划问题时存在的效率不高及未成熟收敛等现象。 展开更多
关键词 输电网规划 蚁群算法 记忆 模式 现代启发式算法 未成熟收敛 局部搜索能力 全局最优解 局部最优解 全局收敛性 规划求解 规划模型 空间分解 计算速度 并行计算 计算效率 规划问题 解空间 分析表
下载PDF
梯级水电站群长期优化调度云计算随机动态规划算法 被引量:16
18
作者 周东清 彭世玉 +1 位作者 程春田 王健 《中国电机工程学报》 EI CSCD 北大核心 2017年第12期3437-3448,共12页
为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式... 为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式计算平台能够充分利用资源,具有诸多优势。为了探索云平台下的分布式并行随机动态规划模型,该文基于消息传递接口(message passing interface,MPI)和Spark框架分别实现了传统集群计算和云计算分布式随机动态规划算法,后者将计算模型转换为数据处理模型进行计算,并通过三库优化调度实验对算法进行了比较。算法分析及实验结果表明,基于云计算的分布式并行随机动态规划算法则可以有效利用云平台的优势,同时拥有完善的容错以及负载均衡机制,具有广阔的应用前景。 展开更多
关键词 随机动态规划 并行计算 云计算 消息传递接口(MPI) spark框架
下载PDF
用三维并行时域有限差分算法研究光子晶体薄板W3波导传输特性 被引量:7
19
作者 朱志宏 叶卫民 +2 位作者 季家镕 袁晓东 曾淳 《光子学报》 EI CAS CSCD 北大核心 2006年第6期815-818,共4页
构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率... 构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率频谱和光场分布·结果表明:光子晶体薄板W3波导能够实现光的三维约束,其导带中存在着微小禁带(mini-gap)· 展开更多
关键词 光子晶体 时域有限差分 并行计算 消息传递接口 W3波导
下载PDF
改进的并行高斯全主元消去法 被引量:7
20
作者 孙济洲 樊莉亚 +2 位作者 孙敏 于策 张绍敏 《天津大学学报》 EI CAS CSCD 北大核心 2006年第9期1115-1119,共5页
为减少Gauss全主元消法的运行时间,用多进程与多线程混合的方式对其进行了并行化,同时对该算法进行了改进.采用MPI并行I/O技术提高读取数据文件的速度,降低对内存的需求;采用标志数组避免了选主元后换行带来的通信开销;使用线程模型... 为减少Gauss全主元消法的运行时间,用多进程与多线程混合的方式对其进行了并行化,同时对该算法进行了改进.采用MPI并行I/O技术提高读取数据文件的速度,降低对内存的需求;采用标志数组避免了选主元后换行带来的通信开销;使用线程模型确定最优线程数,提高运行消去的速度;通过预先发布机制降低回代求解步骤的时间复杂度.实际运行结果表明,随着方程组阶数增大,加速比也逐渐增大,对于5000元的方程组,8进程同时运行,加速比可达6.68,并行效率稳定在0.85左右.这表明该算法具有可扩展性和稳定的并行效率,适用于大规模并行计算. 展开更多
关键词 Gauss全主元消去法 MPI Pthreads 并行算法
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部