期刊文献+
共找到1,796篇文章
< 1 2 90 >
每页显示 20 50 100
基于MPI和OpenMP混合编程的高分三号数据分布式并行转换算法
1
作者 陈云 《测绘与空间地理信息》 2024年第2期43-45,49,共4页
高分三号是我国C波段多极化合成孔径雷达卫星。PolSARpro是欧空局支持下的一款极化SAR影像处理的开源软件,为了便于利用该软件处理高分三号数据,本文提出了一种基于MPI和OpenMP并以PolSARpro软件的数据格式要求进行分布式并行转换算法,... 高分三号是我国C波段多极化合成孔径雷达卫星。PolSARpro是欧空局支持下的一款极化SAR影像处理的开源软件,为了便于利用该软件处理高分三号数据,本文提出了一种基于MPI和OpenMP并以PolSARpro软件的数据格式要求进行分布式并行转换算法,实现将高分三号极化数据快速精确转化为复数散射矩阵S2数据格式,通过KingMap V8.0平台实现了算法并在实际数据中进行测试,验证了算法的可行性、正确性和高效性。 展开更多
关键词 高分三号 合成孔径雷达 复数散射矩阵 OPENMP mpi KingMap
下载PDF
利用MPI实现点云SAC-IA并行配准
2
作者 崔家武 曾波 +2 位作者 李海军 甄兆聪 梁建青 《工程勘察》 2024年第4期61-67,共7页
采样一致性初始配准算法(SAC-IA)是点云的一种粗配准算法。针对大规模点云SAC-IA配准效率低、实时性差等问题,本文提出利用消息传递接口MPI实现点云SAC-IA多进程并行配准,主要包括法向量并行估计、SPFH特征及FPFH特征并行计算和SAC-IA... 采样一致性初始配准算法(SAC-IA)是点云的一种粗配准算法。针对大规模点云SAC-IA配准效率低、实时性差等问题,本文提出利用消息传递接口MPI实现点云SAC-IA多进程并行配准,主要包括法向量并行估计、SPFH特征及FPFH特征并行计算和SAC-IA并行配准。实验结果表明,MPI多进程并行算法可显著提高点云SAC-IA配准速度。 展开更多
关键词 SAC-IA mpi 法向量 SPFH特征 FPFH特征
下载PDF
基于MPI的鲲鹏CPU核间通信研究
3
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
MPI+CUDA联合加速重力场反演的并行算法
4
作者 赵锴坤 朱炬波 +1 位作者 谷德峰 韦春博 《大地测量与地球动力学》 CSCD 北大核心 2024年第4期423-428,共6页
针对重力场解算过程中数据量巨大的问题,联合MPI(massage passing interface)与CUDA(compute unified device architecture)提出基于最小二乘法的重力场解算过程的并行加速算法。使用MPI完成复杂过程的任务分配,实现全局层面的并行加速... 针对重力场解算过程中数据量巨大的问题,联合MPI(massage passing interface)与CUDA(compute unified device architecture)提出基于最小二乘法的重力场解算过程的并行加速算法。使用MPI完成复杂过程的任务分配,实现全局层面的并行加速;基于CUDA编写大规模矩阵相乘的并行加速程序,并针对不同类型的矩阵进行适配,同时联合MPI将法矩阵的计算过程进一步细分,实现对分进程内存峰值的压缩。在单机上完成30阶与120阶重力场仿真解算任务,结果表明,反演30阶重力场时加速比可达180;反演120阶重力场时,并行计算单次迭代仅耗时2 h,而串行模式下无法计算。 展开更多
关键词 重力场 并行计算 CUDA mpi
下载PDF
MPI/OpenMP-Based Parallel Solver for Imprint Forming Simulation
5
作者 Yang Li Jiangping Xu +2 位作者 Yun Liu Wen Zhong Fei Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期461-483,共23页
In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining pr... In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining process to address the challenge of capturing fine relief features of approximately 50 microns.Achieving such precision demands the utilization of at least 7 million tetrahedron elements,surpassing the capabilities of traditional serial programs previously developed.To mitigate data races when calculating internal forces,intermediate arrays are introduced within the OpenMP directive.This helps ensure proper synchronization and avoid conflicts during parallel execution.Additionally,in the MPI implementation,the coins are partitioned into the desired number of regions.This division allows for efficient distribution of computational tasks across multiple processes.Numerical simulation examples are conducted to compare the three solvers with serial programs,evaluating correctness,acceleration ratio,and parallel efficiency.The results reveal a relative error of approximately 0.3%in forming force among the parallel and serial solvers,while the predicted insufficient material zones align with experimental observations.Additionally,speedup ratio and parallel efficiency are assessed for the coining process simulation.The pureMPI parallel solver achieves a maximum acceleration of 9.5 on a single computer(utilizing 12 cores)and the hybrid solver exhibits a speedup ratio of 136 in a cluster(using 6 compute nodes and 12 cores per compute node),showing the strong scalability of the hybrid MPI/OpenMP programming model.This approach effectively meets the simulation requirements for commemorative coins with intricate relief patterns. 展开更多
关键词 Hybrid mpi/OpenMP parallel computing mpi OPENMP imprint forming
下载PDF
一种基于HDFS的分布式文件系统MPIFS
6
作者 陈卓航 陈雅琴 郭志勇 《黑龙江工程学院学报》 CAS 2024年第1期9-14,共6页
传统的MPI(Message Passing Interface)计算特点是数据向计算迁移,对于数据量庞大的计算任务具有先天的不足。文中提出一种支持MPI的分布式文件系统MPIFS的架构及实现。该文件系统基于HDFS(Hadoop Distributed File System),使得MPI在MP... 传统的MPI(Message Passing Interface)计算特点是数据向计算迁移,对于数据量庞大的计算任务具有先天的不足。文中提出一种支持MPI的分布式文件系统MPIFS的架构及实现。该文件系统基于HDFS(Hadoop Distributed File System),使得MPI在MPIFS上能同时支持计算密集型和数据密集型计算,设置两个类型的批处理词频统计实验,所需数据都分布式存储在MPIFS分布式文件系统中,通过调用系统提供的统一数据接口实现数据访问。1个计算节点在本地计算大小为m的文件,n个计算节点分布式并行计算大小为n×m的文件,两者计算时间相同,MPIFS中文件总量不变,计算节点数量减少,计算时间t变长,可得出MPIFS文件系统架构可行,能够支持MPI实现计算向数据迁移的并行计算。 展开更多
关键词 mpi 分布式文件系统 分布式并行计算 计算迁移
下载PDF
An MPI parallel DEM-IMB-LBM framework for simulating fluid-solid interaction problems
7
作者 Ming Xia Liuhong Deng +3 位作者 Fengqiang Gong Tongming Qu Y.T.Feng Jin Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第6期2219-2231,共13页
The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive comp... The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive computational costs.To overcome this limitation,a message passing interface(MPI)parallel DEM-IMB-LBM framework is proposed aimed at enhancing computation efficiency.This framework utilises a static domain decomposition scheme,with the entire computation domain being decomposed into multiple subdomains according to predefined processors.A detailed parallel strategy is employed for both contact detection and hydrodynamic force calculation.In particular,a particle ID re-numbering scheme is proposed to handle particle transitions across sub-domain interfaces.Two benchmarks are conducted to validate the accuracy and overall performance of the proposed framework.Subsequently,the framework is applied to simulate scenarios involving multi-particle sedimentation and submarine landslides.The numerical examples effectively demonstrate the robustness and applicability of the MPI parallel DEM-IMB-LBM framework. 展开更多
关键词 Discrete element method(DEM) Lattice Boltzmann method(LBM) Immersed moving boundary(IMB) Multi-cores parallelization Message passing interface(mpi) CPU Submarine landslides
下载PDF
计及需求响应的MPIES多时空尺度鲁棒随机优化调度
8
作者 黄海涛 田胜轩 +1 位作者 余文昶 曹俊波 《电力系统及其自动化学报》 CSCD 北大核心 2024年第4期38-49,58,共13页
针对多园区综合能源系统多时间尺度优化调度问题,结合各时间尺度源、荷不确定性特征与响应特性、园区数目对计算规模的影响,提出一种计及需求响应的多园区综合能源系统多时空尺度鲁棒随机优化调度架构。日前调度建立计及可中断负荷的多... 针对多园区综合能源系统多时间尺度优化调度问题,结合各时间尺度源、荷不确定性特征与响应特性、园区数目对计算规模的影响,提出一种计及需求响应的多园区综合能源系统多时空尺度鲁棒随机优化调度架构。日前调度建立计及可中断负荷的多园区多能流系统鲁棒优化调度模型,确定系统最恶劣运行场景下基本调度策略;日内调度建立计及可中断负荷和替代型需求响应的单园区多能流系统随机优化调度模型,细化并调整调度策略;实时调度建立计及直接负荷控制的单园区电气系统随机优化调度模型,削弱调度策略受源、荷出力波动的影响。最后,通过算例验证了该架构能有效提高系统运行的经济性和稳定性。 展开更多
关键词 多园区综合能源系统 多时空尺度 不确定性 需求响应
下载PDF
基于Pthreads的车辆图像兴趣区域提取并行算法研究
9
作者 周艺华 王文东 +2 位作者 陈宏彩 王婷 张常有 《计算机科学》 CSCD 北大核心 2017年第3期36-37,69,共3页
为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,... 为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,在基本并行算法的基础上,精心设计预处理过程的分解方案,设置多队列缓冲区,减少共用缓冲区的线程数量和每个缓冲区互斥锁锁定的次数。实验证明,所提算法在双CPU 12核(支持超线程到24线程)的服务器上运行,相对于串行算法,实现了13.1x的加速比。 展开更多
关键词 车型识别 兴趣区域 并行化 pthreads 多核
下载PDF
基于Pthreads的并行DSRC压缩算法设计与实现
10
作者 詹科 张云泉 +2 位作者 王婷 郑晶晶 张鹏 《计算机科学》 CSCD 北大核心 2015年第1期90-91,100,共3页
高通量测序仪产生大量的DNA数据,FASTQ是被广泛使用的存储DNA数据的数据格式。对FASTQ格式的数据进行压缩处理,能有效地节省存储空间。DSRC算法具有压缩比高的优点,因此对DSRC算法进行并行能提高压缩FASTQ格式的DNA数据的效率。基于Pthr... 高通量测序仪产生大量的DNA数据,FASTQ是被广泛使用的存储DNA数据的数据格式。对FASTQ格式的数据进行压缩处理,能有效地节省存储空间。DSRC算法具有压缩比高的优点,因此对DSRC算法进行并行能提高压缩FASTQ格式的DNA数据的效率。基于Pthreads,实现了并行DSRC算法。测试结果表明,当使用4线程时加速比达到3.5。 展开更多
关键词 FASTQ 数据压缩 DSRC pthreads
下载PDF
基于3D卷积神经网络的MPI新视点合成算法
11
作者 霍智勇 魏俊宇 +1 位作者 郭权 陈奕杭 《南京邮电大学学报(自然科学版)》 北大核心 2023年第5期77-82,共6页
多平面图像(Multiplane Image, MPI)能够构造出一种以相机为中心、按深度分层的三维场景显式表示,用于新视点合成研究与应用。由于MPI生成预测网络在训练时不能有效捕获深度平面间遮挡区域的空间特征,使得MPI合成的新视点图像往往存在... 多平面图像(Multiplane Image, MPI)能够构造出一种以相机为中心、按深度分层的三维场景显式表示,用于新视点合成研究与应用。由于MPI生成预测网络在训练时不能有效捕获深度平面间遮挡区域的空间特征,使得MPI合成的新视点图像往往存在明显的伪影和扭曲。为此提出利用3D卷积神经网络捕捉深度平面间的空间特征,用于提高对平面图像几何结构和Alpha值的预测能力,从而实现高质量MPI场景表示和新视点合成目标。在两个数据集上的数值实验表明,算法在窄基线视点外推和宽基线多视点内插任务中能够有效消除合成新视点图像中的伪影和扭曲。当参考视点水平基线宽度增大一倍且不增加MPI深度平面数量时,算法仍然能够有效地预测出不同深度平面的遮挡区域信息,从而保证了视点内插合成图像的质量。 展开更多
关键词 多平面图像 场景表示 视点图像合成 3D卷积神经网络
下载PDF
基于GASFLOW-MPI 1.0程序的安全壳内氢气燃烧现象研究 被引量:1
12
作者 李精精 孙晓晖 +2 位作者 蔡盟利 林盛盛 王辉 《核科学与工程》 CAS CSCD 北大核心 2023年第2期421-427,共7页
为更好地对氢气燃烧风险进行分析,采用GASFLOW-MPI 1.0程序对大型压水堆核电站建立分析模型开展氢气分布和燃烧计算研究。在分析过程中考虑了氢气缓解措施和氢气分布情况对燃烧及爆炸的影响。氢气缓解措施有效时,同时由于局部隔间受到... 为更好地对氢气燃烧风险进行分析,采用GASFLOW-MPI 1.0程序对大型压水堆核电站建立分析模型开展氢气分布和燃烧计算研究。在分析过程中考虑了氢气缓解措施和氢气分布情况对燃烧及爆炸的影响。氢气缓解措施有效时,同时由于局部隔间受到水蒸气惰化作用影响,局部隔间点火后并未造成火焰向其他隔间和安全壳大空间范围内发生传播现象;当氢气缓解措施失效时,较高的氢气浓度使安全壳内火焰得以传播,燃烧的最大温度约2000 K,最大压力约1 MPa;氢气浓度分布形式会对火焰传播和燃烧后果产生较大影响,氢气总量一定时,考虑氢气梯度分布会造成安全壳穹顶位置具有较高的氢气浓度,在点火初期极大地加速了火焰燃烧产生的能量和火焰传播速度,因此会造成更为严重的氢气风险。 展开更多
关键词 GASFLOW-mpi 压水堆 氢气风险 缓解措施 燃烧
下载PDF
磁纳米粒子三维融合成像设备(MPI)国际领跑
13
《中国医学计算机成像杂志》 CSCD 北大核心 2023年第3期311-311,共1页
“基于磁纳米粒子非线性响应的活体动物三维融合成像设备”(简称MPI)的研制是在国家自然科学基金委重大科研仪器设备研制专项的支持下开展研究,也是DPM公司未来核心产品之一。该设备的主要优势在于成像灵敏度比现有的磁共振高1000倍、... “基于磁纳米粒子非线性响应的活体动物三维融合成像设备”(简称MPI)的研制是在国家自然科学基金委重大科研仪器设备研制专项的支持下开展研究,也是DPM公司未来核心产品之一。该设备的主要优势在于成像灵敏度比现有的磁共振高1000倍、时间分辨率高2000倍,突破了光学成像的深度限制,可实现实时动态的三维成像,并在体检筛查领域实现无创的活体早期精准诊断。目前,DPM参与编制的《磁粒子成像系统影像质量评价规范》通过了国家一级学会中国图学学会组织的团体标准评审并获得立项,奠定了MPI技术标准及规范的基础。 展开更多
关键词 mpi 三维融合 国家一级学会 成像设备 光学成像 磁纳米粒子 团体标准 灵敏度比
下载PDF
基于MPI转以太网通讯的圆形堆取料机无线控制改造
14
作者 黄武印 陈云 《水泥》 CAS 2023年第6期76-78,共3页
本文介绍某水泥生产线Φ80 m石灰石圆形堆取料机基于MPI转以太网通讯的无线控制改造应用实践并阐述了方案的实现过程。投运五年来,系统通讯稳定可靠,降低了生产成本和维护难度,节省了大量的人力物力。
关键词 mpi转以太网 圆形堆取料机 无线局域网
下载PDF
第六届大都市规划国际咨询会(MPIC)隆重召开
15
《上海土地》 2023年第6期48-48,共1页
12月3至12月4日,由自然资源部和上海市人民政府指导,上海市规划和自然资源局、同济大学、中国国土勘测规划院共同主办,以“超大城市发展:挑战与未来”为主题的第六届大都市规划国际咨询会(MPIC)在北外滩世界会客厅隆重召开。
关键词 上海市人民政府 超大城市 自然资源部 北外滩 mpi 大都市 同济大学 第六届
下载PDF
基于线程的MPI通信加速器技术研究 被引量:11
16
作者 刘志强 宋君强 +1 位作者 卢风顺 赵娟 《计算机学报》 EI CSCD 北大核心 2011年第1期154-164,共11页
为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI... 为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI进程都被映射成同一进程中的多个线程,从而节点内的通信可通过轻量级的线程通信机制实现.作者给出了MPIActor的基本设计,详细阐述了其工作机制、通信体系结构及关键技术,并在真实系统上分别针对MVAPICH2和OpenMPI并行环境利用OSU LATENCY基准测试进行了性能评测.实验结果表明在两种MPI环境上进行节点内8 KB^4 MB数据通信时MPIActor都能使通信性能平均提高一倍左右. 展开更多
关键词 mpi软件结构 线程mpi mpi加速器 mpiActor
下载PDF
基于MPI的二维大地电磁正演的并行计算 被引量:12
17
作者 李焱 胡祥云 +2 位作者 吴桂桔 叶益信 廖国忠 《地震地质》 EI CSCD 北大核心 2010年第3期392-401,共10页
大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的... 大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的优点,采用主从并行模式、分频并行计算的并行方案来执行。为了检验编写的并行程序,对设计的2个模型进行试算,并与串行程序对比验证了该算法的可行性、正确性,为二维反演、三维正反演的并行计算提供了研究基础。 展开更多
关键词 大地电磁 mpi 二维 有限元 正演
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
18
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP mpi+OPENMP HL-2A高性能计算系统
下载PDF
基于MPI的主从式并行遗传算法框架 被引量:26
19
作者 刘晓平 安竹林 郑利平 《系统仿真学报》 CAS CSCD 2004年第9期1938-1940,1956,共4页
遗传算法是一种求解复杂系统优化问题的有效工具.其本身具有的固有并行性,在并行系统构架下有着非常广阔的应用前景。本文对D.L.Carroll的“遗传算法驱动”进行了改进,加入对当前通用消息传递接口MPI的支持,形成了一个可重用的主从式并... 遗传算法是一种求解复杂系统优化问题的有效工具.其本身具有的固有并行性,在并行系统构架下有着非常广阔的应用前景。本文对D.L.Carroll的“遗传算法驱动”进行了改进,加入对当前通用消息传递接口MPI的支持,形成了一个可重用的主从式并行遗传算法框架。并且,针对该框架使用通用遗传算法测试函数,在由两台双至强处理器的工作站组成的COW集群上进行了测试。该框架使不具有并行程序设计经验的用户,可以很方便的构造并行遗传算法程序。 展开更多
关键词 并行遗传算法 主从式 mpi 协同
下载PDF
基于MPI的遥感影像高效能并行处理方法研究 被引量:16
20
作者 沈占锋 骆剑承 +1 位作者 陈秋晓 盛昊 《中国图象图形学报》 CSCD 北大核心 2007年第12期2132-2136,共5页
采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一... 采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一种新的数据流分配方法。处理结果表明,这两种方法均能够在一定环境下取得比常规方法更高的效率。 展开更多
关键词 mpi 并行计算 信息提取 尺度 数据划分
下载PDF
上一页 1 2 90 下一页 到第
使用帮助 返回顶部