期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
基于OpenMP的堆芯中子学软件性能优化研究
1
作者 刘婷 安萍 +1 位作者 芦韡 秦志红 《中国核电》 2024年第2期190-196,共7页
CORCA-3D软件是中国核动力研究设计院自主研发的先进节块法堆芯三维少群中子学计算软件,提升CORCA-3D软件运行速度可以提高反应堆系统分析的效率。目前CORCA-3D软件采用单线程的方式运行,并没有充分利用计算机的多核硬件资源,对CORCA-3... CORCA-3D软件是中国核动力研究设计院自主研发的先进节块法堆芯三维少群中子学计算软件,提升CORCA-3D软件运行速度可以提高反应堆系统分析的效率。目前CORCA-3D软件采用单线程的方式运行,并没有充分利用计算机的多核硬件资源,对CORCA-3D软件进行性能分析,发现其存在运行时间较长的热点函数,CPU利用率较低,因此可引入并行编程技术来加速CORCA-3D软件的计算。文中将OpenMP编程技术运用到CORCA-3D软件中,并介绍了CORCA-3D软件并行优化的设计与实现。通过对方家山1号机组全堆芯进行测试,证明并行编程技术可大幅提升CORCA-3D软件的运行效率,平均加速比约为2左右。此并行编程技术的运用为后续堆芯数值软件应用提供技术支撑。 展开更多
关键词 堆芯中子学 并行编程 openmp 运行效率
下载PDF
Parallel Image Processing: Taking Grayscale Conversion Using OpenMP as an Example
2
作者 Bayan AlHumaidan Shahad Alghofaily +2 位作者 Maitha Al Qhahtani Sara Oudah Naya Nagy 《Journal of Computer and Communications》 2024年第2期1-10,共10页
In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularl... In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularly noteworthy in the field of image processing, which witnessed significant advancements. This parallel computing project explored the field of parallel image processing, with a focus on the grayscale conversion of colorful images. Our approach involved integrating OpenMP into our framework for parallelization to execute a critical image processing task: grayscale conversion. By using OpenMP, we strategically enhanced the overall performance of the conversion process by distributing the workload across multiple threads. The primary objectives of our project revolved around optimizing computation time and improving overall efficiency, particularly in the task of grayscale conversion of colorful images. Utilizing OpenMP for concurrent processing across multiple cores significantly reduced execution times through the effective distribution of tasks among these cores. The speedup values for various image sizes highlighted the efficacy of parallel processing, especially for large images. However, a detailed examination revealed a potential decline in parallelization efficiency with an increasing number of cores. This underscored the importance of a carefully optimized parallelization strategy, considering factors like load balancing and minimizing communication overhead. Despite challenges, the overall scalability and efficiency achieved with parallel image processing underscored OpenMP’s effectiveness in accelerating image manipulation tasks. 展开更多
关键词 Parallel Computing Image Processing openmp Parallel programming High Performance Computing GPU (Graphic Processing Unit)
下载PDF
基于OpenMP的并行Fortran程序数据竞争静态检测方法
3
作者 葛优 金大海 宫云战 《小型微型计算机系统》 CSCD 北大核心 2023年第11期2377-2383,共7页
数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和... 数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和语义特性,构建并行程序的抽象语法树,并对控制流图进行扩展引入并行控制流图;然后将数据竞争问题抽象为一种故障模型,利用有限状态机来形式化的描述此类故障模型;最后对并行区域的潜在赋值操作进行并行数据流分析,在程序控制流图节点上进行故障状态机的状态转化来实现数据竞争的检测.该方法已在自研的缺陷检测系统(DTS)中应用,并通过DataRaceBench的实验数据证明本文方法可以有效的检测出数据竞争问题. 展开更多
关键词 openmp 静态分析 共享内存编程 数据竞争检测 并行数据流
下载PDF
基于OpenMP的多核系统并行程序设计方法研究 被引量:9
4
作者 龚向坚 邹腊梅 胡义香 《南华大学学报(自然科学版)》 2013年第1期64-68,共5页
随着多核处理器被广泛的应用于桌面系统,如何充分利用多核处理器的计算能力,挖掘应用程序的并行性,以充分发挥多核系统的强大计算能力,成为近几年国内外计算机领域研究的热点,多核系统并行程序设计也成为所有专业软件开发人员必须了解... 随着多核处理器被广泛的应用于桌面系统,如何充分利用多核处理器的计算能力,挖掘应用程序的并行性,以充分发挥多核系统的强大计算能力,成为近几年国内外计算机领域研究的热点,多核系统并行程序设计也成为所有专业软件开发人员必须了解和掌握的一项技术.本文阐述了一种以OpenMP为基础的多核并行程序设计方法,研究并提出了两种符合多核系统并行程序设计特征的编程模式:条件同步模式和线程分组竞争模式.实验证明这些方法简单高效. 展开更多
关键词 多核系统 并行计算 openmp 编程模式
下载PDF
基于MPI+OpenMP的水声传播并行预报方法 被引量:1
5
作者 范培勤 过武宏 唐帅 《海洋技术学报》 2021年第3期52-57,共6页
基于SMP集群,利用MPI+OpenMP混合并行编程方法,设计和开发了水声传播产品多级混合并行预报算法,该算法结合SMP集群的体系架构特点,通过节点内共享内存,节点间消息传递的方式,充分发挥两种模式各自的优势,克服MPI模式进程间通信时间长、O... 基于SMP集群,利用MPI+OpenMP混合并行编程方法,设计和开发了水声传播产品多级混合并行预报算法,该算法结合SMP集群的体系架构特点,通过节点内共享内存,节点间消息传递的方式,充分发挥两种模式各自的优势,克服MPI模式进程间通信时间长、OpenMP模式扩展性差的缺点,并对程序进行了优化处理,实现了水声传播产品的快速高效预报。测试结果表明,该方法可充分发挥两种并行编程模式的优点,有效提高水声传播产品预报程序的并行效率和扩展性,大幅降低预报时间。 展开更多
关键词 水声传播 并行计算 MPI openmp SMP集群
下载PDF
任务并行编程模型下排列熵算法的并行实现
6
作者 李维权 《软件工程》 2024年第2期40-43,共4页
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度... 排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。 展开更多
关键词 排列熵算法 任务并行编程模型 openmp StarPU
下载PDF
OpenMP程序中基于活跃变量分析的检查点优化
7
作者 刘洋 杨金民 《计算机工程与应用》 CSCD 北大核心 2016年第4期31-41,45,共12页
OpenMP程序通过做检查点来实现容错,现有检查点方法未考虑活跃变量的语义,通过原始值拷贝来保存活跃变量,存在检查点保存量过大的问题。对此提出数组活跃变量检查点优化算法。该算法基于程序分析,处理隐式定值和隐式引用,运用活跃变量... OpenMP程序通过做检查点来实现容错,现有检查点方法未考虑活跃变量的语义,通过原始值拷贝来保存活跃变量,存在检查点保存量过大的问题。对此提出数组活跃变量检查点优化算法。该算法基于程序分析,处理隐式定值和隐式引用,运用活跃变量分析法得出数组元素中的活跃变量,在适当的情况下采用由下标和数组首地址构成的表达式来表达数组元素,省略其原始值在检查点中的保存,从而减少检查点的数据保存量,达到降低检查点开销的目的。实验表明,该算法可以减少检查点的数据保存量,降低数组元素的数据保存量,达到降低检查点开销的目的,并且消除隐式定值和隐式引用带来的一些不良影响。 展开更多
关键词 openmp程序 并行复算 活跃变量 检查点
下载PDF
共享内存结构OpenMP并行程序的自动生成
8
作者 张平 赵荣彩 +1 位作者 李清宝 董春丽 《计算机科学》 CSCD 北大核心 2004年第12期189-191,共3页
有效的程序自动并行化系统能帮助用户充分利用并行计算机的硬件资源和提高并行程序设计的效率。OpenMP作为共享内存结构的编程标准,具有良好的性能和可移植性。本文介绍了基于SUIF的OpenMP并行程序自动生成工具OAGT的设计和实现,重点讨... 有效的程序自动并行化系统能帮助用户充分利用并行计算机的硬件资源和提高并行程序设计的效率。OpenMP作为共享内存结构的编程标准,具有良好的性能和可移植性。本文介绍了基于SUIF的OpenMP并行程序自动生成工具OAGT的设计和实现,重点讨论了其中所涉及的几个主要技术问题:循环分析、流水并行、归约操作、同步优化等。 展开更多
关键词 并行程序设计 共享内存 自动生成 流水并行 并行计算机 可移植性 编程 MP 问题 操作
下载PDF
多核构架下基于OpenMP的Huffman压缩算法并行设计
9
作者 胡荣 唐琨皓 黄樱 《南华大学学报(自然科学版)》 2013年第3期61-65,共5页
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助... 本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高. 展开更多
关键词 openmp模型 并行程序设计 多核 多线程
下载PDF
基于OpenMP实现的误差扩散算法
10
作者 张春柳 李嘉 熊琭 《软件产业与工程》 2015年第1期44-48,共5页
误差扩散算法是一种常用的数字半色调技术,但传统的误差扩散算法是典型的串行算法。本文在传统误差扩散的基础上,针对误差扩散的像素扩散的原理,叙述了基于线程延迟和基于图像划分的两种误差扩散的并行化算法,并使用Open MP进行实现。... 误差扩散算法是一种常用的数字半色调技术,但传统的误差扩散算法是典型的串行算法。本文在传统误差扩散的基础上,针对误差扩散的像素扩散的原理,叙述了基于线程延迟和基于图像划分的两种误差扩散的并行化算法,并使用Open MP进行实现。实验结果证明误差扩散算法的并行化是可行的,且是十分高效的,具有良好的应用前景。 展开更多
关键词 误差扩散法 openmp 并行程序设计
下载PDF
基于MPI/OPENMP混合编程的三维粒子模拟并行优化 被引量:3
11
作者 颜小洋 张伟文 +1 位作者 布社辉 邓辉舫 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期71-78,共8页
针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和... 针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和加速比均优于纯MPI并行程序,克服了MPI并行程序中因粒子分布不均匀使负载不均衡而导致的程序性能下降的问题,使得可以利用集群中的更多结点来进行计算,缓解了MPI并行程序的通信延迟问题;同时,MPI/OPENMP混合并行编程克服了OPENMP并行程序依赖于单台计算机处理能力和存储空间的问题,大幅度提高了模拟规模. 展开更多
关键词 MPI并行程序 openmp并行程序 3DEMPM 并行计算
下载PDF
基于OpenMP的电磁场FDTD并行程序性能分析 被引量:7
12
作者 李正浩 周俊 刘大刚 《现代电子技术》 2008年第14期135-138,共4页
OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其... OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其并行程序执行效率的几个因素。结果表明,采取不同的并行方式,设定不同的调度策略,设置并行区线程数的大小均会影响并行程序的性能。因此,在使用OpenMP编写电磁场并行程序时,需要综合考虑各种因素的影响才能设计出高效的程序。 展开更多
关键词 openmp 并行程序 FDTD 影响因素
下载PDF
基于OpenMP的事务存储同步语义研究
13
作者 田祖伟 李勇帆 《计算机科学》 CSCD 北大核心 2009年第5期166-168,共3页
多核处理器环境下必须解决多核处理器的并行编程问题,才能够充分发挥多核处理器的性能。事务存储(Transactional Memory)机制提供了一种在多核环境下程序并行执行和同步的方法。已有的工作已将事务存储扩展到了OpenMP,为程序员提供满足... 多核处理器环境下必须解决多核处理器的并行编程问题,才能够充分发挥多核处理器的性能。事务存储(Transactional Memory)机制提供了一种在多核环境下程序并行执行和同步的方法。已有的工作已将事务存储扩展到了OpenMP,为程序员提供满足事务原子性、一致性和隔离性的共享存储访问。但当前事务存储的语义并不完善,事务间不能交换中间结果,不能实现锁的部分语义。提出并实现了一种基于开放嵌套的事务存储的同步语义,从而解决了事务间不能交换中间结果的问题,增强了扩展事务存储后OpenMP的并行编程能力。 展开更多
关键词 事务存储 openmp 多核处理器 共享存储并行编程
下载PDF
一种基于OpenMP和MPI的非序贯蒙塔卡罗暂态稳定评估的动态混合并行化方法 被引量:2
14
作者 于慧莉 李勤新 宫春明 《现代电力》 北大核心 2014年第2期31-36,共6页
为了提高暂态稳定性分析中非序贯蒙塔卡罗串行算法的计算效率,提出并实现了一种基于OpenMP和MPI的风险评估混合动态并行算法。利用动态规划规则将蒙塔卡罗抽样样本点以MPI方法分配给计算机集群上的多个PC进程,再在各进程内采用多线程的... 为了提高暂态稳定性分析中非序贯蒙塔卡罗串行算法的计算效率,提出并实现了一种基于OpenMP和MPI的风险评估混合动态并行算法。利用动态规划规则将蒙塔卡罗抽样样本点以MPI方法分配给计算机集群上的多个PC进程,再在各进程内采用多线程的并行计算模式对系统故障的分析处理的循环部分进行OpenMP并行分解。大量实验模型的测试和数据分析表明,在保证准确度的前提下,算法取得了理想的并行效率,普通集群最高达到了3.28倍的加速比,混合集群最高达到了5.06倍的加速比。 展开更多
关键词 暂态稳定 非序贯蒙塔卡罗 并行算法 MPI openmp 动态规划
下载PDF
基于LAM-MPI和OpenMP的机群编程环境配置与应用 被引量:3
15
作者 向文 刘青昆 +1 位作者 于方 郑晓薇 《大连民族学院学报》 CAS 2007年第5期41-44,共4页
采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI+OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行... 采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI+OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行算法,并在搭建的8节点SMP机群环境中完成测试工作. 展开更多
关键词 LAM-MPI openmp 机群环境 混合编程
下载PDF
基于OpenMP的色散介质FDTD并行程序设计 被引量:2
16
作者 刘珺 赵志钦 《电子科技》 2015年第7期21-23,共3页
分析了色散介质时域有限差分的模型,并针对非磁化等离子体给出了的分层线性递归卷积算法。介绍了Open MP并行设计的基本模型,并将其应用于非磁化等离子体的计算当中。最终通过验证非磁化等离子体的透射电磁波,验证了将Open MP并行设计... 分析了色散介质时域有限差分的模型,并针对非磁化等离子体给出了的分层线性递归卷积算法。介绍了Open MP并行设计的基本模型,并将其应用于非磁化等离子体的计算当中。最终通过验证非磁化等离子体的透射电磁波,验证了将Open MP并行设计应用于色散介质中的准确性,同时依据计算区域大小不同的3个算例验证了该算法具有较高的并行性能。 展开更多
关键词 时域有限差分 色散介质 openmp 并行程序
下载PDF
基于OpenMP的电磁场FDTD多核并行程序设计 被引量:2
17
作者 吕忠亭 张玉强 崔巍 《现代电子技术》 2013年第23期168-170,共3页
探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方... 探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD程序中进行了验证。该并行算法取得了较其他并行FDTD算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常好的加速比和效率。 展开更多
关键词 openmp 时域有限差分法 多核并行程序 程序设计
下载PDF
OpenMP在图形数据文件加载中的应用 被引量:1
18
作者 査盛音 王玉玫 聂颖 《软件导刊》 2013年第10期159-162,共4页
为了充分利用多核处理器的硬件资源和计算能力,提出了基于多核并行编程技术的图形数据文件加载优化方案。根据图形数据文件加载的特点,由传统的串行程序改为并行程序,利用多核并行编程模型的思想,找出程序的热点和瓶颈,对其进行优化。... 为了充分利用多核处理器的硬件资源和计算能力,提出了基于多核并行编程技术的图形数据文件加载优化方案。根据图形数据文件加载的特点,由传统的串行程序改为并行程序,利用多核并行编程模型的思想,找出程序的热点和瓶颈,对其进行优化。实验结果表明,当图形符号数量达到一定数量级之后,优化过后的执行时间较原来串行程序有明显缩短,提高了程序的加速性能,取得了良好的效果。 展开更多
关键词 openmp 程序优化 图形数据文件加载 本地计算
下载PDF
基于MPI和OpenMP的排序算法并行优化研究 被引量:2
19
作者 王帅 喻歆 何嘉 《成都信息工程大学学报》 2016年第3期277-284,共8页
排序是计算机程序设计中的一项重要操作,其性能好坏决定整个程序性能的优劣。针对常见的快速排序、冒泡排序、归并排序、计数排序和选择排序这5种排序算法,分别用MPI(message passing Interface)和OpenMP(open multi-processing)并行化... 排序是计算机程序设计中的一项重要操作,其性能好坏决定整个程序性能的优劣。针对常见的快速排序、冒泡排序、归并排序、计数排序和选择排序这5种排序算法,分别用MPI(message passing Interface)和OpenMP(open multi-processing)并行化编程环境对其进行并行程序优化,研究分析MPI和OpenMP并行优化时的优缺点,并对比不同并行化技术下的加速比和开销等性能,为更高效的排序算法的并行程序设计奠定基础。 展开更多
关键词 计算机应用 高性能计算 排序 并行编程 加速比 MPI openmp
下载PDF
基于新离散公式和OpenMP优化的有限差分声波数值模拟 被引量:1
20
作者 郑如秋 王波涛 +1 位作者 冯永照 余卫江 《世界地质》 CAS 2020年第4期896-904,共9页
有限差分法算法是声波数值模拟算法中最广泛的数值计算方法。该方法具有计算速度快、占用内存相对较小、易于编程实现及模拟精度高等优点。规则网格下的有限差分算法相比于近年来提出的新的有限差分算法计算效率最高,消耗内存最少。然而... 有限差分法算法是声波数值模拟算法中最广泛的数值计算方法。该方法具有计算速度快、占用内存相对较小、易于编程实现及模拟精度高等优点。规则网格下的有限差分算法相比于近年来提出的新的有限差分算法计算效率最高,消耗内存最少。然而,引入PML边界,导致常规网格的有限差分离散公式复杂,计算过程需要对计算区域和边界区域进行判断,导致计算效率低。针对这个问题,笔者新推导的离散公式,形式简单,整个模拟区域计算代码一致,可以很好地解决这个问题。OpenMP并行算法,语言简洁和可移植性高,通过结合OpenMP并行算法,对模拟算法进一步优化,可以较大提高数值模拟的计算效率。 展开更多
关键词 有限差分 规则网格 离散公式 openmp并行算法 计算效率
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部