期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
任务并行编程模型下排列熵算法的并行实现
1
作者 李维权 《软件工程》 2024年第2期40-43,共4页
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度... 排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。 展开更多
关键词 排列熵算法 任务并行编程模型 openmp StarPU
下载PDF
多核构架下基于OpenMP的Huffman压缩算法并行设计
2
作者 胡荣 唐琨皓 黄樱 《南华大学学报(自然科学版)》 2013年第3期61-65,共5页
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助... 本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高. 展开更多
关键词 openmp模型 并行程序设计 多核 多线程
下载PDF
高分辨率星载SAR并行成像处理系统设计
3
作者 张凤明 周荫清 +1 位作者 文竹 陈杰 《遥测遥控》 2005年第6期19-22,共4页
针对高分辨率星载SAR成像处理流程的特点,提出一种高分辨率星载SAR并行成像处理系统方案。该系 统能完成星载SAR数据预处理、轨道参数及多普勒参数计算、多普勒参数估计、成像处理以及辐射校正等功能。系统采 用模块设计,具有很强的向... 针对高分辨率星载SAR成像处理流程的特点,提出一种高分辨率星载SAR并行成像处理系统方案。该系 统能完成星载SAR数据预处理、轨道参数及多普勒参数计算、多普勒参数估计、成像处理以及辐射校正等功能。系统采 用模块设计,具有很强的向后兼容和可扩展性;同时,基于多CPU高性能计算机的并行结构,使系统具有很高的实时性。 测试证明系统设计合理和有效。 展开更多
关键词 合成孔径雷达 并行处理 openmp编程模型
下载PDF
MPI+OpenMP混合并行编程模型在分子动力学中的应用
4
作者 张坤峰 张苏 《周口师范学院学报》 CAS 2022年第5期71-75,共5页
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构... 针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。 展开更多
关键词 分子动力学 MPI+openmp 并行编程模型 LAMMPS
下载PDF
多核并行编程技术在中文分词程序优化中的应用 被引量:2
5
作者 董丽丽 刘明生 袁香菊 《计算机工程与设计》 CSCD 北大核心 2010年第24期5231-5235,共5页
为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通... 为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化。实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%~60%,同时提高了程序的加速性能,取得了良好的效果。 展开更多
关键词 多核并行 并行编程模式 程序优化 openmp 中文分词
下载PDF
基于SMP集群系统的并行编程模式研究与分析 被引量:5
6
作者 宋伟 宋玉 《计算机技术与发展》 2007年第2期164-167,171,共5页
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点... 并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 展开更多
关键词 并行计算 对称多处理器 集群 消息传递模型 共享存储模型 MPI openmp 混合编程
下载PDF
基于三层混合编程模型的Petri网并行算法研究 被引量:2
7
作者 周杰 李文敬 《计算机科学》 CSCD 北大核心 2017年第B11期586-591,595,共7页
为解决多核机群Petri网并行化过程中,运用MPI+OPenMP混合编程实现同步会出现死锁的问题,提出了基于三层混合编程模型的Petri网并行算法。首先,根据事务内存的同步优势,在多核机群环境下构建MPI+OPenMP+STM的三层编程模型;然后,对Petri... 为解决多核机群Petri网并行化过程中,运用MPI+OPenMP混合编程实现同步会出现死锁的问题,提出了基于三层混合编程模型的Petri网并行算法。首先,根据事务内存的同步优势,在多核机群环境下构建MPI+OPenMP+STM的三层编程模型;然后,对Petri网的几何模型与代数模型的并行化进行分析,建立MPI+OPenMP+STM三层结构的Petri网并行模型,并对三层混合编程模型的Petri网并行算法进行设计与分析;最后,通过示例进行编程验证,该算法的运行效率明显优于其他编程模式,而且Petri网的规模越大,其并行计算的效果就越明显。因此,该算法是多核机群环境下模拟Petri网并行运行的一种高效且可行的算法。 展开更多
关键词 PETRI网 MPI+openmp+STM编程 Petri网并行化 Petri网并行模型 并行算法
下载PDF
非线性扩散方程的显式并行计算
8
作者 迟利华 刘杰 《计算机工程》 CAS CSCD 北大核心 2010年第21期25-27,共3页
在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该... 在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在4核Xeon处理器构成的分布共享集群系统上可扩展到1024个CPU核,相对于64个CPU核,其加速比为7.06。 展开更多
关键词 openmp编程模型 多核集群系统 非线性扩散方程 并行计算
下载PDF
共享存储环境下非平衡动力学方程组并行计算
9
作者 迟利华 刘杰 《计算机应用》 CSCD 北大核心 2010年第A01期237-240,共4页
OpenMP是现代多核机群系统采用的主要并行编程模型之一,在单CPU多核上可以获得良好的加速性能,但在整个机群系统上使用时,需要解决可扩展性差的问题。首先设计了求解非平衡动力学方程的并行算法。基于分布共享的多核机群系统,采用显式... OpenMP是现代多核机群系统采用的主要并行编程模型之一,在单CPU多核上可以获得良好的加速性能,但在整个机群系统上使用时,需要解决可扩展性差的问题。首先设计了求解非平衡动力学方程的并行算法。基于分布共享的多核机群系统,采用显式数据分布OpenMP并行计算方法,将数据进行分布式划分,分配到每个OpenMP线程,通过数据共享实现数据交换。计算结果表明显式OpenMP并行程序在保持可读性的同时,具有良好的可扩展性,在4核Xeon处理器构成的分布共享机群系统上,非平衡动力学方程组的数值并行计算可以扩展到1 024个CPU核,具有明显的并行加速计算效果。 展开更多
关键词 openmp编程模型 多核机群系统 非平衡动力学方程组 并行计算
下载PDF
面向层次化NoC的混合并行编程模型 被引量:1
10
作者 曹祥 易伟 +2 位作者 潘红兵 高明伦 李丽 《计算机工程》 CAS CSCD 北大核心 2010年第13期278-280,共3页
为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程... 为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程模型相比,混合并行编程模型加速比提高了20%~50%。 展开更多
关键词 片上网络 消息传递接口 openmp模型 层次化 混合并行编程
下载PDF
Windows环境下CRNG多核并行算法的设计实现
11
作者 沈春来 洪龙 胡俊 《计算机技术与发展》 2012年第3期77-80,共4页
多核技术的出现给人们带来了一种大幅提升计算机运行速度的方法,大量的并行算法也被设计并应用到各个场合中。文中目的在于设计一种新的用于组合随机数发生器CRNG(Combined Random Number Generator)的并行算法,以提高传统算法的运算速... 多核技术的出现给人们带来了一种大幅提升计算机运行速度的方法,大量的并行算法也被设计并应用到各个场合中。文中目的在于设计一种新的用于组合随机数发生器CRNG(Combined Random Number Generator)的并行算法,以提高传统算法的运算速率。文中采用并行编程方法中的任务级的并行模式,对传统组合随机数发生器的运算过程进行任务分解,将其分配到四个执行核上并行执行,以产生最终的随机数序列。最后在Windows环境下,使用常用的并行编程工具-OpenMP对新算法进行了编程验证,结果证实该算法可充分利用现有计算机所能提供的多核计算资源,其加速比高于3。 展开更多
关键词 多核技术 并行程序设计 openmp 任务分解模式 CRNG并行算法
下载PDF
面向神威高性能多核处理器的并行编译优化方法
12
作者 周雍浩 徐金龙 +2 位作者 李斌 钱宏 聂凯 《计算机工程》 CAS CSCD 北大核心 2022年第9期130-138,共9页
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行... 在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。 展开更多
关键词 神威高性能多核处理器 openmp编程 并行域重构 fork-join模型 单程序多数据模型
下载PDF
Performance of Text-Independent Automatic Speaker Recognition on a Multicore System
13
作者 Rand Kouatly Talha Ali Khan 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2024年第2期447-456,共10页
This paper studies a high-speed text-independent Automatic Speaker Recognition(ASR)algorithm based on a multicore system's Gaussian Mixture Model(GMM).The high speech is achieved using parallel implementation of t... This paper studies a high-speed text-independent Automatic Speaker Recognition(ASR)algorithm based on a multicore system's Gaussian Mixture Model(GMM).The high speech is achieved using parallel implementation of the feature's extraction and aggregation methods during training and testing procedures.Shared memory parallel programming techniques using both OpenMP and PThreads libraries are developed to accelerate the code and improve the performance of the ASR algorithm.The experimental results show speed-up improvements of around 3.2 on a personal laptop with Intel i5-6300HQ(2.3 GHz,four cores without hyper-threading,and 8 GB of RAM).In addition,a remarkable 100%speaker recognition accuracy is achieved. 展开更多
关键词 Automatic Speaker Recognition(ASR) Gaussian Mixture model(GMM) shared memory parallel programming PThreads openmp
原文传递
多核多线程并行编程模型研究及应用 被引量:1
14
作者 于方 《阴山学刊(自然科学版)》 2012年第2期30-33,共4页
首先介绍目前基于多核平台的并行计算技术和方法,本文主要研究OpenMP+Microsoft VisualStudio 2005的多核多线程并行编程模型;以求解三角网格模型上最短路径问题为应用实例,验证了多核平台下利用该模型实现多核多线程并行编程的正确性... 首先介绍目前基于多核平台的并行计算技术和方法,本文主要研究OpenMP+Microsoft VisualStudio 2005的多核多线程并行编程模型;以求解三角网格模型上最短路径问题为应用实例,验证了多核平台下利用该模型实现多核多线程并行编程的正确性和高效性,为解决其他应用领域的复杂计算提供了一种易实现、大众化的多核并行编程模式。 展开更多
关键词 多核 多线程 并行编程模型 openmp MicrosoftVisualStudio2005
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部