期刊文献+
共找到346篇文章
< 1 2 18 >
每页显示 20 50 100
The Implementation of Ray Tracing Algorithm with OpenMP Parallelization
1
作者 Noor Alnasser Raghad Alabssi +2 位作者 Batool Faran Latifah Alessa Naya Nagy 《Journal of Computer and Communications》 2024年第1期120-130,共11页
Ray tracing is a computer graphics method that renders images realistically. As the name suggests, this technique primarily traces the path of light rays interacting with objects in a scene [1], permitting the calcula... Ray tracing is a computer graphics method that renders images realistically. As the name suggests, this technique primarily traces the path of light rays interacting with objects in a scene [1], permitting the calculation of lighting and reflecting impact [2]. As ray tracing is a time-consuming process, the need for parallelization to solve this problem arises. One downside of this solution is the existence of race conditions. In this work, we explore and experiment with a different, well-known solution for this race condition. Starting with the introduction and the background section, a brief overview of the topic is followed by a detailed part of how the race conditions may occur in the case of the ray tracing algorithm. Continuing with the methods and results section, we have used OpenMP to parallelize the Ray tracing algorithm with the different compiler directives critical, atomic, and first-private. Hence, it concluded that both critical and atomic are not efficient solutions to produce a good-quality picture, but first-private succeeded in producing a high-quality picture. 展开更多
关键词 parallelIZATION Ray Tracing parallel Computer Architecture openmp
下载PDF
Parallel Image Processing: Taking Grayscale Conversion Using OpenMP as an Example
2
作者 Bayan AlHumaidan Shahad Alghofaily +2 位作者 Maitha Al Qhahtani Sara Oudah Naya Nagy 《Journal of Computer and Communications》 2024年第2期1-10,共10页
In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularl... In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularly noteworthy in the field of image processing, which witnessed significant advancements. This parallel computing project explored the field of parallel image processing, with a focus on the grayscale conversion of colorful images. Our approach involved integrating OpenMP into our framework for parallelization to execute a critical image processing task: grayscale conversion. By using OpenMP, we strategically enhanced the overall performance of the conversion process by distributing the workload across multiple threads. The primary objectives of our project revolved around optimizing computation time and improving overall efficiency, particularly in the task of grayscale conversion of colorful images. Utilizing OpenMP for concurrent processing across multiple cores significantly reduced execution times through the effective distribution of tasks among these cores. The speedup values for various image sizes highlighted the efficacy of parallel processing, especially for large images. However, a detailed examination revealed a potential decline in parallelization efficiency with an increasing number of cores. This underscored the importance of a carefully optimized parallelization strategy, considering factors like load balancing and minimizing communication overhead. Despite challenges, the overall scalability and efficiency achieved with parallel image processing underscored OpenMP’s effectiveness in accelerating image manipulation tasks. 展开更多
关键词 parallel Computing Image Processing openmp parallel Programming High Performance Computing GPU (Graphic Processing Unit)
下载PDF
基于半精度浮点数优化与OpenMP的地震数值模拟
3
作者 刘文革 涂文茂 +2 位作者 牟其松 陈康 周觅路 《CT理论与应用研究(中英文)》 2024年第3期289-297,共9页
研究地震波场的传播特征是地震勘探的基础,利用有限差分法求解波动方程进行地震正演,其优势在于占用内存低、计算速度快、易于实现。但在三维情况下,计算量和数据量会急剧增加,传统串行地震数值模拟将无法满足计算效率的需求。因此,本... 研究地震波场的传播特征是地震勘探的基础,利用有限差分法求解波动方程进行地震正演,其优势在于占用内存低、计算速度快、易于实现。但在三维情况下,计算量和数据量会急剧增加,传统串行地震数值模拟将无法满足计算效率的需求。因此,本文提出一种基于半精度浮点数优化与OpenMP的三维波动方程地震数值模拟方法,该方法首先利用半精度浮点数对地震常用的浮点型数据进行优化;其次利用应用程序接口OpenMP在多核CPU下通过以分割波场计算区域的方式实现并行计算;在保证计算结果满足精度需求的同时,能有效提高三维地震数值模拟的计算效率,并减少近一半的内存需求。通过数值试验证明该方法的有效性和实用性。 展开更多
关键词 有限差分法 半精度浮点数 openmp 并行计算 地震波
下载PDF
Comparative Study of the Parallelization of the Smith-Waterman Algorithm on OpenMP and Cuda C
4
作者 Amadou Chaibou Oumarou Sie 《Journal of Computer and Communications》 2015年第6期107-117,共11页
In this paper, we present parallel programming approaches to calculate the values of the cells in matrix’s scoring used in the Smith-Waterman’s algorithm for sequence alignment. This algorithm, well known in bioinfo... In this paper, we present parallel programming approaches to calculate the values of the cells in matrix’s scoring used in the Smith-Waterman’s algorithm for sequence alignment. This algorithm, well known in bioinformatics for its applications, is unfortunately time-consuming on a serial computer. We use formulation based on anti-diagonals structure of data. This representation focuses on parallelizable parts of the algorithm without changing the initial formulation of the algorithm. Approaching data in that way give us a formulation more flexible. To examine this approach, we encode it in OpenMP and Cuda C. The performance obtained shows the interest of our paper. 展开更多
关键词 CUDA GP-GPU openmp parallel COMPUTING Smith-Waterman
下载PDF
基于OpenMP的航迹融合并行优化方法
5
作者 吴静 谢晓霞 +2 位作者 艾小锋 赵锋 徐振海 《太赫兹科学与电子信息学报》 2024年第9期1021-1028,共8页
针对组网雷达中分布式数据融合计算量随数据量增大急剧增加的问题及航迹融合中最耗时的航迹关联环节,提出一种基于OpenMP的多线程优化方法。通过OpenMP并行计算雷达航迹间的关联距离,提升内部算法运算速度,并将数据接收、融合处理和结... 针对组网雷达中分布式数据融合计算量随数据量增大急剧增加的问题及航迹融合中最耗时的航迹关联环节,提出一种基于OpenMP的多线程优化方法。通过OpenMP并行计算雷达航迹间的关联距离,提升内部算法运算速度,并将数据接收、融合处理和结果输出过程进行多线程处理,进一步加快外部数据交互速度,提升融合处理整体时间性能。以大容量目标场景为测试用例,评估处理时间和优化加速比。仿真结果表明,所提并行优化方法能够有效提升运算速度。 展开更多
关键词 航迹融合 航迹关联 并行优化 多线程 openmp技术
下载PDF
基于OpenMP的堆芯中子学软件性能优化研究
6
作者 刘婷 安萍 +1 位作者 芦韡 秦志红 《中国核电》 2024年第2期190-196,共7页
CORCA-3D软件是中国核动力研究设计院自主研发的先进节块法堆芯三维少群中子学计算软件,提升CORCA-3D软件运行速度可以提高反应堆系统分析的效率。目前CORCA-3D软件采用单线程的方式运行,并没有充分利用计算机的多核硬件资源,对CORCA-3... CORCA-3D软件是中国核动力研究设计院自主研发的先进节块法堆芯三维少群中子学计算软件,提升CORCA-3D软件运行速度可以提高反应堆系统分析的效率。目前CORCA-3D软件采用单线程的方式运行,并没有充分利用计算机的多核硬件资源,对CORCA-3D软件进行性能分析,发现其存在运行时间较长的热点函数,CPU利用率较低,因此可引入并行编程技术来加速CORCA-3D软件的计算。文中将OpenMP编程技术运用到CORCA-3D软件中,并介绍了CORCA-3D软件并行优化的设计与实现。通过对方家山1号机组全堆芯进行测试,证明并行编程技术可大幅提升CORCA-3D软件的运行效率,平均加速比约为2左右。此并行编程技术的运用为后续堆芯数值软件应用提供技术支撑。 展开更多
关键词 堆芯中子学 并行编程 openmp 运行效率
下载PDF
Parallel Quick Search Algorithm for the Exact String Matching Problem Using OpenMP
7
作者 Sinan Sameer Mahmood Al-Dabbagh Nawaf Hazim Barnouti +1 位作者 Mustafa Abdul Sahib Naser Zaid G. Ali 《Journal of Computer and Communications》 2016年第13期1-11,共11页
String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that... String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that is created and kept by modern computational devices influences researchers to obtain even more powerful methods for coping with this problem. In this research, the Quick Search string matching algorithm are adopted to be implemented under the multi-core environment using OpenMP directive which can be employed to reduce the overall execution time of the program. English text, Proteins and DNA data types are utilized to examine the effect of parallelization and implementation of Quick Search string matching algorithm on multi-core based environment. Experimental outcomes reveal that the overall performance of the mentioned string matching algorithm has been improved, and the improvement in the execution time which has been obtained is considerable enough to recommend the multi-core environment as the suitable platform for parallelizing the Quick Search string matching algorithm. 展开更多
关键词 String Matching Pattern Matching String Searching ALGORITHMS Quick Search Algorithm Exact String Matching Algorithm ? parallelization openmp
下载PDF
Parallel Technologies with Image Processing Using Inverse Filter
8
作者 Rahaf Alsharhan Areej Muheef +2 位作者 Yasmin Al Ibrahim Afnan Rayyani Yasir Alguwaifli 《Journal of Computer and Communications》 2024年第1期110-119,共10页
Real-time capabilities and computational efficiency are provided by parallel image processing utilizing OpenMP. However, race conditions can affect the accuracy and reliability of the outcomes. This paper highlights t... Real-time capabilities and computational efficiency are provided by parallel image processing utilizing OpenMP. However, race conditions can affect the accuracy and reliability of the outcomes. This paper highlights the importance of addressing race conditions in parallel image processing, specifically focusing on color inverse filtering using OpenMP. We considered three solutions to solve race conditions, each with distinct characteristics: #pragma omp atomic: Protects individual memory operations for fine-grained control. #pragma omp critical: Protects entire code blocks for exclusive access. #pragma omp parallel sections reduction: Employs a reduction clause for safe aggregation of values across threads. Our findings show that the produced images were unaffected by race condition. However, it becomes evident that solving the race conditions in the code makes it significantly faster, especially when it is executed on multiple cores. 展开更多
关键词 parallel parallelIZATION Image Processing Inverse Filtering openmp Race Conditions
下载PDF
一种利用并行复算实现的OpenMP容错机制 被引量:7
9
作者 富弘毅 丁滟 +1 位作者 宋伟 杨学军 《软件学报》 EI CSCD 北大核心 2012年第2期411-427,共17页
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决... 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性. 展开更多
关键词 容错 openmp 并行复算 数据流分析
下载PDF
OpenMP并行计算在卫星重力数据处理中的应用 被引量:37
10
作者 邹贤才 李建成 +1 位作者 汪海洪 徐新禹 《测绘学报》 EI CSCD 北大核心 2010年第6期636-641,共6页
对新一代卫星重力数据处理中的计算密集型任务进行分析,总结出需要采用并行计算技术提高效率的几个关键任务。对不同的并行手段进行比较,采用OpenMP并行方法,并通过算例验证并行设计方法的有效性。结果表明,并行计算能显著提高卫星重力... 对新一代卫星重力数据处理中的计算密集型任务进行分析,总结出需要采用并行计算技术提高效率的几个关键任务。对不同的并行手段进行比较,采用OpenMP并行方法,并通过算例验证并行设计方法的有效性。结果表明,并行计算能显著提高卫星重力任务的数据处理效率。 展开更多
关键词 并行计算 openmp 卫星重力
下载PDF
MKL和OpenMP多核并行算法解算高阶地球重力场的效率分析 被引量:8
11
作者 陈秋杰 沈云中 张兴福 《大地测量与地球动力学》 CSCD 北大核心 2012年第5期118-123,共6页
将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)... 将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)当利用多个历元组成高维系数矩阵,然后再形成法方程时,MKL算法才能体现出高效性能;3)MKL求逆算法效率远高于OpenMP算法;4)综合利用OpenMP和MKL算法的优势,可显著提高高阶地球重力场反演的效率。 展开更多
关键词 MKL openmp 并行算法 地球重力场反演 计算效率
下载PDF
OpenMP在水动力数学模型并行计算中的应用 被引量:3
12
作者 李褆来 徐学军 +2 位作者 陈黎明 金秋 张铁军 《海洋工程》 CSCD 北大核心 2010年第3期112-116,122,共6页
采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.... 采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.56,平均并行计算节省时间36%,明显提高了水动力学数学模型的运算速度。 展开更多
关键词 openmp 并行计算 水动力学 数学模型 加速比
下载PDF
OpenMP在MM5中尺度模式中的应用试验 被引量:5
13
作者 张昕 季仲贞 王斌 《气候与环境研究》 CSCD 2001年第1期84-90,共7页
简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行... 简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行方式在 SGI Origin 2000上进行了并行效能测试。测试结果表明: OpenMP是一种简单、高效的并行编程标准,非常适合于气象科研与业务领域应用。 展开更多
关键词 openmp 并行计算 中尺度模式 并行加速比 并行效率 气象 数值大气预报
下载PDF
一种基于动态并行区的OpenMP程序开发模式 被引量:2
14
作者 李建江 舒继武 +2 位作者 陈永健 王鼎兴 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期496-502,共7页
通常,OpenMP程序开发将开发过程、程序正确性检测和性能分析分离开来.为此,提出动态并行区的概念,并在此基础上提出一种新的OpenMP程序开发模式,将OpenMP程序的开发过程、正确性检测和性能分析紧密地联系起来.在OpenMP程序开发的每一阶... 通常,OpenMP程序开发将开发过程、程序正确性检测和性能分析分离开来.为此,提出动态并行区的概念,并在此基础上提出一种新的OpenMP程序开发模式,将OpenMP程序的开发过程、正确性检测和性能分析紧密地联系起来.在OpenMP程序开发的每一阶段,都能确保程序的正确性;同时,通过精确的性能分析与细微的性能调整,使得OpenMP程序的性能随开发的不断深入而逐步得到改进.据此开发的NPB2.3OpenMP Fortran版的实测结果显示出该模式的可行性. 展开更多
关键词 openmp 动态并行区 开发模式 正确性 性能
下载PDF
基于OpenMP的压缩感知并行处理算法 被引量:4
15
作者 巫小婷 邓家先 《计算机应用》 CSCD 北大核心 2012年第3期617-619,共3页
针对压缩感知重建算法复杂度高、运行时间长等缺点,提出一种应用于多核处理器的压缩感知并行算法。在认真分析压缩感知算法的基础上,利用OpenMP对压缩感知的编码测量和正交匹配追踪(OMP)算法进行并行处理,提升程序的性能。实验结果表明... 针对压缩感知重建算法复杂度高、运行时间长等缺点,提出一种应用于多核处理器的压缩感知并行算法。在认真分析压缩感知算法的基础上,利用OpenMP对压缩感知的编码测量和正交匹配追踪(OMP)算法进行并行处理,提升程序的性能。实验结果表明,随着线程数的增加,程序的执行效率显著提高,加速比呈线性增长;并且重构过程越复杂,其性能优化越明显。 展开更多
关键词 压缩感知 openmp 并行 正交匹配追踪 加速比
下载PDF
基于MPI+OpenMP的多层次并行偏移算法研究 被引量:8
16
作者 陈辉 孙雷鸣 +2 位作者 李录明 罗省贤 赵安军 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期528-534,共7页
根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多... 根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多层次并行叠前深度偏移算法。理论模型验证了其正确性,得到了较好的成像效果,不同类型的多层次并行偏移算法计算结果有所差异。多层次并行偏移算法是在实现MPI并行偏移的基础上,对集群各节点内核的充分利用,有利于提升PC集群的计算性能,为叠前深度偏移的实际推广奠定基础。 展开更多
关键词 MPI openmp 多层次并行 偏移
下载PDF
基于OpenMP的快速并行分层算法 被引量:9
17
作者 马旭龙 林峰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第4期747-753,共7页
为了充分利用现有的多核CPU计算资源,提出一种基于OpenMP框架的快速并行分层算法,并对其性能进行讨论.该算法利用模型自然分组特征建立拓扑关系分组,使得模型拓扑数据结构的建立时间缩短;在此基础上,采用基于OpenMP的多线程计算,将拓扑... 为了充分利用现有的多核CPU计算资源,提出一种基于OpenMP框架的快速并行分层算法,并对其性能进行讨论.该算法利用模型自然分组特征建立拓扑关系分组,使得模型拓扑数据结构的建立时间缩短;在此基础上,采用基于OpenMP的多线程计算,将拓扑结构的建立过程和求取层片轮廓的过程并行化计算,可以取得接近CPU核数的加速比,因此分层时间明显降低.对于复杂三维模型的超大STL文件进行分层处理,实例计算表明文中算法是一种高效且易于实现的方法. 展开更多
关键词 增材制造 STL分层 openmp框架 并行分层算法
下载PDF
基于OpenMP的3维粒子模拟并行计算 被引量:1
18
作者 廖臣 李正浩 +3 位作者 周俊 刘大刚 张开春 刘盛纲 《强激光与粒子束》 EI CAS CSCD 北大核心 2010年第8期1919-1924,共6页
基于OpenMP标准分别设计了粒子模拟方法中电磁场计算、粒子运动求解、电荷密度和电流密度更新的并行计算实现算法。在多核计算机上对所设计并行算法进行了性能测试和分析,根据分析结果在3维并行粒子模拟软件CHIPIC3D上实现了基于OpenMP... 基于OpenMP标准分别设计了粒子模拟方法中电磁场计算、粒子运动求解、电荷密度和电流密度更新的并行计算实现算法。在多核计算机上对所设计并行算法进行了性能测试和分析,根据分析结果在3维并行粒子模拟软件CHIPIC3D上实现了基于OpenMP的并行计算功能,并应用其对一种扩展互作用振荡器进行了基于OpenMP的并行模拟和基于OpenMP/MPI混合模式的并行模拟。模拟结果表明并行算法正确并能取得较高的加速比。 展开更多
关键词 粒子模拟 openmp 并行计算 扩展互作用振荡器
下载PDF
基于OPENMP求解旅行商问题的并行蚁群算法 被引量:8
19
作者 刘向娇 吴素萍 刘佳梅 《微电子学与计算机》 CSCD 北大核心 2011年第7期149-151,155,共4页
蚁群算法具有自组织性、正反馈性、较强的鲁棒性和天生的并行性等优点,不足之处是需要较长的搜索时间.为了解决其搜索时间过长的问题,文中提出了一种并行实现策略,用OPENMP应用编程接口采用C++语言编程实现,能明显减少搜索所用的时间.... 蚁群算法具有自组织性、正反馈性、较强的鲁棒性和天生的并行性等优点,不足之处是需要较长的搜索时间.为了解决其搜索时间过长的问题,文中提出了一种并行实现策略,用OPENMP应用编程接口采用C++语言编程实现,能明显减少搜索所用的时间.给出了一种解决旅行商问题(TSP)的并行蚁群算法,并通过串并算法执行时间的比较,说明并行算法的优越性. 展开更多
关键词 蚁群算法 并行算法 openmp 旅行商问题
下载PDF
基于OpenMP的压缩感知多描述并行处理算法 被引量:1
20
作者 巫小婷 邓家先 +1 位作者 任玉莉 杨扬 《计算机应用研究》 CSCD 北大核心 2013年第4期1278-1280,共3页
针对压缩感知算法重建时间长、图像重建质量不高等不足,在认真分析压缩感知算法的基础上,提出一种压缩感知多描述并行算法。为了提高系统运行速度和重建图像质量,将经过稀疏变换后的系数进行交织抽取,分成多个子图像,再利用OpenMP将子... 针对压缩感知算法重建时间长、图像重建质量不高等不足,在认真分析压缩感知算法的基础上,提出一种压缩感知多描述并行算法。为了提高系统运行速度和重建图像质量,将经过稀疏变换后的系数进行交织抽取,分成多个子图像,再利用OpenMP将子图像分配到各线程中并行实现分块压缩感知。实验结果表明,随着抽取数的增加,图像的重建质量呈上升趋势,在32-抽取时图像的重建质量比单抽取的高出了7.24 dB;随着线程数的增加,程序的执行效率不断提高,最高可达单线程的7.35倍,有效地解决了压缩感知算法重建时间长以及图像重建质量差的问题。 展开更多
关键词 压缩感知 多描述 openmp 并行 交织抽取 加速比
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部