期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
Parallel Image Processing: Taking Grayscale Conversion Using OpenMP as an Example
1
作者 Bayan AlHumaidan Shahad Alghofaily +2 位作者 Maitha Al Qhahtani Sara Oudah Naya Nagy 《Journal of Computer and Communications》 2024年第2期1-10,共10页
In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularl... In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularly noteworthy in the field of image processing, which witnessed significant advancements. This parallel computing project explored the field of parallel image processing, with a focus on the grayscale conversion of colorful images. Our approach involved integrating OpenMP into our framework for parallelization to execute a critical image processing task: grayscale conversion. By using OpenMP, we strategically enhanced the overall performance of the conversion process by distributing the workload across multiple threads. The primary objectives of our project revolved around optimizing computation time and improving overall efficiency, particularly in the task of grayscale conversion of colorful images. Utilizing OpenMP for concurrent processing across multiple cores significantly reduced execution times through the effective distribution of tasks among these cores. The speedup values for various image sizes highlighted the efficacy of parallel processing, especially for large images. However, a detailed examination revealed a potential decline in parallelization efficiency with an increasing number of cores. This underscored the importance of a carefully optimized parallelization strategy, considering factors like load balancing and minimizing communication overhead. Despite challenges, the overall scalability and efficiency achieved with parallel image processing underscored OpenMP’s effectiveness in accelerating image manipulation tasks. 展开更多
关键词 parallel Computing Image processing OPENMP parallel programming High Performance Computing GPU (Graphic processing Unit)
下载PDF
Parallelization of a Branch and Bound Algorithm on Multicore Systems 被引量:1
2
作者 Chia-Shin Chung James Flynn Janche Sang 《Journal of Software Engineering and Applications》 2012年第8期621-629,共9页
The general m-machine permutation flowshop problem with the total flow-time objective is known to be NP-hard for m ≥ 2. The only practical method for finding optimal solutions has been branch-and-bound algorithms. In... The general m-machine permutation flowshop problem with the total flow-time objective is known to be NP-hard for m ≥ 2. The only practical method for finding optimal solutions has been branch-and-bound algorithms. In this paper, we present an improved sequential algorithm which is based on a strict alternation of Generation and Exploration execution modes as well as Depth-First/Best-First hybrid strategies. The experimental results show that the proposed scheme exhibits improved performance compared with the algorithm in [1]. More importantly, our method can be easily extended and implemented with lightweight threads to speed up the execution times. Good speedups can be obtained on shared-memory multicore systems. 展开更多
关键词 parallel Branch and BOUND Multithreaded programming MULTICORE System PERMUTATION FLOWSHOP Software REUSE
下载PDF
VARIABLE-DRIVEN AND-PARALLELISM
3
作者 李春林 《Journal of Southeast University(English Edition)》 EI CAS 1991年第2期1-6,共6页
A Variable-driven model of AND-parallelism of logic programs isprcscntcd.It statically analyses the values of variables in clauses and picks out the varia.blcs contributing to the parallel execution and then generates... A Variable-driven model of AND-parallelism of logic programs isprcscntcd.It statically analyses the values of variables in clauses and picks out the varia.blcs contributing to the parallel execution and then generates the variable-driving graphsfor clauses.According to the variable-driving graph and the analysis of the instantiationsof variables at run,literals are driven to execute.With binding conflicts of shared variablesprevented,the variable-driven model fully develops the AND-parallelism.Based on thevariable-driving graph,somc models of AND-parallelism already put forward can beavailable if cquipcd with appropriate driving algorithms. 展开更多
关键词 parallel processing algorithm programming languages/logic programming
下载PDF
PARALLEL COMPUTATIONAL ALGORITHM OF SUBSTRUCTURE METHOD OF LARGE-SCALE STRUCTURE ANALYSIS
4
作者 张汝清 《Applied Mathematics and Mechanics(English Edition)》 SCIE EI 1991年第1期93-100,共8页
In this paper, according to the parallel environment of ELXSI computer, a parallel solving process of substructure method in static and dynamic analyses of large-scale and complex structure has been put forward, and t... In this paper, according to the parallel environment of ELXSI computer, a parallel solving process of substructure method in static and dynamic analyses of large-scale and complex structure has been put forward, and the corresponding parallel computational program has been developed. 展开更多
关键词 Computer programming ALGORITHMS Computer Systems Digital parallel processing
下载PDF
超大规模数据处理中并行计算技术的应用研究
5
作者 杨多海 《科技创新与应用》 2024年第17期181-184,共4页
随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过... 随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过分析并行计算在搜索引擎、气象预报和金融分析等中的实际案例,阐述并行计算技术在超大规模数据处理中的实际应用。 展开更多
关键词 并行计算技术 超大规模数据处理 编程模型与工具 实际案例 具体应用
下载PDF
面向GPU并行编程的线程同步综述
6
作者 高岚 赵雨晨 +2 位作者 张伟功 王晶 钱德沛 《软件学报》 EI CSCD 北大核心 2024年第2期1028-1047,共20页
并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GP... 并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GPU系统却难以高效地支持真实应用中复杂的线程同步.研究者虽然提出了很多支持GPU线程同步的方法并取得了较大进展,但GPU独特的体系结构及并行模式导致GPU线程同步的研究仍然面临很多挑战.根据不同的线程同步目的和粒度对GPU并行编程中的线程同步进行分类.在此基础上,围绕GPU线程同步的表达和执行,首先分析总结GPU线程同步存在的难以高效表达、错误频发、执行效率低的关键问题及挑战;而后依据不同的GPU线程同步粒度,从线程同步表达方法和性能优化方法两个方面入手,介绍近年来学术界和产业界对GPU线程竞争同步及合作同步的研究,对现有研究方法进行分析与总结.最后,指出GPU线程同步未来的研究趋势和发展前景,并给出可能的研究思路,从而为该领域的研究人员提供参考. 展开更多
关键词 通用图形处理器(GPGPU) 并行编程 线程同步 性能优化
下载PDF
A Neuron-Oriented Programming System 被引量:3
7
作者 李涛 《High Technology Letters》 EI CAS 2001年第1期70-73,共4页
A neruon-oriented programming system based on parallel neural information processing has been presented. With the neural programming system built upon 4~8 process elements(TMS C30), the system has thus provided users... A neruon-oriented programming system based on parallel neural information processing has been presented. With the neural programming system built upon 4~8 process elements(TMS C30), the system has thus provided users high speed, general purpose and large scale neural network application development platforms etc. 展开更多
关键词 Neural networks parallel processing programming system
下载PDF
GPU parallel computing: Programming language,debugging tools and data structures
8
作者 Kun ZHOU 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2012年第1期5-15,共11页
With many cores driven by high memory bandwidth, today's graphics processing unit (GPU) has involved into an absolute computing workhorse. More and more scientists, researchers and software developers are using GPU... With many cores driven by high memory bandwidth, today's graphics processing unit (GPU) has involved into an absolute computing workhorse. More and more scientists, researchers and software developers are using GPUs to accelerate their algorithms and ap- plications. Developing complex programs and software on the GPU, however, is still far from easy with ex- isting tools provided by hardware vendors. This article introduces our recent research efforts to make GPU soft- ware development much easier. Specifically, we designed BSGP, a high-level programming language for general- purpose computation on the GPU. A BSGP program looks much the same as a sequential C program, and is thus easy to read, write and maintain. Its performance on the GPU is guaranteed by a well-designed compiler that converts the program to native GPU code. We also developed an effective debugging system for BSGP pro- grams based on the GPU interrupt, a unique feature of BSGP that allows calling CPU functions from inside GPU code. Moreover, using BSGP, we developed GPU algorithms for constructing several widely-used spatial hierarchies for high-performance graphics applications. 展开更多
关键词 graphics processing unit /GPU) parallel computing programming languages debugging tools data structures
原文传递
MapReduce并行编程模型研究综述 被引量:185
9
作者 李建江 崔健 +2 位作者 王聃 严林 黄义双 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2635-2642,共8页
MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成... MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望. 展开更多
关键词 MAPREDUCE 并行编程模型 运行时支持库 海量数据处理
下载PDF
面向地震数据处理的并行与分布式编程框架 被引量:16
10
作者 赵长海 晏海华 +2 位作者 王宏琳 史晓华 王雷 《石油地球物理勘探》 EI CSCD 北大核心 2010年第1期146-155,共10页
本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CP... 本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CPU核的调度、通讯与节点故障恢复、模块之间的数据传输等并行编程细节。经过实验评估,GeoPF框架从串行到并行的线性加速性能有所提高,处理相同任务的时间从21h33min缩减到15min27s,效果显著。GeoPF与商用的地震数据处理系统相比,在业务流程方面有一些相同特点,其不同之处就是GeoPF的处理模块具有自动并行特点,而大部分地震处理模块只能是串行方式。 展开更多
关键词 并行执行模型 地震数据处理 编程框架 分布式 计算节点 地震资料处理 数据处理系统 串行方式
下载PDF
MapReduce并行编程模型研究综述 被引量:24
11
作者 杜江 张铮 +1 位作者 张杰鑫 邰铭 《计算机科学》 CSCD 北大核心 2015年第S1期537-541 564,564,共6页
MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集... MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集群中发挥出色的计算能力,且可节约成本。对国内外关于MapReduce并行编程模型的研究现状进行了综述,分析了目前国内外相关研究成果的优缺点,并对MapReduce并行编程模型的未来发展进行了展望。 展开更多
关键词 MAPREDUCE 并行编程模型 并行计算 海量数据处理
下载PDF
数据密集型计算编程模型研究进展 被引量:39
12
作者 王鹏 孟丹 +1 位作者 詹剑锋 涂碧波 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1993-2002,共10页
作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统... 作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统上研发了分布式编程系统.编程模型可以降低开发人员在大规模集群上编程的难度,并让程序充分利用集群资源,但设计这样的编程模型面临巨大挑战.首先说明了数据密集型计算的特点,并指出了编程模型要解决的基本问题;接着深入介绍了国际上代表性的编程模型,并对这些编程模型的特点进行了比较和分析;最后对当前所面临的问题和今后的发展趋势进行了总结和展望. 展开更多
关键词 云计算 数据密集型计算 编程模型 数据并行 海量数据处理 MAPREDUCE
下载PDF
多线程的软件实现 被引量:11
13
作者 李春华 徐明 周兴铭 《计算机工程与科学》 CSCD 1999年第4期17-21,共5页
由于多线程能够更好地开发并行性和提高系统性能,在体系结构、操作系统、运行库、程序设计语言各级增加对多线程的支持已成为一种趋势。本文从软件的角度分析说明多线程及其在实现上的差异。
关键词 进程 线程 多线程 软件 操作系统 内核
下载PDF
多核处理器并行程序的确定性重放研究 被引量:10
14
作者 高岚 王锐 钱德沛 《软件学报》 EI CSCD 北大核心 2013年第6期1390-1402,共13页
多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并... 多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并行程序的普及和发展.分析了多核处理器造成并行程序确定性重放难以实现的关键因素,总结了确定性重放的评价指标,综述了近年来学术界对并行程序确定性重放的研究.根据总结的评价指标,从纯软件方式和硬件支持方式对目前的确定性重放方法进行了分析与对比,并在此基础上对多核架构下并行程序的确定性重放未来的研究趋势和应用前景进行了展望. 展开更多
关键词 多核处理器 并行程序 确定性重放 多线程程序 数据竞争 调试
下载PDF
基于半连接的并行查询处理算法的研究 被引量:11
15
作者 王意洁 王勇军 卢锡城 《软件学报》 EI CSCD 北大核心 2001年第2期219-224,共6页
多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明... 多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明了其实用性和有效性 . 展开更多
关键词 半连接 并行数据库 并行查询处理算法 面向对象数据库
下载PDF
基于分层排队网络模型的MCU性能预测及优化研究 被引量:10
16
作者 边学工 胡瑞敏 +1 位作者 陈军 李德仁 《计算机学报》 EI CSCD 北大核心 2004年第2期209-215,共7页
针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该... 针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该方法可以较快地从多种设计方案或硬件平台中选择满足系统性能设计目标的软件或硬件配置 .仿真结果显示 ,选择双处理器配置和采用多线程技术 ,多点控制单元的接入容量提高了 5 0 % .最后 ,多点控制单元终端接入实验证明了该方法的有效性 . 展开更多
关键词 视频会议 多点控制单元 MCU 分层排队网络 接入容量
下载PDF
并联式混合动力汽车能量管理的马尔可夫决策 被引量:8
17
作者 肖仁鑫 李涛 +1 位作者 秦颖 邹敢 《西南交通大学学报》 EI CSCD 北大核心 2012年第6期982-988,共7页
为研究同轴并联式混合动力汽车的能量管理策略,建立了同轴并联式动力系统动态方程,分析了转矩需求无后效性的马尔可夫特性.在维持电池容量不变的条件下,以燃油消耗最小为优化目标,采用马尔可夫决策实施能量管理策略,并采用策略迭代方法... 为研究同轴并联式混合动力汽车的能量管理策略,建立了同轴并联式动力系统动态方程,分析了转矩需求无后效性的马尔可夫特性.在维持电池容量不变的条件下,以燃油消耗最小为优化目标,采用马尔可夫决策实施能量管理策略,并采用策略迭代方法求解了马尔可夫能量管理的转矩决策过程,在J1015工况和昆明工况进行了仿真,实现了能量管理的在线实施.结果表明,与基于动态规划的能量管理策略相比,马尔可夫决策的能量管理策略能在线实施,且电池容量变化更为平稳;在燃料消耗方面是全局次优的,在J1015行驶工况下100 km燃油消耗增加了1.32 L,在昆明行驶工况下100 km燃油消耗增加了1.59 L. 展开更多
关键词 能量管理 马尔可夫决策 动态规划 并联式混合动力汽车
下载PDF
多线程技术与并行计算 被引量:3
18
作者 张宏莉 田耕 胡铭曾 《计算机科学》 CSCD 北大核心 1999年第9期48-50,共3页
1 引言自七十年代以来,多线程技术已逐渐渗透到计算机体系结构的方方面面。出现了多线程结构的并行机,如Tera(1990),Stanford的DASH(1988),MIT的Alewife(1989),等;在操作系统方面,CMU的Mach/OS(1986),Solaris、AIX、Linux等Unix操作系统... 1 引言自七十年代以来,多线程技术已逐渐渗透到计算机体系结构的方方面面。出现了多线程结构的并行机,如Tera(1990),Stanford的DASH(1988),MIT的Alewife(1989),等;在操作系统方面,CMU的Mach/OS(1986),Solaris、AIX、Linux等Unix操作系统,以及目前流行的PC机操作系统Windows系列等。 展开更多
关键词 多线程 并行计算 体系结构 并行计算机
下载PDF
混合并行技术在激光化学反应模拟中的应用 被引量:4
19
作者 李鸿健 白明泽 +1 位作者 唐红 孙世新 《计算机应用》 CSCD 北大核心 2010年第6期1687-1689,共3页
为提高激光化学反应模拟效率,在半经典分子动力学模拟中引入混合并行技术和双层并行思想。基于MPI+OpenMP混合模型设计并实现激光化学反应双层并行模拟算法,上层基于MPI实现节点间的原子分解并行,下层基于OpenMP实现节点内的多线程矩阵... 为提高激光化学反应模拟效率,在半经典分子动力学模拟中引入混合并行技术和双层并行思想。基于MPI+OpenMP混合模型设计并实现激光化学反应双层并行模拟算法,上层基于MPI实现节点间的原子分解并行,下层基于OpenMP实现节点内的多线程矩阵并行乘法。在SMP集群中测试表明,模拟大分子体系激光化学反应并行效率可达60%以上。因此,应用混合并行技术可有效提高激光化学反应模拟效率。 展开更多
关键词 半经典分子动力学 混合并行技术 SMP集群 双层并行
下载PDF
同步合成Petri网系统活性与无死锁性的保持性 被引量:19
20
作者 蒲飞 陆维明 《软件学报》 EI CSCD 北大核心 2003年第12期1977-1988,共12页
合成操作是Petri网系统建模中一种重要的自底向上建模方法,而在Petri网系统的合成研究中,一些好性质,如活性、无死锁性、可回复性等的保持性,是一个重要的研究问题.研究了Petri网系统同步合成操作活性与无死锁性的保持性.与以往研究工... 合成操作是Petri网系统建模中一种重要的自底向上建模方法,而在Petri网系统的合成研究中,一些好性质,如活性、无死锁性、可回复性等的保持性,是一个重要的研究问题.研究了Petri网系统同步合成操作活性与无死锁性的保持性.与以往研究工作不同,基于路径的并发合成用并发语言的方法,提出并证明了同步合成Petri网系统的一个并发语言关系式.该语言关系式可用于判定同步合成Petri网系统的活性与无死锁性,同时给出了同步合成Petri网系统活性与无死锁性的充要条件.最后提出一些条件,在这些条件下,同步合成Petri网系统有活与无死锁的保持性质. 展开更多
关键词 同步合成操作 活性与无死锁性的保持性 并发语言 同步路径 路径并发合成
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部