期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于DFS的并行粒度计算模型及其应用
1
作者 苏频 《江南大学学报(自然科学版)》 CAS 2010年第2期217-220,共4页
针对粒度计算在并行计算中的工作机理,基于动态模糊集理论给出并行粒度计算模型和算法,并进行范例系统分析,结果表明该算法是有效的,从而进一步丰富了粒度计算的内容。
关键词 动态模糊集理论 粒度计算 并行粒度计算模型 教学评价
下载PDF
全球气象资料质量控制的一种粗粒度并行计算调度策略 被引量:5
2
作者 张理论 赵军 +1 位作者 宋君强 李晓梅 《计算机工程与科学》 CSCD 2000年第6期5-7,共3页
本文针对中期数值预报全球资料同化系统中的质量控制并行计算问题 ,在分析最优插值方法和盒方法的基础上 ,提出了一种负载平衡的计算调度策略。依据该策略 ,设计并实现了相应的粗粒度并行算法 。
关键词 粒度并行计算 调度策略 气象资料 数值预报
下载PDF
GPU/CPU协同粗粒度并行计算及在城市区域震害模拟中的应用 被引量:4
3
作者 韩博 熊琛 +1 位作者 陆新征 叶列平 《地震工程学报》 CSCD 北大核心 2013年第3期582-589,共8页
采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,... 采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,可以显著提高效率并降低成本。简述了所采用的程序架构、计算模型、参数选取,对并行计算的效率进行了详细的讨论,并通过一个中等大小城市的案例展示了该方法的优势。 展开更多
关键词 区域震害预测 GPU 集中质量剪切模型 粒度并行计算 协同计算
下载PDF
JXTA在粗粒度并行计算中的应用
4
作者 简清明 鲜乾坤 何绍荣 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第S1期192-194,共3页
介绍一个针对粗粒度并行计算的系统框架,该框架采用JXTA技术,适合众多的操作平台,允许对计算资源进行动态分布式的管理.
关键词 粒度并行计算 JXTA 点到点 模型
下载PDF
基于CUDA的细粒度并行计算模型研究 被引量:1
5
作者 肖汉 肖波 +1 位作者 冯娜 杨锦锦 《计算机与数字工程》 2013年第5期801-804,共4页
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备... 作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备架构(CUDA)技术,使得通用计算图形处理单元(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。论文从特性、组成和并行架构等几个方面对CUDA并行计算模型进行了研究,充分表明基于GPU进行高性能并行计算,是适应目前大规模计算需求的一个重要发展途径。 展开更多
关键词 图形处理器 图形处理器的通用计算 统一计算设备架构 粒度并行计算 单指令多数据
下载PDF
JXTA在粗粒度并行计算中的应用
6
作者 简清明 鲜乾坤 何绍荣 《重庆工业高等专科学校学报》 2004年第3期45-48,共4页
介绍一个针对粗粒度并行计算的系统框架,该框架采用JXTA技术,适合众多的操作平台,允许对计算资源进行动态分布式的管理。
关键词 粒度并行计算 JXTA 点到点模型
下载PDF
细粒度并行计算编程模型研究 被引量:10
7
作者 刘伟峰 王智广 《微电子学与计算机》 CSCD 北大核心 2008年第10期103-106,共4页
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种... 作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件. 展开更多
关键词 粒度并行计算 图形处理器 图形处理器的通用计算 CELL 统一计算设备架构
下载PDF
基于DFS的并行粒计算模型及其应用 被引量:1
8
作者 苏频 李凡长 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期66-69,共4页
粒计算是近几年提出的新概念。在粒计算领域中,动态模糊性是普遍存在的,而人们在用粒计算求解问题时又希望从并行角度来求解问题。因此,基于DFS,给出并行粒计算模型和算法,并用实例进行分析,说明该算法是有效的,从而进一步丰富了粒度计... 粒计算是近几年提出的新概念。在粒计算领域中,动态模糊性是普遍存在的,而人们在用粒计算求解问题时又希望从并行角度来求解问题。因此,基于DFS,给出并行粒计算模型和算法,并用实例进行分析,说明该算法是有效的,从而进一步丰富了粒度计算的研究内容。 展开更多
关键词 动态模糊集 动态模糊逻辑 并行粒度计算
下载PDF
细粒度显式并行体系结构微处理器设计 被引量:1
9
作者 王昭顺 王俊宇 王新辉 《计算机工程与应用》 CSCD 北大核心 2001年第11期36-38,共3页
文章在分析微处理器体系结构发展的基础上,利用文献[1]提出的显式硬件单元控制EHCC技术,设计了一个细粒度显式并行计算微处理器模型。仿真结果表明细粒度显式并行计算将是微处理器体系结构发展的理想方向。
关键词 微处理器 体系结构 粒度并行计算 指令 硬件单元控制
下载PDF
基于GPGPU的并行影像匹配算法 被引量:44
10
作者 肖汉 张祖勋 《测绘学报》 EI CSCD 北大核心 2010年第1期46-51,共6页
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实... 提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。 展开更多
关键词 粒度并行计算 图形处理器的通用计算 统一计算设备架构 影像匹配 单指令多线程
下载PDF
一种基于FPGA的变电站仿真模型并行解法
11
作者 张炳达 乔平 +1 位作者 王潇 陈雄 《智能电网》 2016年第10期1012-1018,共7页
为降低变电站培训仿真系统的建设成本,研究一种基于可编程逻辑器件(field-programmable gate array,FPGA)的变电站仿真模型并行解法。在分析梯形法和因子表法求解仿真模型的基础上,设计一种以乘–除–加运算为基本粒度的并行计算平台。... 为降低变电站培训仿真系统的建设成本,研究一种基于可编程逻辑器件(field-programmable gate array,FPGA)的变电站仿真模型并行解法。在分析梯形法和因子表法求解仿真模型的基础上,设计一种以乘–除–加运算为基本粒度的并行计算平台。为方便地进行消去节点排序和消去任务分配,用单线图描述变电站结构,并给出节点消去计算量与节点度之间的关系。为缩短仿真模型的求解时间,采用基于最小视在消去计算量的消去节点安排方法,以及等待方式与替代方式相结合的消去任务分配方法。实践表明,采用所提出的并行计算平台和任务分配策略,一个具有88?4个节点的变电站一次系统能以50?s仿真步长在一块EP3C120上运行。 展开更多
关键词 变电站 培训仿真 粒度并行计算 节点消去次序 任务分配策略
下载PDF
动态可扩展机群系统性能分析
12
作者 吴潜蛟 潘若禹 武奇生 《微电子学与计算机》 CSCD 北大核心 2010年第10期83-86,共4页
局域网机群系统是建立高性能计算环境的有效途径.定义机群系统抽象结构及性能模型是实现上述目标的关键.给出了机群m/w计算模型系统性能分析模型,通过大规模Monte Carlo仿真应用实验,证性能模型的有效性,研究成果对于机群系统建立提供... 局域网机群系统是建立高性能计算环境的有效途径.定义机群系统抽象结构及性能模型是实现上述目标的关键.给出了机群m/w计算模型系统性能分析模型,通过大规模Monte Carlo仿真应用实验,证性能模型的有效性,研究成果对于机群系统建立提供有效的组织、规划、实现方法. 展开更多
关键词 动态可扩展机群系统 主从(m/w)计算模型 SPMD应用 并行计算任务粒度
下载PDF
基于多核处理器的高清实时MPEG-2——H.264转码器设计 被引量:2
13
作者 叶朝敏 陈颖琪 高志勇 《电视技术》 北大核心 2012年第21期15-19,共5页
基于多核处理器的并行计算为实时实现高清MPEG-2至H.264转码器提供了1种可行的实现方案。提出了1种多颗粒度的MPEG-2—H.264全解全编并行转码器设计方案,其中MPEG-2解码器采用了帧内与数据级两级并行,H.264编码器采用了帧间、帧内与数... 基于多核处理器的并行计算为实时实现高清MPEG-2至H.264转码器提供了1种可行的实现方案。提出了1种多颗粒度的MPEG-2—H.264全解全编并行转码器设计方案,其中MPEG-2解码器采用了帧内与数据级两级并行,H.264编码器采用了帧间、帧内与数据级三级并行。实验结果表明本设计不仅具有良好的并行加速比,而且可以在使用1/4的TilePro64处理器核资源的条件下完成1路实时高清转码。 展开更多
关键词 MPEG-H.264转码器 Tilera多核处理器 粒度并行计算
下载PDF
遥感影像正射纠正的GPU-CPU协同处理研究 被引量:28
14
作者 杨靖宇 张永生 +1 位作者 李正国 龚辉 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2011年第9期1043-1046,共4页
提出了一种基于CUDA的遥感影像正射纠正GPU-CPU协同处理方法,以实现重采样操作的GPU细粒度并行化。根据GPU的并行结构和硬件特点,采用执行配置优化技术提高warp占有率,利用共享存储器优化减少对效率低下的全局存储器中坐标变换系数的重... 提出了一种基于CUDA的遥感影像正射纠正GPU-CPU协同处理方法,以实现重采样操作的GPU细粒度并行化。根据GPU的并行结构和硬件特点,采用执行配置优化技术提高warp占有率,利用共享存储器优化减少对效率低下的全局存储器中坐标变换系数的重复访问,通过纹理存储器代替全局存储器优化对原始影像数据的访问。实验结果表明,并行算法能够充分发挥GPU的并行处理能力,利用GeForce 9500 GT显卡,对大小为6 000像素×6 000像素的全色影像进行多项式纠正对比实验,最邻近灰度内插重采样和双线性灰度内插重采样的最终加速比分别能够达到8倍和10倍以上。 展开更多
关键词 正射纠正 图形处理器 统一计算设备架构 粒度并行计算
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部