期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
面向多任务的GPU通用计算虚拟化技术研究 被引量:3
1
作者 张云洲 袁家斌 吕相文 《计算机工程与科学》 CSCD 北大核心 2013年第11期119-125,共7页
随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU在通用计算领域的应用越来越广泛,使用GPU集群来进行海量数据计算的例子不胜枚举。但是,相对于CPU,GPU的功耗较大,如果每个节点都配备GPU,则将大大增加集群的功耗。虚拟化技术的引... 随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU在通用计算领域的应用越来越广泛,使用GPU集群来进行海量数据计算的例子不胜枚举。但是,相对于CPU,GPU的功耗较大,如果每个节点都配备GPU,则将大大增加集群的功耗。虚拟化技术的引入使得在虚拟机中利用GPU资源进行通用计算成为可能。为高效、充分地利用GPU,针对GPU的特点,提出了一种面向多任务的可动态调度、支持多用户并发的GPU虚拟化解决方案。在已有的GPU虚拟化方案的基础上,综合考虑虚拟机域间通信的通用性以及任务的周转时间,建立了CUDA管理端来对GPU资源进行统一管理。通过设置综合负载评价值实现负载均衡并降低任务的平均周转时间。在设计的系统上进行大规模矩阵运算实验,结果说明了GPU虚拟化方案在计算系统中的可行性和高效性。 展开更多
关键词 gpu通用计算 虚拟化 CUDA 负载均衡
下载PDF
基于通用计算的GPU-CPU协作计算模式研究 被引量:3
2
作者 崔雪冰 张延红 李国徽 《微电子学与计算机》 CSCD 北大核心 2009年第8期30-33,共4页
依据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,通过把问题或算法划分成多子任务,并对划分的子任务给出合理的调度算法,使GPU和CPU各自发挥特点,从而发挥较高效率的GPU通用计算能力,通过测试验证... 依据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,通过把问题或算法划分成多子任务,并对划分的子任务给出合理的调度算法,使GPU和CPU各自发挥特点,从而发挥较高效率的GPU通用计算能力,通过测试验证该协作模式是有效的. 展开更多
关键词 gpu通用计算 并行计算 协作计算模式 划分 任务调度 模型
下载PDF
GPU通用计算及其在计算智能领域的应用 被引量:15
3
作者 丁科 谭营 《智能系统学报》 CSCD 北大核心 2015年第1期1-11,共11页
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU... 在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU平台有着显著的优势。随着GPU体系结构的不断演进以及开发平台的逐步完善,GPU已经进入到高性能计算的主流行列。GPU通用计算的普及,使个人和小型机构能有机会获得以往昂贵的大型、超级计算机才能提供的计算能力,并一定程度上改变了科学计算领域的格局和编程开发模式。GPU提供的强大计算能力极大地推动了计算智能的发展,并且已经在深度学习和群体智能优化方法等子领域获得了巨大的成功,更是在图像、语音等领域取得了突破性的进展。随着人工智能技术和方法的不断进步,GPU将在更多的领域获得更加广泛的应用。 展开更多
关键词 计算智能 群体智能 演化算法 机器学习 深度学习 图形处理器 gpu通用计算 异构计算 高性能计算
下载PDF
基于GPU通用计算的图像体绘制 被引量:3
4
作者 吴井胜 鲍旭东 《生物医学工程研究》 2008年第3期175-178,192,共5页
基于GPU(graphic processing unit)的体绘制是体视化技术研究的重要分支。应用GPU通用计算改进基于GPU的图像体绘制,在体积图像处理、代理几何面生成、代理几何面渲染等体绘制过程中使用GPU通用计算技术,以提高绘制效率,改善图像质量。... 基于GPU(graphic processing unit)的体绘制是体视化技术研究的重要分支。应用GPU通用计算改进基于GPU的图像体绘制,在体积图像处理、代理几何面生成、代理几何面渲染等体绘制过程中使用GPU通用计算技术,以提高绘制效率,改善图像质量。实验证明,基于GPU通用计算的体绘制在交互性能和绘制效果方面均表现良好。 展开更多
关键词 体绘制 gpu通用计算 代理几何面
下载PDF
GPU通用计算软硬件处理架构研究 被引量:2
5
作者 谢建春 《航空计算技术》 2013年第2期56-59,共4页
现代GPU不仅是功能强劲的图形处理引擎,也是具有强大计算性能和存储带宽的高度并行可编程器件,能够与CPU构建完整的异构处理系统。而将GPU用于图形处理以外的计算,一般称之为GPU通用计算(General-Purpose computing on Graphics Process... 现代GPU不仅是功能强劲的图形处理引擎,也是具有强大计算性能和存储带宽的高度并行可编程器件,能够与CPU构建完整的异构处理系统。而将GPU用于图形处理以外的计算,一般称之为GPU通用计算(General-Purpose computing on Graphics Processing Unit,GPGPU)。对GPU通用计算的概念及分类、硬件架构及工作机制、软件环境及处理模型进行详细的研究,期望为GPU通用计算在航空嵌入式计算领域的进一步应用提供参考。 展开更多
关键词 gpu通用计算 异构系统 硬件架构 软件处理架构
下载PDF
基于GPU通用计算平台的乐谱自动识别系统设计
6
作者 谢晨伟 陆天翼 汤勇明 《电子器件》 CAS 北大核心 2015年第4期908-911,共4页
在GPU通用计算平台上实现了一个钢琴独奏乐曲的乐谱识别系统,它读取WAV格式音频文件,利用GPU通用计算技术加速自相关函数算法来实现音高的识别,并综合考虑短时能量和基音周期的变化进行节拍划分。通过实际测试,验证了该乐谱识别系统的... 在GPU通用计算平台上实现了一个钢琴独奏乐曲的乐谱识别系统,它读取WAV格式音频文件,利用GPU通用计算技术加速自相关函数算法来实现音高的识别,并综合考虑短时能量和基音周期的变化进行节拍划分。通过实际测试,验证了该乐谱识别系统的准确性,并证明了GPU并行计算对系统计算效率提升的效果:将计算时间减少到传统CPU计算时间的16%左右。 展开更多
关键词 gpu通用计算 自相关函数法 短时能量 乐谱识别
下载PDF
海量遥感数据的GPU通用加速计算技术
7
作者 洪亮 周松涛 +2 位作者 罗伊 石婷婷 胡飞 《地理空间信息》 2014年第3期23-26,5,共4页
通过研究GPU通用运算环境下栅格数据的空间域滤波及相关性算法,详细介绍了GPU通用运算技术;通过比较,分析了GPU通用加速计算的优势所在。
关键词 图像处理 空间域滤波 相关曲面 gpu通用运算 CUDA
下载PDF
基于GPU通用计算的并行算法和计算框架的实现 被引量:3
8
作者 朱宇兰 《山东农业大学学报(自然科学版)》 CSCD 2016年第3期473-476,480,共5页
GPU通用计算是近几年来迅速发展的一个计算领域,以其强大的并行处理能力为密集数据单指令型计算提供了一个绝佳的解决方案,但受限制于芯片的制造工艺,其运算能力遭遇瓶颈。本文从GPU通用计算的基础——图形API开始,分析GPU并行算法特征... GPU通用计算是近几年来迅速发展的一个计算领域,以其强大的并行处理能力为密集数据单指令型计算提供了一个绝佳的解决方案,但受限制于芯片的制造工艺,其运算能力遭遇瓶颈。本文从GPU通用计算的基础——图形API开始,分析GPU并行算法特征、运算的过程及特点,并抽象出了一套并行计算框架。通过计算密集行案例,演示了框架的使用方法,并与传统GPU通用计算的实现方法比较,证明了本框架具有代码精简、与图形学无关的特点。 展开更多
关键词 gpu通用计算 并行计算 计算框架
下载PDF
移动平台GPU通用计算研究综述
9
作者 周桐 王帅 +1 位作者 严章熙 朱虎明 《软件导刊》 2014年第10期1-3,共3页
近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器(Graphic Processing Unit,GPU)也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的GPU... 近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器(Graphic Processing Unit,GPU)也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的GPU通用计算进行了总结和归纳,发现GPU加速能力和低功耗特性是目前研究的重点。最后以Android操作系统为例,给出了基于开放计算语言(Open Computing Language,OpenCL)的并行计算环境构建思路。 展开更多
关键词 移动平台 gpu通用计算 加速能力 低功耗特性 并行计算
下载PDF
一种基于冗余线程的GPU多副本容错技术 被引量:8
10
作者 贾佳 杨学军 李志凌 《计算机研究与发展》 EI CSCD 北大核心 2013年第7期1551-1562,共12页
目前随着通用GPU(general purpose computation on graphic processing units,GPGPU)性能的不断提高,利用CPU和GPU构建的异构系统已经成为高性能计算领域的研究热点.然而随着并行计算系统的不断增长,系统可靠性越来越低,已成为并行计算... 目前随着通用GPU(general purpose computation on graphic processing units,GPGPU)性能的不断提高,利用CPU和GPU构建的异构系统已经成为高性能计算领域的研究热点.然而随着并行计算系统的不断增长,系统可靠性越来越低,已成为并行计算向大规模扩展的一个不容忽视的制约因素.由于商用GPGPU容错能力较弱,所以由CPU和GPU构建的大规模异构并行系统的可靠性问题更为尖锐,尚缺乏实用的容错手段,针对这一现实问题提出了一种基于冗余线程的GPU多副本容错技术:RB-TMR(Rollback TMR),同时根据异构系统的编程模型及程序特征对这一面向异构系统的容错机制的设计实现及其编译框架进行了具体分析和描述.最后通过10个案例对此技术进行了实现并评估了其性能.这一技术为异构系统的容错技术研究提供了新的思路,具有重大意义. 展开更多
关键词 通用gpu 异构系统 冗余线程 容错技术 多副本
下载PDF
基于GPU并行计算的巨幅遥感影像坐标转换研究与实现 被引量:5
11
作者 洪镇填 龚根生 《测绘与空间地理信息》 2016年第3期139-142,共4页
随着航空航天遥感技术的不断发展,以遥感影像为代表的栅格数据分辨率越来越高,遥感影像处理呈现出数据量大、复杂度高的特点。近年来,通用GPU的运算性能不断提高为加速密集运算提供了新的途径,目前,采用GPU并行技术进行遥感影像处理成... 随着航空航天遥感技术的不断发展,以遥感影像为代表的栅格数据分辨率越来越高,遥感影像处理呈现出数据量大、复杂度高的特点。近年来,通用GPU的运算性能不断提高为加速密集运算提供了新的途径,目前,采用GPU并行技术进行遥感影像处理成为新的研究热点。本文提出了基于GPU并行计算的巨幅遥感影像坐标转换方法,实践证明,相比于传统的转换方法基于GPU的算法有较为明显的提速。 展开更多
关键词 遥感影像 坐标转换 通用gpu 并行计算
下载PDF
ParaC:面向GPU平台的图像处理领域的编程框架 被引量:4
12
作者 卢兴敬 刘雷 +2 位作者 贾海鹏 冯晓兵 武成岗 《软件学报》 EI CSCD 北大核心 2017年第7期1655-1675,共21页
GPGPU加速器是当前提高图像处理算法性能的主流加速平台,但在GPGPU平台上,同一个程序充分利用硬件体系结构特征和软件特征的优化版本与简单实现版本在性能上会有数量级的差异.GPGPU加速器具有多维多层的大量执行线程和层次化存储体系结... GPGPU加速器是当前提高图像处理算法性能的主流加速平台,但在GPGPU平台上,同一个程序充分利用硬件体系结构特征和软件特征的优化版本与简单实现版本在性能上会有数量级的差异.GPGPU加速器具有多维多层的大量执行线程和层次化存储体系结构,后者的不同层次具有不同的容量、带宽、延迟和访问权限.同时,图像处理应用程序具有复杂的计算操作、边界处理规则和数据访问特性.因此,任务的并发执行模式、线程的组织方式和并发任务到设备的映射不仅影响到程序的并发度、调度、通信和同步等特性,而且也会影响到访存的带宽、延迟等.因此,GPGPU平台上的程序优化是一个困难、复杂且效率较低的过程.提出基于语言扩展的领域编程模型:Para C.Para C编程环境利用高层语言扩展描述的程序语义信息,自动分析获取应用程序的操作信息、并发任务间的数据重用信息和访存信息等程序特征,同时结合硬件平台特征,利用基于领域先验知识驱动的编译优化模型自动生成GPGPU平台上的优化代码,最后,利用源源变换编译器生成标准Open CL程序.在测试用例上的实验结果表明,ParaC在GPGPU平台上自动生成的优化版本相对于手工优化版本的加速比最高达到3.22倍,但代码行数只是后者的1.2%~39.68%. 展开更多
关键词 图像处理 通用gpu加速器 领域编程语言 编译优化 源源变换
下载PDF
虚拟化环境下多GPU并行计算研究 被引量:5
13
作者 闵芳 张志先 张玉洁 《微电子学与计算机》 CSCD 北大核心 2016年第3期69-75,共7页
针对大规模计算任务场景,提出在虚拟化环境下多GPU并行计算的实现方案,使用多线程或流处理的方式实现多GPU并行计算,并分析GPU多层次存储结构、传输等方面内容,采用经典的蒙特卡罗方法这一具有代表性的科学计算实例进行实验验证.
关键词 gpu通用计算 虚拟化 并行计算 蒙特卡罗
下载PDF
基于交错网格Fourier伪谱微分矩阵算子的地震波场模拟GPU加速方案 被引量:14
14
作者 龙桂华 李小凡 江东辉 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2964-2971,共8页
作为高精度波形反演或逆时偏移的重要组成部分,地震波数值模拟对计算速度和效率提出了更高要求.GPU通用计算技术的产生及其内在数据并行性,为高效地震波数值模拟应用和研究得以有效开展奠定了基础.本文借助交错网格的Fourier伪谱微分矩... 作为高精度波形反演或逆时偏移的重要组成部分,地震波数值模拟对计算速度和效率提出了更高要求.GPU通用计算技术的产生及其内在数据并行性,为高效地震波数值模拟应用和研究得以有效开展奠定了基础.本文借助交错网格的Fourier伪谱微分矩阵算子和GPU上高效矩阵乘法,实现了复杂介质中地震波模拟的高效算法.数值试验表明,优化后的GPU计算相比CPU单核计算在大规模二维地震波场计算中获得至少100x以上的加速比.这对我们快速分析目标反射层在地震剖面中同相轴位置,制定优化采集方案具有重要意义. 展开更多
关键词 伪谱微分矩阵算子 gpu通用计算 地震波高效正演模拟
下载PDF
基于GPU的视点相关自适应细分 被引量:7
15
作者 李胜 黄鑫 汪国平 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2007年第4期409-414,共6页
利用GPU的强大浮点数计算能力和并行处理能力,提出一种完全基于GPU的视点相关自适应细分内核进行快速细分计算的方法.在GPU中,依次实现视点相关的面片细分深度值计算、基于基函数表的细分表面顶点求值、细分表面绘制等核心步骤,无须与CP... 利用GPU的强大浮点数计算能力和并行处理能力,提出一种完全基于GPU的视点相关自适应细分内核进行快速细分计算的方法.在GPU中,依次实现视点相关的面片细分深度值计算、基于基函数表的细分表面顶点求值、细分表面绘制等核心步骤,无须与CPU端系统内存进行几何数据交换.视点相关的自适应细分准则在表面绘制精度保持不变的情况下,有效地降低了细分表面的细分深度和细分的计算量,在此基础上完全基于GPU的细分框架使得曲面细分具有快速高效的特点.该方法还可以在局部重要细节用较大深度值进行实时自适应细分,以逼近极限曲面. 展开更多
关键词 基于gpu通用计算 视点相关 自适应细分 细分深度
下载PDF
GPU虚拟化环境下的数据通信策略研究 被引量:4
16
作者 张玉洁 吕相文 张云洲 《计算机技术与发展》 2015年第8期24-28,共5页
虚拟化技术能够以较低的成本和能源消耗共享有效的资源,一些应用程序往往需要利用图形处理器来加快它们的计算以提高性能。但是由于虚拟化本身的特点,在GPU虚拟化环境下进行CUDA应用开发会带来很大的性能开销。此外,当采用多GPU并行处... 虚拟化技术能够以较低的成本和能源消耗共享有效的资源,一些应用程序往往需要利用图形处理器来加快它们的计算以提高性能。但是由于虚拟化本身的特点,在GPU虚拟化环境下进行CUDA应用开发会带来很大的性能开销。此外,当采用多GPU并行处理大规模的程序时,传统的GPU之间的数据交互方式是通过CPU来中转,不仅会带来"路程"上的开销,同时PCI-E相对于GPU显存的低带宽更是限制了数据传输的速率。针对以上问题,文中在Xen和VMware虚拟化平台下,针对CUDA应用的延迟和吞吐率找出最优的虚拟机间通讯方式,针对GPU之间不同的数据传输方式,找出最优通信方案,并从理论上和实验中分析出影响多GPU协同运算效率的因素。 展开更多
关键词 gpu通用计算 虚拟化 CUDA 数据通信
下载PDF
GBLHT:一种GPU加速的批量插入线性哈希表 被引量:2
17
作者 黄玉龙 奚建清 +2 位作者 张平健 方晓霖 刘勇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期49-56,共8页
为改善线性哈希表这一有效索引结构的插入性能,在分析现有方法的基础上,结合CUDA并行编程模型,设计并实现了一种基于GPU的批量插入线性哈希表GBLHT;借助原子函数atomicAdd,GBLHT可以充分利用GPU强大的并行吞吐量来实现大规模记录的无锁... 为改善线性哈希表这一有效索引结构的插入性能,在分析现有方法的基础上,结合CUDA并行编程模型,设计并实现了一种基于GPU的批量插入线性哈希表GBLHT;借助原子函数atomicAdd,GBLHT可以充分利用GPU强大的并行吞吐量来实现大规模记录的无锁批量插入;通过实验对比传统串行插入方法、CPU批量插入方法以及GBLHT的插入性能,发现在不同参数设置条件下,GBLHT的插入性能比传统串行方式提升了7~14倍,与4线程的CPU批量插入方法相比则提升了3~6倍. 展开更多
关键词 线性哈希表 图形加速器 gpu通用计算 无锁批量插入 内存数据索引结构 原子函数atomicAdd
下载PDF
基于GPU的高效图像协方差矩阵算法与实现 被引量:2
18
作者 陈彬 陈和平 李晓卉 《计算机工程与设计》 CSCD 北大核心 2014年第12期4238-4242,共5页
为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算进行有针对性的并行化优化,设计并实现一种高效的并行图像协方差矩阵算法。为在通用PC平台上使用协方差矩... 为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算进行有针对性的并行化优化,设计并实现一种高效的并行图像协方差矩阵算法。为在通用PC平台上使用协方差矩阵并满足实时性需求的各种图像处理应用提供了一个可行的解决方法,对其它领域涉及到协方差矩阵的实时计算也有良好的借鉴作用。与原有的CPU实现方法相比,GPU的效率有了平均数千倍的提升。 展开更多
关键词 协方差矩阵 并行计算 gpu通用计算 统一计算架构
下载PDF
基于通用计算的涪江中段径流模拟研究 被引量:1
19
作者 郭海燕 陈军 +2 位作者 徐金霞 徐沅鑫 马振峰 《冰川冻土》 CSCD 北大核心 2019年第1期158-164,共7页
为了提高传统径流汇流模拟的时效性,提出了一种基于通用计算的径流汇流模型。模型采用纳维-斯托克斯作为基础方程。首先,文章探讨了利用通用计算进行径流汇流模拟的实现方法并设计了模拟计算流程。然后,以涪江流域中段为研究区域,将流域... 为了提高传统径流汇流模拟的时效性,提出了一种基于通用计算的径流汇流模型。模型采用纳维-斯托克斯作为基础方程。首先,文章探讨了利用通用计算进行径流汇流模拟的实现方法并设计了模拟计算流程。然后,以涪江流域中段为研究区域,将流域内25个常规站和区域站的实况降水数据为数据源,分别利用本文径流汇流模型和FloodArea模型对流域进行径流模拟,并将两种模型模拟结果与水文站实测数据进行对比分析。结果发现,基于通用计算的径流汇流模型不仅在模拟效率上相对于FloodArea模型有很大程度的提高,而且模拟结果具有更小的水位变化误差,与水文站实测水文数据具有更好拟合效果。模拟时效性和结果准确性的同时提升表明本文的径流汇流模型对暴雨洪涝预警预报具有重要的意义。 展开更多
关键词 径流汇流模型 gpu通用计算 FloodArea模型 涪江中段
下载PDF
基于GPGPU的海量山地地形数据的实时绘制算法 被引量:3
20
作者 王春 马纯永 陈戈 《计算机应用》 CSCD 北大核心 2009年第8期2105-2108,共4页
针对山地地形海量数据的特点,基于GPU的GeometricalClipmap算法,应用简化的工作流程,结合GPGPU技术,采用了一种更为合理的高程数据组织交换模式,通过引入高程误差数据巧妙地解决不同分辨率之间的裂缝问题,并对高分辨率的遥感影像作为地... 针对山地地形海量数据的特点,基于GPU的GeometricalClipmap算法,应用简化的工作流程,结合GPGPU技术,采用了一种更为合理的高程数据组织交换模式,通过引入高程误差数据巧妙地解决不同分辨率之间的裂缝问题,并对高分辨率的遥感影像作为地形纹理的实现方法加以补充,进而实现可应用于虚拟现实系统的海量地形数据的实时可视化。 展开更多
关键词 基于gpu通用计算 几何体剪切图 山地地形 海量数据
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部