期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
面向多核CPU与GPU平台的图处理系统关键技术综述 被引量:1
1
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核cpugpu平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
下载PDF
Partitioned k-Exclusion Real-Time Locking Protocol Motivated by Multicore Multi-GPU Systems
2
作者 Mao-Lin Yang Hang Lei +1 位作者 Yong Liao Ze-Wei Chen 《Journal of Electronic Science and Technology》 CAS CSCD 2016年第3期193-198,共6页
Graphic processing units (GPUs) have been widely recognized as cost-efficient co-processors with acceptable size, weight, and power consumption. However, adopting GPUs in real-time systems is still challenging, due ... Graphic processing units (GPUs) have been widely recognized as cost-efficient co-processors with acceptable size, weight, and power consumption. However, adopting GPUs in real-time systems is still challenging, due to the lack in framework for real-time analysis. In order to guarantee real-time requirements while maintaining system utilization ~in modern heterogeneous systems, such as multicore multi-GPU systems, a novel suspension-based k-exclusion real-time locking protocol and the associated suspension-aware schedulability analysis are proposed. The proposed protocol provides a synchronization framework that enables multiple GPUs to be efficiently integrated in multicore real-time systems. Comparative evaluations show that the proposed methods improve upon the existing work in terms of schedulability. 展开更多
关键词 Embedded systems graphic processing units(gpus) heterogeneous systems locking protocols MULTICORE real-time systems
下载PDF
CPU-GPU系统中基于剖分的全局性能优化方法 被引量:10
3
作者 张保 董小社 +3 位作者 白秀秀 曹海军 刘超 梅一多 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右. 展开更多
关键词 cpu-gpu异构并行系统 全局优化 3级优化 3级剖分
下载PDF
一种基于关键路径分析的CPU-GPU异构系统综合能耗优化方法 被引量:18
4
作者 林一松 杨学军 +2 位作者 唐滔 王桂彬 徐新海 《计算机学报》 EI CSCD 北大核心 2012年第1期123-133,共11页
GPU强大的计算性能使得CPU-GPU异构体系结构成为高性能计算领域热点研究方向.虽然GPU的性能/功耗比较高,但在构建大规模计算系统时,功耗问题仍然是限制系统运行的关键因素之一.现在已有的针对GPU的功耗优化研究主要关注如何降低GPU本身... GPU强大的计算性能使得CPU-GPU异构体系结构成为高性能计算领域热点研究方向.虽然GPU的性能/功耗比较高,但在构建大规模计算系统时,功耗问题仍然是限制系统运行的关键因素之一.现在已有的针对GPU的功耗优化研究主要关注如何降低GPU本身的功耗,而没有将CPU和GPU作为一个整体进行综合考虑.文中深入分析了CUDA程序在CPU-GPU异构系统上的运行特点,归纳其中的任务依赖关系,给出了使用AOV网表示程序执行过程的方法,并在此基础上分析程序运行的关键路径,找出程序中可以进行能耗优化的部分,并求解相应的频率调节幅度,在保持程序性能不变的前提下最小化程序的整体能量消耗. 展开更多
关键词 异构系统 gpu AOV网络 动态电压/频率调节 低功耗优化
下载PDF
基于CPU/GPU异构平台的全波形反演及其实用化分析 被引量:12
5
作者 张猛 王华忠 +3 位作者 任浩然 冯波 隋志强 王延光 《石油物探》 EI CSCD 北大核心 2014年第4期461-467,共7页
全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实... 全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实现流程。理论模型测试结果表明,该算法不仅对速度模型具有高精度刻画能力,而且计算效率比基于CPU集群的FWI算法大幅提升。对胜利探区某陆上区块实际地震资料进行全波形速度反演试处理,取得了初步的应用效果。在此基础上,讨论了FWI对实际地震资料质量的要求,就FWI在陆上地震资料的生产性应用提出了相应的策略。 展开更多
关键词 地震反问题 全波形反演 速度估计 cpu gpu异构平台 陆上地震资料
下载PDF
CPU/GPU异构混合并行的栅格数据空间分析研究——以地形因子计算为例 被引量:9
6
作者 卢敏 王金茵 +2 位作者 卢刚 陶伟东 王结臣 《计算机工程与应用》 CSCD 北大核心 2017年第1期172-177,共6页
海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的... 海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的设备间任务划分,进行CPU与GPU异构混合的并行技术改良研究。实验结果表明,基于相同的单机硬件环境,与多核共享内存模型或众核流处理器的单一计算平台并行方案相比,CPU/GPU异构混合并行计算方法对于栅格数据分析具有更好的加速效果。 展开更多
关键词 GIS栅格数据分析 共享内存模型 流处理器模型 cpu/gpu异构混合并行
下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:6
7
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
8
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 cpu-gpu异构计算 计算统一设备架构 OpenMP
下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
9
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
下载PDF
CPU-GPU异构系统在光学遥感影像处理中的应用 被引量:6
10
作者 党源源 王昕 《红外与激光工程》 EI CSCD 北大核心 2020年第S01期177-185,共9页
近年来,CPU-GPU异构系统在光学遥感影像数据处理领域的应用得到了广泛关注。首先介绍CPU-GPU异构系统的体系架构及发展历程。其次,介绍光学遥感影像数据处理流程。接下来,对CPU-GPU异构系统在光学遥感影像预处理、后续处理领域应用现状... 近年来,CPU-GPU异构系统在光学遥感影像数据处理领域的应用得到了广泛关注。首先介绍CPU-GPU异构系统的体系架构及发展历程。其次,介绍光学遥感影像数据处理流程。接下来,对CPU-GPU异构系统在光学遥感影像预处理、后续处理领域应用现状进行介绍。最后对CPU-GPU异构系统在光学遥感影像数据处理系统中的应用进行分析和总结,分析可知,CPU-GPU异构系统在光学遥感影像数据处理领域应用具有可行性且前景广阔,但仍需解决算法并行化设计、优化及CPU和GPU负载平衡等关键问题,这对推动CPU-GPU异构系统在光学遥感影像数据处理中的应用具有重要意义。 展开更多
关键词 遥感影像数据处理 异构系统 并行处理 gpu
下载PDF
多核CPU-GPU协同的并行深度优先算法 被引量:2
11
作者 余莹 李肯立 《计算机应用研究》 CSCD 北大核心 2014年第10期2982-2985,共4页
针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的... 针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的多核执行;GPU执行。混合算法为每种大小的图提供相对更好的性能,且能避免高直径图上的最坏情况。通过比较多CPU和GPU系统,分析底层架构对DFS性能的影响。实验结果表明,一个高端single-socket GPU系统的DFS执行性能相当于一个高端4-socket CPU系统。 展开更多
关键词 多核cpu gpu 深度优先搜索 并行 异构
下载PDF
异构集群中CPU与GPU协同调度算法的设计与实现 被引量:5
12
作者 高原 顾文杰 +3 位作者 丁雨恒 彭晖 陈泊宇 顾雯轩 《计算机工程与设计》 北大核心 2020年第2期592-600,F0003,共10页
为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异... 为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异构集群的传输和处理效率。该算法实现了集群各节点“能者多劳”,避免了单节点性能瓶颈造成的任务长尾现象。实验结果表明,该算法较传统MPI/GPU并行计算性能提高了11倍。 展开更多
关键词 异构 集群 中央处理器 图形处理器 协同调度 算法
下载PDF
逆时深度偏移成像方法及其在CPU/GPU异构平台上的实现 被引量:9
13
作者 赵磊 王华忠 刘守伟 《岩性油气藏》 CSCD 2010年第F07期36-41,共6页
逆时深度偏移的优点可以用来对全波场逆时外推,使得来自高角度反射界面的反射波。甚至来自超过90°反射界面的反射波精确成像。逆时深度偏移涉及到2个重要问题:精确且高效的逆时波场外推算法及反射波的成像条件。文中提出了修改... 逆时深度偏移的优点可以用来对全波场逆时外推,使得来自高角度反射界面的反射波。甚至来自超过90°反射界面的反射波精确成像。逆时深度偏移涉及到2个重要问题:精确且高效的逆时波场外推算法及反射波的成像条件。文中提出了修改的激励时间成像条件:在反射界面处,反射波出发时等于入射波到达时。认为用反射界面上某成像点与法线方向对称的波矢量所定义的波场进行相关成像是完善的成像条件。边界条件的处理借鉴Robert提出的随机边界,这可以提高波场外推算法的并行性。关于存储,认为牺牲一次正向波场外推,先把波场正传到最大时间,然后与观测波场同时逆时外推并成像,在GPU/CPU计算机平台上是比较合适的方案,这样就彻底抛弃了正向外推波场的存储。数值试验验证了分析的正确性。 展开更多
关键词 逆时偏移 高阶有限差分 gpu/cpu平台 随机边界条件
下载PDF
基于CPU-GPU异构并行的复杂场地近断层地震动谱元法模拟 被引量:5
14
作者 巴振宁 赵靖轩 +1 位作者 吴孟桃 梁建文 《地震学报》 CSCD 北大核心 2022年第1期182-193,共12页
利用基于CUDA编程平台实现的工作站级CPU-GPU异构并行方法开展了实际场地近断层地震动谱元法模拟.通过模拟SECE/USGS提供的自发破裂模型TPV15,测试了工作站级CPU-GPU异构并行方法的计算精度与计算效率,并将该方法应用于1679年三河—平谷... 利用基于CUDA编程平台实现的工作站级CPU-GPU异构并行方法开展了实际场地近断层地震动谱元法模拟.通过模拟SECE/USGS提供的自发破裂模型TPV15,测试了工作站级CPU-GPU异构并行方法的计算精度与计算效率,并将该方法应用于1679年三河—平谷M8.0地震的强地面运动模拟,以证实该方法对真实设定地震动模拟的适用性.模拟结果显示:CPU-GPU异构并行计算时间较CPU并行计算时间明显减少,加速比最高值分别为CPU 36核和72核的3.04和2.16倍;1679年三河—平谷M8.0地震的强地面模拟结果清晰地体现出近断层地震动的集中性、破裂的方向性、速度脉冲和永久位移等近断层地震动特征以及真实地形对近断层地震动所产生的影响.结果表明,CPU-GPU异构并行方法有效地提高了谱元法模拟的计算效率,可应用于大尺度复杂场地地震波场模拟. 展开更多
关键词 cpu-gpu异构 复杂场地 近断层地震动 谱元法
下载PDF
基于SVM的CPU-GPU异构系统任务分配模型 被引量:4
15
作者 王彦华 乔建忠 +1 位作者 林树宽 赵廷磊 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第8期1089-1094,共6页
为了改善异构系统的性能和效率,提出并实现了一个两阶段的任务分配模型.该模型对预分配给CPU和GPU的任务集进行多轮调整,以此最大程度地缩短程序的执行时间.首先,使用支持向量机进行任务预处理,支持向量机将任务分成CPU型和GPU型;然后,... 为了改善异构系统的性能和效率,提出并实现了一个两阶段的任务分配模型.该模型对预分配给CPU和GPU的任务集进行多轮调整,以此最大程度地缩短程序的执行时间.首先,使用支持向量机进行任务预处理,支持向量机将任务分成CPU型和GPU型;然后,根据预处理结果以及处理器的特征和状态,并在对分配集合进行多轮调整后实施实际的任务分配.本模型在具体的异构系统中实现,使用多种基准程序进行检测.实验结果表明,对比其他任务分配算法,本文算法能够使性能获得平均43.54%的提升. 展开更多
关键词 图形处理单元 支持向量机 异构系统 机器学习 任务预处理 任务分配
下载PDF
CPU/GPU系统负载均衡的可分负载调度 被引量:2
16
作者 彭江泉 钟诚 《计算机工程与设计》 CSCD 北大核心 2013年第11期3916-3923,共8页
针对具有多个片上多核处理器CMP和多个GPU的异构系统,综合考虑多核CPU和GPU的不同计算能力、各级缓存不同容量、CPU和GPU之间通信代价以及GPU内部结构等因素,采取计算与通信重叠、对任务自动划分、GPU端线程块大小和维度自动设置、多个... 针对具有多个片上多核处理器CMP和多个GPU的异构系统,综合考虑多核CPU和GPU的不同计算能力、各级缓存不同容量、CPU和GPU之间通信代价以及GPU内部结构等因素,采取计算与通信重叠、对任务自动划分、GPU端线程块大小和维度自动设置、多个异步流同时传输的方法,通过切换线程块执行以隐藏访存开销,提出一种均衡CPU和GPU负载、高效的可分负载多轮调度算法。采用计算密集型任务Mandelbrot进行实验测试,测试结果表明,与已有算法相比,该算法的调度性能有明显提升。 展开更多
关键词 cpu gpu异构系统 可分负载 调度算法 协同计算 负载均衡 多级缓存
下载PDF
碳酸盐岩储层叠前逆时偏移及GPU/CPU异构计算方案研究 被引量:1
17
作者 王阔 陈红灵 +2 位作者 郭聪 张文武 叶飞 《当代化工》 CAS 2014年第10期2042-2045,共4页
针对碳酸盐岩储层地质构造的特点,提出采用基于声波方程的叠前逆时偏移算法对其进行成像,并在偏移过程中引入优化差分系数和完全匹配层(PML)边界条件来提高波场的数值模拟精度,同时利用GPU/CPU异构并行加速技术对算法进行优化,从而显著... 针对碳酸盐岩储层地质构造的特点,提出采用基于声波方程的叠前逆时偏移算法对其进行成像,并在偏移过程中引入优化差分系数和完全匹配层(PML)边界条件来提高波场的数值模拟精度,同时利用GPU/CPU异构并行加速技术对算法进行优化,从而显著提升偏移的计算效率。模型测试表明,与传统差分系数相比,同阶的优化差分系数具有更高精度,压制频散效果明显;PML边界条件能够有效的吸收边界反射,减少边界反射对有效波场的干扰;叠前逆时偏移方法可有效识别碳酸盐岩模型中的小尺寸孔洞和裂缝,归为准确,刻画清晰,对碳酸盐岩储层成像具有显著优势;GPU/CPU异构并行加速技术可明显提高偏移的计算效率,与传统CPU算法相比,加速比可达60倍,对于实际推广应用具有重要意义。 展开更多
关键词 碳酸盐岩 叠前逆时偏移 PML gpu/cpu异构加速
下载PDF
CPU+GPU异构环境下数据密集型矢量多边形地理大数据并行框架 被引量:2
18
作者 徐云耘 周琛 李满春 《测绘通报》 CSCD 北大核心 2022年第5期110-119,共10页
本文提出了面向CPU+GPU异构环境的数据密集型矢量多边形地理大数据并行计算框架(PFGAP)。PFGAP将数据密集型矢量多边形地理大数据的并行计算分解为算子、数据、粒度、并行环境及任务调度5个模块,分别设计相应的负载均衡并行计算策略;通... 本文提出了面向CPU+GPU异构环境的数据密集型矢量多边形地理大数据并行计算框架(PFGAP)。PFGAP将数据密集型矢量多边形地理大数据的并行计算分解为算子、数据、粒度、并行环境及任务调度5个模块,分别设计相应的负载均衡并行计算策略;通过封装并行计算实现细节及数据密集型多边形算子的快速并行化。试验采用多边形三角剖分、栅格化及投影变换作为测试算例,采用土地利用数据作为测试数据,在不同类型的并行环境中计算并行效率。结果表明,PFGAP能很好地适用于不同类型的数据集、算子及并行计算环境。利用PFGAP实现的并行算法显著地降低了串行执行时间,取得了40.03的最优并行加速比。试验还分别测试了各个模块涉及的并行策略,结果表明取得的并行效率优于现有并行策略。 展开更多
关键词 地理信息系统 矢量多边形 空间计算 cpu+gpu异构并行环境 并行框架
下载PDF
CPU-GPU异构计算框架下的高性能用电负荷预测 被引量:8
19
作者 赵嘉豪 周赣 +3 位作者 黄莉 陆春艳 陶晓峰 冯燕钧 《电力自动化设备》 EI CSCD 北大核心 2021年第11期140-146,198,共8页
随着电网的快速发展,用电信息采集系统的数据计算业务面临着巨大挑战。近年来,图形处理器(GPU)因其在浮点计算速度和存储带宽方面的优势成为高性能计算问题中的研究热点,也被成功应用在电力系统计算分析等科学计算领域。在基于人工智能... 随着电网的快速发展,用电信息采集系统的数据计算业务面临着巨大挑战。近年来,图形处理器(GPU)因其在浮点计算速度和存储带宽方面的优势成为高性能计算问题中的研究热点,也被成功应用在电力系统计算分析等科学计算领域。在基于人工智能方法的电力负荷预测问题中,以往大部分研究仅考虑了使用GPU加速预测模型的训练,而并未应用在数据集的获取和计算上。提出了一种基于中央处理器-图形处理器(CPU-GPU)异构计算框架下全流程加速的高性能用电负荷预测方案。首先结合统一计算架构(CUDA)和多线程技术实现了使用多台GPU完成用电负荷的并行预处理,随后在聚类分析后基于XGBoost算法完成了多台区负荷预测,并利用GPU加速了模型的训练计算。最后通过对深圳市43254个台区用电信息的实例分析,验证了所提方法的高效性与适用性。 展开更多
关键词 用电信息采集系统 负荷预测 gpu 异构计算 XGBoost
下载PDF
关于CPU+GPU异构计算的研究与分析 被引量:5
20
作者 许桢 《科技信息》 2010年第17期I0097-I0097,I0014,共2页
在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是... 在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是随着通用计算程序接口(OpenCL)的发布,CPU+GPU的异构化计算这种看起来像是CPU和GPU混合体的出现,相信这将使计算机处理器又将迈上一个新台阶,这种异构化成就的是更加高性能,更加高性价比的处理器,而这必将掀起GPU和CPU革命的高潮。 展开更多
关键词 中央处理器(cpu) 图形处理器(gpu) 整合 异构计算
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部