期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
基于GPU和CPU协同并行的三维各向异性介质地震波场正演模拟 被引量:2
1
作者 刘春成 顾汉明 +4 位作者 陈宝书 焦振华 马凯 蔡志成 张立 《地质科技情报》 CSCD 北大核心 2019年第5期240-246,共7页
莺歌海盆地中深部地层具有多套超低速层、异常高压、垂向裂隙发育等特点,使得介质具有各向异性,地震波场特征复杂,正演模拟是研究波场特征和观测系统优化的主要手段之一,而海上震源子频带宽、主频高,要求正演模拟网格剖分小,导致计算量... 莺歌海盆地中深部地层具有多套超低速层、异常高压、垂向裂隙发育等特点,使得介质具有各向异性,地震波场特征复杂,正演模拟是研究波场特征和观测系统优化的主要手段之一,而海上震源子频带宽、主频高,要求正演模拟网格剖分小,导致计算量大。为此,发展了基于GPU和CPU协同并行的海上三维各向异性介质正演模拟方法,通过将模型分割并分配到不同进程上和任意选择并行计算的方向和每个方向上并行计算的进程个数,不仅可以减小每个进程上内存消耗,而且减少计算时间。简单3D模型的正演模拟验证了该方法可极大地提高计算效率,复杂构造各向异性介质模型中的模拟炮集记录的偏移成像结果验证了方法的可靠性,可适用于任意各向异性介质地震波场正演模拟。 展开更多
关键词 三维各向异性介质 波动方程正演模拟 gpu和cpu协同并行
下载PDF
基于GPU\CPU协同并行计算的逆时偏移系统的实现策略
2
作者 韩超(文/图) 《能源新观察》 2024年第10期57-59,共3页
在石油天然气地震勘探数据处理方法中,逆时深度偏移以其近似条件要求低、成像精度高而一直是地震成像技术的发展方向。随着PC—Cluster集群的普及,逆时深度偏移的计算瓶颈开始得到解决,跨进了真正工业应用的门槛;而近年来通用用途GPU并... 在石油天然气地震勘探数据处理方法中,逆时深度偏移以其近似条件要求低、成像精度高而一直是地震成像技术的发展方向。随着PC—Cluster集群的普及,逆时深度偏移的计算瓶颈开始得到解决,跨进了真正工业应用的门槛;而近年来通用用途GPU并行计算技术的发展,又为逆时深度偏移生产处理开辟了一个大幅改善性价比的前景。本文通过对逆时深度偏移成像条件,波场重构的逆时递推关系,以及GPU\CPU协同并行计算方案的讨论,介绍了基于GPU\CPU协同并行计算的逆时偏移系统的实现策略。 展开更多
关键词 逆时深度偏析 gpu\cpu协同 系统实现
下载PDF
CPU/GPU协同并行计算研究综述 被引量:95
3
作者 卢风顺 宋君强 +1 位作者 银福康 张理论 《计算机科学》 CSCD 北大核心 2011年第3期5-9,46,共6页
CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GP... CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GPU协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。 展开更多
关键词 异构混合 协同并行计算 gpu计算 性能优化 可扩展
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
4
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
GPU/CPU协同粗粒度并行计算及在城市区域震害模拟中的应用 被引量:4
5
作者 韩博 熊琛 +1 位作者 陆新征 叶列平 《地震工程学报》 CSCD 北大核心 2013年第3期582-589,共8页
采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,... 采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,可以显著提高效率并降低成本。简述了所采用的程序架构、计算模型、参数选取,对并行计算的效率进行了详细的讨论,并通过一个中等大小城市的案例展示了该方法的优势。 展开更多
关键词 区域震害预测 gpu 集中质量剪切模型 粗粒度并行计算 协同计算
下载PDF
多核CPU-GPU协同的并行深度优先算法 被引量:2
6
作者 余莹 李肯立 《计算机应用研究》 CSCD 北大核心 2014年第10期2982-2985,共4页
针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的... 针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的多核执行;GPU执行。混合算法为每种大小的图提供相对更好的性能,且能避免高直径图上的最坏情况。通过比较多CPU和GPU系统,分析底层架构对DFS性能的影响。实验结果表明,一个高端single-socket GPU系统的DFS执行性能相当于一个高端4-socket CPU系统。 展开更多
关键词 多核cpu gpu 深度优先搜索 并行 异构
下载PDF
CPU和GPU协同并行加速多生物序列比对 被引量:5
7
作者 杨春燕 钟诚 《小型微型计算机系统》 CSCD 北大核心 2016年第12期2780-2784,共5页
将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,... 将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,利用阈值cutoff控制主库约减程度,设计实现CPU和多个GPU协同计算并行比对多生物序列的高效可扩展算法OGM SA.实验结果表明,当cutoff≤0.20时,算法OGM SA的比对结果质量与算法G-M SA相同,计算速度是G-M SA算法的近4倍,内存容量需求比G-MSA算法也有所降低. 展开更多
关键词 多生物序列 并行比对 计算窗口 cpugpu协同计算 主库约减
下载PDF
CPU/GPU异构环境下图像协同并行处理模型 被引量:6
8
作者 杨洪余 李成明 +1 位作者 王小平 姜青山 《集成技术》 2017年第5期8-18,共11页
随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域。目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力。文章在研究GPU编程... 随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域。目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力。文章在研究GPU编程模型和并行算法设计的基础上,提出了CPU/GPU异构环境下图像协同并行处理模型。该模型充分考虑异构系统中各处理单元的计算能力,通过图像中值滤波算法,验证了CPU/GPU环境下协同并行处理模型在高分辨率灰度图像处理中的有效性。实验结果表明,该模型在CPU/GPU异构环境下通用性较好,容易扩展到其他图像处理算法。 展开更多
关键词 gpu 图像处理 协同并行处理 模型 通用性
下载PDF
GPU\CPU协同并行计算提升叠前偏移成像效率
9
作者 张颢 陈军芳 张磊 《江汉石油科技》 2012年第2期18-19,共2页
由于图形处理芯片GPU(Graphic Processing Unit)拥有强大的通用计算能力,在地球物理领域进行GPu计算的应用研究日益受到关注。与通常情况下个人计算机(PC,Personal Computer)或者Pc集群所用的叠前时间偏移相比,本文方法可以较大... 由于图形处理芯片GPU(Graphic Processing Unit)拥有强大的通用计算能力,在地球物理领域进行GPu计算的应用研究日益受到关注。与通常情况下个人计算机(PC,Personal Computer)或者Pc集群所用的叠前时间偏移相比,本文方法可以较大地提高计算效率,从而在地震资料处理的实际工作中显著地节约计算成本和维护费用。通过实际应用实例表明,基于GPU\CPU-b]协同并行计算,能够适应目前石油勘探中大规模的计算需求,提高生产效率,因此值得将该方法拓展并将其推广应用于油气勘探工作中。 展开更多
关键词 图形处理芯片gpu 非对称走时叠前时间偏移 协同并行
下载PDF
CPU和GPU协同处理的光学卫星遥感影像正射校正方法 被引量:34
10
作者 方留杨 王密 李德仁 《测绘学报》 EI CSCD 北大核心 2013年第5期668-675,共8页
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GP... 系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。 展开更多
关键词 正射校正 cpugpu协同处理 层次性分块 配置选择优化 存储层次性访问
下载PDF
CPU/GPU异构混合并行的栅格数据空间分析研究——以地形因子计算为例 被引量:9
11
作者 卢敏 王金茵 +2 位作者 卢刚 陶伟东 王结臣 《计算机工程与应用》 CSCD 北大核心 2017年第1期172-177,共6页
海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的... 海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的设备间任务划分,进行CPU与GPU异构混合的并行技术改良研究。实验结果表明,基于相同的单机硬件环境,与多核共享内存模型或众核流处理器的单一计算平台并行方案相比,CPU/GPU异构混合并行计算方法对于栅格数据分析具有更好的加速效果。 展开更多
关键词 GIS栅格数据分析 共享内存模型 流处理器模型 cpu/gpu异构混合并行
下载PDF
CPU-GPU协同计算加速ASIFT算法 被引量:6
12
作者 何婷婷 芮建武 温腊 《计算机科学》 CSCD 北大核心 2014年第5期14-19,共6页
ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共... ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共享内存、合并访存,提高了数据访问效率。之后对ASIFT计算中的其它部分进行GPU优化,形成GASIFT。整个GASIFT计算过程中使用显存池来减少对显存的申请和释放。最后分别在CPU/GPU协同工作的两种方式上进行了尝试。实验表明,CPU负责逻辑计算、GPU负责并行计算的模式最适合于GASIFT计算,在该模式下GASIFT有很好的加速效果,尤其针对大、中图片。对于2048*1536的大图片,GASIFT与标准ASIFT相比加速比可达16倍,与OpenMP优化过的ASIFT相比加速比可达7倍,极大地提高了ASIFT在实时计算中应用的可能性。 展开更多
关键词 特征提取 ASIFT SIFT cpu gpu协同工作
下载PDF
大型复杂油藏CPU与GPU混合并行数值模拟 被引量:2
13
作者 廉培庆 计秉玉 +1 位作者 段太忠 姜凤光 《中国科技论文》 CAS 北大核心 2020年第5期537-541,共5页
为了实现大型复杂油藏混合并行数值模拟,通过高速InfiniBand网络连接多个机群的CPU节点,建立了新型计算平台,安装了并行油藏数值模拟软件系统,实现了大规模油藏数值模拟的并行计算。提出了不同CPU分区负载平衡优化方法,旨在研究GPU与CP... 为了实现大型复杂油藏混合并行数值模拟,通过高速InfiniBand网络连接多个机群的CPU节点,建立了新型计算平台,安装了并行油藏数值模拟软件系统,实现了大规模油藏数值模拟的并行计算。提出了不同CPU分区负载平衡优化方法,旨在研究GPU与CPU并行加速技术,提高大型复杂油藏数值模拟的时效性。以某油田为例,开展了多组分千万网格模型并行数值模拟的测试。测试结果显示:在保持各CPU分区负载平衡率高于90%的情况下,计算时间缩短了25%;随着CPU核数增加,加速比增幅逐渐减小;CPU与GPU混合并行,可比单纯CPU并行提速3.96~6.81倍,CPU核数越多,各分区数据交换量也随之增加,GPU承担的计算量增大。GPU与CPU并行加速技术及多组分千万网格模型并行数值模拟的实现,为实现复杂油藏精细地质和流体模拟提供了基础。 展开更多
关键词 组分模型 数值模拟 千万网格 负载平衡优化 cpugpu并行
下载PDF
CPU/GPU并行加速的多谐波正弦拟合算法 被引量:2
14
作者 陈建军 任勇峰 甄国涌 《中北大学学报(自然科学版)》 CAS 北大核心 2013年第6期636-641,共6页
多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的... 多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的基础上提出了一种基于加权最小二乘的多谐波正弦拟合算法.并结合遗传算法避免了四参数正弦拟合算法对初始估计频率的依赖,提高了算法的鲁棒性.将算法在CPU/GPU平台上进行了实现,提高了算法的执行效率.在CPU/GPU平台下对受相关噪声污染的多谐波正弦信号进行了分析.实验结果表明,相比基于遗传算法的多谐波正弦拟合算法,所提算法的谐波幅值估计精度提高了1个数量级,算法执行时间缩短了近96%. 展开更多
关键词 cpu gpu 多谐波正弦拟合 遗传算法 并行处理 参数估计
下载PDF
CPU/GPU协同运算技术在舰载警戒雷达实验室模拟仿真中的应用 被引量:2
15
作者 饶世钧 邢忠臣 洪俊 《实验室研究与探索》 CAS 北大核心 2017年第7期118-121,共4页
针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模... 针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模拟数据生成与回波显示方面的具体应用方法,明确了CPU/GPU协同运算基本流程与各自任务分工,建立了CPU雷达模拟仿真数据组织与生成模型,给出了GPU雷达回波渲染与显示方法,并采用向量元素的遍历查找算法完成雷达回波数据获取和雷达回波纹理数据更新。通过在通用计算机对传统CPU运算和CPU/GPU协同运算两种方法进行仿真,仿真结果证明了这一技术应用的可行性与先进性,这种技术的应用对于提高舰载警戒雷达模拟仿真效率与逼真度有着重要意义。 展开更多
关键词 舰载警戒雷达 cpu/gpu协同运算 回波渲染 模拟仿真 数据处理 回波显示
下载PDF
CPU/GPU协同计算在频率域二维全波形反演中的应用 被引量:2
16
作者 王小青 谭捍东 许自龙 《CT理论与应用研究(中英文)》 2016年第1期23-32,共10页
全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并... 全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并行计算,同时利用GPU技术加速正演过程中大型稀疏线性代数方程组的求解,以提高频率域全波形反演的计算效率。通过理论模型验证本文方法的正确性和有效性,给出不同数据量与GPU计算效率的相关分析结论,提出频率域全波形反演CPU/GPU协同并行计算的制约瓶颈和发展方向。 展开更多
关键词 频率域正演 稀疏矩阵 BI-CGSTAB cpu/gpu协同计算
下载PDF
一种CPU-GPU协同计算的三维地形实时渲染算法 被引量:9
17
作者 郭向坤 林浒 +1 位作者 刘继申 王鸿亮 《小型微型计算机系统》 CSCD 北大核心 2018年第4期825-829,共5页
提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模... 提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模型.为了避免相邻LOD模型出现裂缝,利用地形块的裂缝检测和删除顶点的方法消除裂缝;为了解决两个LOD层次的转换过程中出现地表突跳现象,采用morphing方法实现地形的平滑过渡.实验结果表明,该算法将大量的几何计算移植到GPU上并行计算,降低了CPU的计算负载,提高了LOD模型的构建效率,加快了场景的渲染速度. 展开更多
关键词 OPENCL cpugpu协同计算 LOD模型 平滑过渡
下载PDF
基于CPU/GPU处理器的雷达脉冲压缩算法并行机制研究 被引量:8
18
作者 彭培 张云雷 +1 位作者 李轲 席泽敏 《舰船电子工程》 2017年第10期30-32,107,共4页
为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算... 为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算法实现流程,分别从片上缓存、内核线程和数据并行等方面设计了三种GPU并行优化策略。仿真测试表明,所提出的GPU并行机制与典型多核CPU平台相比,具有更好的实时性能。 展开更多
关键词 cpu/gpu 并行机制 软件化雷达 脉冲压缩
下载PDF
CPU+GPU异构环境下数据密集型矢量多边形地理大数据并行框架 被引量:2
19
作者 徐云耘 周琛 李满春 《测绘通报》 CSCD 北大核心 2022年第5期110-119,共10页
本文提出了面向CPU+GPU异构环境的数据密集型矢量多边形地理大数据并行计算框架(PFGAP)。PFGAP将数据密集型矢量多边形地理大数据的并行计算分解为算子、数据、粒度、并行环境及任务调度5个模块,分别设计相应的负载均衡并行计算策略;通... 本文提出了面向CPU+GPU异构环境的数据密集型矢量多边形地理大数据并行计算框架(PFGAP)。PFGAP将数据密集型矢量多边形地理大数据的并行计算分解为算子、数据、粒度、并行环境及任务调度5个模块,分别设计相应的负载均衡并行计算策略;通过封装并行计算实现细节及数据密集型多边形算子的快速并行化。试验采用多边形三角剖分、栅格化及投影变换作为测试算例,采用土地利用数据作为测试数据,在不同类型的并行环境中计算并行效率。结果表明,PFGAP能很好地适用于不同类型的数据集、算子及并行计算环境。利用PFGAP实现的并行算法显著地降低了串行执行时间,取得了40.03的最优并行加速比。试验还分别测试了各个模块涉及的并行策略,结果表明取得的并行效率优于现有并行策略。 展开更多
关键词 地理信息系统 矢量多边形 空间计算 cpu+gpu异构并行环境 并行框架
下载PDF
全局基因调控网络构建CPU/GPU并行算法
20
作者 陈绪伟 钟诚 《小型微型计算机系统》 CSCD 北大核心 2015年第2期234-239,共6页
对基因表达谱分块,使之符合GPU并行计算的线程结构特性,根据GPU线程结构特性设计双层并行模式,并利用纹理缓存实现访存高效;依据CPU二级缓存容量对基本块进一步细分成子块以提高缓存命中率,利用数据预取技术减少访存次数,利用线程绑定... 对基因表达谱分块,使之符合GPU并行计算的线程结构特性,根据GPU线程结构特性设计双层并行模式,并利用纹理缓存实现访存高效;依据CPU二级缓存容量对基本块进一步细分成子块以提高缓存命中率,利用数据预取技术减少访存次数,利用线程绑定技术减少线程在核心之间的迁移;依据多核CPU和GPU的计算能力分配CPU和GPU的基因互信息计算任务以平衡CPU与GPU的计算负载;在设计新的阈值计算算法基础上,设计实现了访存高效的构建全局基因调控网络CPU/GPU并行算法.实验结果表明,与已有算法相比,本文算法加速更明显,并且能够构建更大规模的全局基因调控网络. 展开更多
关键词 全局基因调控网络 cpugpu协同计算 访存高效 并行算法
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部