期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
A Hybrid Parallel Strategy for Isogeometric Topology Optimization via CPU/GPU Heterogeneous Computing
1
作者 Zhaohui Xia Baichuan Gao +3 位作者 Chen Yu Haotian Han Haobo Zhang Shuting Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第2期1103-1137,共35页
This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstr... This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstrategy of CPU/GPU is proposed, while the hybrid parallel strategies for stiffness matrix assembly, equationsolving, sensitivity analysis, and design variable update are discussed in detail. To ensure the high efficiency ofCPU/GPU computing, a workload balancing strategy is presented for optimally distributing the workload betweenCPU and GPU. To illustrate the advantages of the proposedmethod, three benchmark examples are tested to verifythe hybrid parallel strategy in this paper. The results show that the efficiency of the hybrid method is faster thanserial CPU and parallel GPU, while the speedups can be up to two orders of magnitude. 展开更多
关键词 Topology optimization high-efficiency isogeometric analysis cpu/gpu parallel computing hybrid OpenMPCUDA
下载PDF
基于CPU-GPU混合编程的显微镜图像实时拼接
2
作者 吴为民 刘新 +2 位作者 李伙钦 江先伟 杨华 《重庆科技学院学报(自然科学版)》 CAS 2023年第3期67-74,共8页
随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CP... 随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CPU则负责逻辑控制部分的计算,提高了整体的运算效率。实验结果表明,CPU-GPU混合编程模式有效地缩短了显微镜图像拼接时间,提高了拼接的流畅度和实时性。 展开更多
关键词 电子显微镜 实时拼接 并行计算 cpu-gpu混合编程
下载PDF
Large-Eddy Simulation of Airflow over a Steep, Three-Dimensional Isolated Hill with Multi-GPUs Computing
3
作者 Takanori Uchida 《Open Journal of Fluid Dynamics》 2018年第4期416-434,共19页
The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence si... The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence simulations using approximately 50 million grid points are feasible and 2) the use of this system resulted in the achievement of a high computation speed, which exceeded the speed of parallel computation attained by a single CPU on one of the latest supercomputers. Furthermore, LES was conducted by using the multi-GPUs systems. The results of these simulations revealed the following findings: 1) the multi-GPUs environment which used the NVDIA? Tesla M2090 or the M2075 could simulate turbulence in a model with as many as approximately 50 million grid points. 2) The computation speed achieved by the multi-GPUs environments exceeded that by parallel computation which used four to six CPUs of one of the latest supercomputers. 展开更多
关键词 LES ISOLATED HILL Multi-Cores Multi-cpus computing Multi-gpus computing
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
4
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 gpu/cpu协同计算 随机速度边界
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
5
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
6
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 cpu-gpu异构计算 计算统一设备架构 OpenMP
下载PDF
CPU-GPU协同计算的并行奇异值分解方法 被引量:2
7
作者 周伟 戴宗友 +1 位作者 袁广林 陈萍 《计算机科学》 CSCD 北大核心 2015年第S1期549-552,共4页
在目标跟踪应用中,常常采用奇异值分解(SVD)作为基本工具进行动态建库。然而当每秒处理的数据量较大、计算精度要求较高时,SVD的计算耗时往往无法满足应用的实时性能要求。针对这一问题,提出了CPU-GPU协同计算的并行奇异值分解方法。该... 在目标跟踪应用中,常常采用奇异值分解(SVD)作为基本工具进行动态建库。然而当每秒处理的数据量较大、计算精度要求较高时,SVD的计算耗时往往无法满足应用的实时性能要求。针对这一问题,提出了CPU-GPU协同计算的并行奇异值分解方法。该方法利用GPU与CPU间的异步执行,对奇异值分解过程进行划分从而构造软件流水线,大大挖掘软硬件的并行性。实验表明,该方法比一般的基于GPU的Jacobi方法有约23%的性能提升。相对于CPU上的Intel MKL的奇异值分解函数获得了6.8x的加速比,满足了应用中的实时性能要求。 展开更多
关键词 gpu 协同计算 JACOBI方法 奇异值分解
下载PDF
CPU+多GPU异构协同计算的体系结构研究 被引量:3
8
作者 李龙飞 贺占庄 徐丹妮 《微电子学与计算机》 CSCD 北大核心 2014年第3期98-101,共4页
以CUDA架构为例,对传统的CPU+单GPU架构进行了分析,提出了一种CPU+多GPU异构协同计算的系统方案,对关键的CPU对多GPU的管理及多GPU间数据通信等问题做了重点讨论,从理论上进行了可行性分析,并提出了相应的优化方法.
关键词 图形处理器 统一计算设备架构 gpu 异构协同计算
下载PDF
基于CPU-GPU协同并行内点算法求解结构化非线性规划 被引量:2
9
作者 杨林峰 胡桂莉 +1 位作者 张晨 张振荣 《电子学报》 EI CAS CSCD 北大核心 2019年第2期382-389,共8页
大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit... 大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit commitment,UC)为稀疏系数矩阵的结构化非线性规划,本文根据PD-IPM原理,对UC模型进行连续松弛预处理,结合快速解耦技术解耦牛顿修正方程并设计CPU-GPU协同并行算法求解子问题,最后将结果与带稠密型子问题的结构化非线性规划的求解结果进行比较和分析.实验结果显示,本文所设计的算法对于两种不同类型的结构化非线性规划求解均能获得较好的加速比. 展开更多
关键词 非线性规划 内点法 机组组合 cpu-gpu协同 并行计算
下载PDF
CPU-GPU混合计算构架在岩土工程有限元分析中的应用 被引量:5
10
作者 陈曦 王冬勇 +2 位作者 任俊 张训维 苗姜龙 《土木工程学报》 EI CSCD 北大核心 2016年第6期105-112,共8页
计算机技术的快速发展促进了岩土工程数值模拟技术的进步和有限元仿真技术的应用。对于三维有限元建模,有限元离散所获得的线性方程系统规模较大,这些线性方程系统的求解通常支配着整个有限元计算的时间。为了提高有限元求解的效率,需... 计算机技术的快速发展促进了岩土工程数值模拟技术的进步和有限元仿真技术的应用。对于三维有限元建模,有限元离散所获得的线性方程系统规模较大,这些线性方程系统的求解通常支配着整个有限元计算的时间。为了提高有限元求解的效率,需要采用先进的基础迭代算法和高性能计算构架。使用性价比较高的GPU计算硬件对目前流行的预处理Krylov子空间迭代法进行了加速,重点研究了GPU对Krylov子空间迭代过程中矩阵矢量乘积的加速效果。由于预处理迭代方法的计算性能依赖于计算构架,采用数值算例对几种流行的预处理迭代方法在不同计算构架下的计算性能进行了评测,对在不同计算构架下采用何种预处理迭代方法给出了相应的建议。 展开更多
关键词 有限元法 Krylov子空间迭代法 预处理技术 矩阵存储 cpu-gpu计算构架
下载PDF
基于CPU与GPU/CUDA的数字图像处理程序的性能比较 被引量:4
11
作者 岳俊 邹进贵 何豫航 《地理空间信息》 2012年第4期45-47,180,共3页
测绘系统通常有大量图像处理工作,而户外图像采集系统更需要极高的实时性。通过对GPU与CPU分别进行数字图像处理性能测试,结果表明GPU并行计算可以大幅提高图像处理性能:可优化图像预处理、后处理速度,使测绘系统更加实时高效。
关键词 cpu gpu CUDA 并行计算 数字图像处理
下载PDF
CPU/GPU协同运算技术在舰载警戒雷达实验室模拟仿真中的应用 被引量:2
12
作者 饶世钧 邢忠臣 洪俊 《实验室研究与探索》 CAS 北大核心 2017年第7期118-121,共4页
针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模... 针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模拟数据生成与回波显示方面的具体应用方法,明确了CPU/GPU协同运算基本流程与各自任务分工,建立了CPU雷达模拟仿真数据组织与生成模型,给出了GPU雷达回波渲染与显示方法,并采用向量元素的遍历查找算法完成雷达回波数据获取和雷达回波纹理数据更新。通过在通用计算机对传统CPU运算和CPU/GPU协同运算两种方法进行仿真,仿真结果证明了这一技术应用的可行性与先进性,这种技术的应用对于提高舰载警戒雷达模拟仿真效率与逼真度有着重要意义。 展开更多
关键词 舰载警戒雷达 cpu/gpu协同运算 回波渲染 模拟仿真 数据处理 回波显示
下载PDF
CPU/GPU协同计算在频率域二维全波形反演中的应用 被引量:2
13
作者 王小青 谭捍东 许自龙 《CT理论与应用研究(中英文)》 2016年第1期23-32,共10页
全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并... 全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并行计算,同时利用GPU技术加速正演过程中大型稀疏线性代数方程组的求解,以提高频率域全波形反演的计算效率。通过理论模型验证本文方法的正确性和有效性,给出不同数据量与GPU计算效率的相关分析结论,提出频率域全波形反演CPU/GPU协同并行计算的制约瓶颈和发展方向。 展开更多
关键词 频率域正演 稀疏矩阵 BI-CGSTAB cpu/gpu协同计算
下载PDF
基于多核CPU+GPU运算的电磁场高效体绘制算法研究 被引量:1
14
作者 陈宇峰 张铂 李林 《计算机工程与应用》 CSCD 北大核心 2018年第18期218-222,共5页
雷达探测范围作为电磁场的一个典型代表,由于其在军事决策时扮演着重要的作用,所以对探测范围可视化的准确性和实时性的要求很严格。传统的面绘制三维数据场信息会造成大量的空间信息丢失。因此,采用体绘制技术来获取电磁场中的三维数... 雷达探测范围作为电磁场的一个典型代表,由于其在军事决策时扮演着重要的作用,所以对探测范围可视化的准确性和实时性的要求很严格。传统的面绘制三维数据场信息会造成大量的空间信息丢失。因此,采用体绘制技术来获取电磁场中的三维数据场信息。针对传统体绘制技术算法执行效率较低的问题,提出使用多核CPU+GPU的架构来加速体绘制,从而实现实时处理。实验表明,采用提出的方法可以大幅减少体绘制中光线绘制的时间,充分利用CPU的空闲存储资源和计算资源。 展开更多
关键词 电磁场 体绘制 多核cpu+gpu 并行计算
下载PDF
一种CPU-GPU协同计算的三维地形实时渲染算法 被引量:9
15
作者 郭向坤 林浒 +1 位作者 刘继申 王鸿亮 《小型微型计算机系统》 CSCD 北大核心 2018年第4期825-829,共5页
提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模... 提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模型.为了避免相邻LOD模型出现裂缝,利用地形块的裂缝检测和删除顶点的方法消除裂缝;为了解决两个LOD层次的转换过程中出现地表突跳现象,采用morphing方法实现地形的平滑过渡.实验结果表明,该算法将大量的几何计算移植到GPU上并行计算,降低了CPU的计算负载,提高了LOD模型的构建效率,加快了场景的渲染速度. 展开更多
关键词 OPENCL cpugpu协同计算 LOD模型 平滑过渡
下载PDF
基于GPU-CPU协同的遥感影像坐标转换研究与实现
16
作者 侯飞 《测绘与空间地理信息》 2020年第11期29-31,共3页
2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的... 2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的影像坐标转换方法效率较低,且大数据量影像难以转换,鉴于此,本文将GPU-CPU协同处理技术引入到影像坐标转换过程,建立GPU-CPU协同的影像并行转换流程,通过分块处理策略和GPU处理优化加速整个处理过程。经过系统数据实验,本文方法较普通坐标转换方法有极大的效率提升,在国土资源数据2000国家大地坐标系转换工作中得到了良好的推广应用。 展开更多
关键词 gpu-cpu协同 遥感影像 坐标转换 并行计算
下载PDF
CPU和GPU协同并行加速多生物序列比对 被引量:5
17
作者 杨春燕 钟诚 《小型微型计算机系统》 CSCD 北大核心 2016年第12期2780-2784,共5页
将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,... 将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,利用阈值cutoff控制主库约减程度,设计实现CPU和多个GPU协同计算并行比对多生物序列的高效可扩展算法OGM SA.实验结果表明,当cutoff≤0.20时,算法OGM SA的比对结果质量与算法G-M SA相同,计算速度是G-M SA算法的近4倍,内存容量需求比G-MSA算法也有所降低. 展开更多
关键词 多生物序列 并行比对 计算窗口 cpugpu协同计算 主库约减
下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
18
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 OPENMP
下载PDF
CPU/GPU系统负载均衡的可分负载调度 被引量:2
19
作者 彭江泉 钟诚 《计算机工程与设计》 CSCD 北大核心 2013年第11期3916-3923,共8页
针对具有多个片上多核处理器CMP和多个GPU的异构系统,综合考虑多核CPU和GPU的不同计算能力、各级缓存不同容量、CPU和GPU之间通信代价以及GPU内部结构等因素,采取计算与通信重叠、对任务自动划分、GPU端线程块大小和维度自动设置、多个... 针对具有多个片上多核处理器CMP和多个GPU的异构系统,综合考虑多核CPU和GPU的不同计算能力、各级缓存不同容量、CPU和GPU之间通信代价以及GPU内部结构等因素,采取计算与通信重叠、对任务自动划分、GPU端线程块大小和维度自动设置、多个异步流同时传输的方法,通过切换线程块执行以隐藏访存开销,提出一种均衡CPU和GPU负载、高效的可分负载多轮调度算法。采用计算密集型任务Mandelbrot进行实验测试,测试结果表明,与已有算法相比,该算法的调度性能有明显提升。 展开更多
关键词 cpu gpu异构系统 可分负载 调度算法 协同计算 负载均衡 多级缓存
下载PDF
基于CPU/GPU集群的编程的研究 被引量:2
20
作者 刘钢锋 《微电子学与计算机》 CSCD 北大核心 2013年第2期128-131,共4页
随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结... 随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据. 展开更多
关键词 gpu cpu的混合计算 结合MPI与CUDA
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部