期刊文献+
共找到580篇文章
< 1 2 29 >
每页显示 20 50 100
A Hybrid Parallel Strategy for Isogeometric Topology Optimization via CPU/GPU Heterogeneous Computing
1
作者 Zhaohui Xia Baichuan Gao +3 位作者 Chen Yu Haotian Han Haobo Zhang Shuting Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第2期1103-1137,共35页
This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstr... This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstrategy of CPU/GPU is proposed, while the hybrid parallel strategies for stiffness matrix assembly, equationsolving, sensitivity analysis, and design variable update are discussed in detail. To ensure the high efficiency ofCPU/GPU computing, a workload balancing strategy is presented for optimally distributing the workload betweenCPU and GPU. To illustrate the advantages of the proposedmethod, three benchmark examples are tested to verifythe hybrid parallel strategy in this paper. The results show that the efficiency of the hybrid method is faster thanserial CPU and parallel GPU, while the speedups can be up to two orders of magnitude. 展开更多
关键词 Topology optimization high-efficiency isogeometric analysis cpu/gpu parallel computing hybrid OpenMPCUDA
下载PDF
基于CPU-GPU混合编程的显微镜图像实时拼接
2
作者 吴为民 刘新 +2 位作者 李伙钦 江先伟 杨华 《重庆科技学院学报(自然科学版)》 CAS 2023年第3期67-74,共8页
随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CP... 随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CPU则负责逻辑控制部分的计算,提高了整体的运算效率。实验结果表明,CPU-GPU混合编程模式有效地缩短了显微镜图像拼接时间,提高了拼接的流畅度和实时性。 展开更多
关键词 电子显微镜 实时拼接 并行计算 cpu-gpu混合编程
下载PDF
CPU-GPU MPSoC中使用寿命驱动的OpenCL应用调度方法
3
作者 曹坤 龙赛琴 李哲涛 《计算机研究与发展》 EI CSCD 北大核心 2023年第5期976-991,共16页
近年来,集成CPU和GPU的多处理器片上系统(multiprocessor system-on-chips,MPSoC),凭借兼顾GPU核心的并行计算能力和CPU核心的通用计算能力,已经广泛应用于工业控制、汽车电子、智慧医疗等领域.为了充分发挥CPU-GPU MPSoC的性能,开放计... 近年来,集成CPU和GPU的多处理器片上系统(multiprocessor system-on-chips,MPSoC),凭借兼顾GPU核心的并行计算能力和CPU核心的通用计算能力,已经广泛应用于工业控制、汽车电子、智慧医疗等领域.为了充分发挥CPU-GPU MPSoC的性能,开放计算语言(open computing language,OpenCL)逐渐成为一种主流的应用程序编写标准.然而,在将OpenCL应用部署到CPU-GPU MPSoC的过程中,现有研究工作大多忽略了对芯片温度和使用寿命的管理,导致处理器核心在执行应用时超过了峰值温度,甚至永久性故障的提前发生,无法保证OpenCL应用的长久稳定运行.为了弥补上述缺点,提出了一种包含静态和动态应用调度技术的方法.静态应用调度技术是基于改进交叉熵策略,将OpenCL应用的特性充分考虑在内,有效提高了OpenCL应用设计点的寻优效率.动态应用调度技术是基于反馈控制策略,克服了传统方案中无法有效应对系统运行时新到应用的缺陷,能够最小化新到应用的平均延迟.实验表明,所提方法可以将应用的平均延迟降低34.58%,同时满足温度、能耗、使用寿命的约束. 展开更多
关键词 cpu-gpu多处理器片上系统 延迟 寿命 OpenCL应用 调度 温度
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
4
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 gpu/cpu协同计算 随机速度边界
下载PDF
基于CPU/GPU异构平台的全波形反演及其实用化分析 被引量:12
5
作者 张猛 王华忠 +3 位作者 任浩然 冯波 隋志强 王延光 《石油物探》 EI CSCD 北大核心 2014年第4期461-467,共7页
全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实... 全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实现流程。理论模型测试结果表明,该算法不仅对速度模型具有高精度刻画能力,而且计算效率比基于CPU集群的FWI算法大幅提升。对胜利探区某陆上区块实际地震资料进行全波形速度反演试处理,取得了初步的应用效果。在此基础上,讨论了FWI对实际地震资料质量的要求,就FWI在陆上地震资料的生产性应用提出了相应的策略。 展开更多
关键词 地震反问题 全波形反演 速度估计 cpu gpu异构平台 陆上地震资料
下载PDF
CPU和GPU协同处理的光学卫星遥感影像正射校正方法 被引量:32
6
作者 方留杨 王密 李德仁 《测绘学报》 EI CSCD 北大核心 2013年第5期668-675,共8页
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GP... 系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。 展开更多
关键词 正射校正 cpugpu协同处理 层次性分块 配置选择优化 存储层次性访问
下载PDF
CPU/GPU异构混合并行的栅格数据空间分析研究——以地形因子计算为例 被引量:9
7
作者 卢敏 王金茵 +2 位作者 卢刚 陶伟东 王结臣 《计算机工程与应用》 CSCD 北大核心 2017年第1期172-177,共6页
海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的... 海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的设备间任务划分,进行CPU与GPU异构混合的并行技术改良研究。实验结果表明,基于相同的单机硬件环境,与多核共享内存模型或众核流处理器的单一计算平台并行方案相比,CPU/GPU异构混合并行计算方法对于栅格数据分析具有更好的加速效果。 展开更多
关键词 GIS栅格数据分析 共享内存模型 流处理器模型 cpu/gpu异构混合并行
下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
8
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 cpu-gpu异构计算 计算统一设备架构 OpenMP
下载PDF
CPU-GPU协同计算加速ASIFT算法 被引量:6
9
作者 何婷婷 芮建武 温腊 《计算机科学》 CSCD 北大核心 2014年第5期14-19,共6页
ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共... ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共享内存、合并访存,提高了数据访问效率。之后对ASIFT计算中的其它部分进行GPU优化,形成GASIFT。整个GASIFT计算过程中使用显存池来减少对显存的申请和释放。最后分别在CPU/GPU协同工作的两种方式上进行了尝试。实验表明,CPU负责逻辑计算、GPU负责并行计算的模式最适合于GASIFT计算,在该模式下GASIFT有很好的加速效果,尤其针对大、中图片。对于2048*1536的大图片,GASIFT与标准ASIFT相比加速比可达16倍,与OpenMP优化过的ASIFT相比加速比可达7倍,极大地提高了ASIFT在实时计算中应用的可能性。 展开更多
关键词 特征提取 ASIFT SIFT cpu gpu协同工作
下载PDF
地震叠前逆时偏移算法的CPU/GPU实施对策 被引量:83
10
作者 李博 刘红伟 +4 位作者 刘国峰 佟小龙 刘洪 郭建 裴江云 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2938-2943,共6页
相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O... 相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O(输入/输出)量却是最大的.针对此问题,本文在分析现行逆时偏移的多种算法基础上,提出利用CPU/GPU(中央处理器/图形处理器)作为数值计算核心,建立随机边界模型,从而克服存储I/O难题和提高计算效率.在实际的数据测试中,本文的方法可以大幅度的提高计算效率和减少存储单元,从而促使其高效地应用于生产实际. 展开更多
关键词 逆时偏移 波动方程 随机边界 中央处理器 图形处理器
下载PDF
基于GPU与CPU协作的实时波束形成实现方法 被引量:1
11
作者 李晓敏 侯朝焕 +1 位作者 鄢社锋 杨力 《计算机应用研究》 CSCD 北大核心 2011年第4期1333-1335,1359,共4页
采用基于CUDA(compute unified device architecture,统一计算设备架构)的GPU(graphic processing unit,图形处理器)与CPU协作处理方法,实现了宽带波束形成的实时处理。本方法的处理速度相较于MATLAB和CPU平台可以提高一至两个数量级,... 采用基于CUDA(compute unified device architecture,统一计算设备架构)的GPU(graphic processing unit,图形处理器)与CPU协作处理方法,实现了宽带波束形成的实时处理。本方法的处理速度相较于MATLAB和CPU平台可以提高一至两个数量级,相较于同等处理速度的多DSP平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。 展开更多
关键词 gpu cpu CUDA 宽带 波束形成 实时处理
下载PDF
CPU-GPU系统中基于剖分的全局性能优化方法 被引量:10
12
作者 张保 董小社 +3 位作者 白秀秀 曹海军 刘超 梅一多 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右. 展开更多
关键词 cpu-gpu异构并行系统 全局优化 3级优化 3级剖分
下载PDF
CPU/GPU并行加速的多谐波正弦拟合算法 被引量:2
13
作者 陈建军 任勇峰 甄国涌 《中北大学学报(自然科学版)》 CAS 北大核心 2013年第6期636-641,共6页
多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的... 多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的基础上提出了一种基于加权最小二乘的多谐波正弦拟合算法.并结合遗传算法避免了四参数正弦拟合算法对初始估计频率的依赖,提高了算法的鲁棒性.将算法在CPU/GPU平台上进行了实现,提高了算法的执行效率.在CPU/GPU平台下对受相关噪声污染的多谐波正弦信号进行了分析.实验结果表明,相比基于遗传算法的多谐波正弦拟合算法,所提算法的谐波幅值估计精度提高了1个数量级,算法执行时间缩短了近96%. 展开更多
关键词 cpu gpu 多谐波正弦拟合 遗传算法 并行处理 参数估计
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
14
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
CPU-GPU混合平台上动态场景光线跟踪的研究 被引量:5
15
作者 张健 焦良葆 陈瑞 《计算机工程与应用》 CSCD 2012年第21期151-154,159,共5页
提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创... 提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创建速度。同时充分利用CPU和GPU两个运算平台的特点,有效调度两者的运行,隐藏部分运算时间,进一步提高动态场景的渲染速度。实验结果表明,在安装了GeForce285GTX的PC机上,高真实感地交互渲染了包含11k三角面片的Kitchen动态场景。 展开更多
关键词 光线跟踪 KD-TREE 图形处理器(gpu) cpu
下载PDF
基于CPU与GPU/CUDA的数字图像处理程序的性能比较 被引量:4
16
作者 岳俊 邹进贵 何豫航 《地理空间信息》 2012年第4期45-47,180,共3页
测绘系统通常有大量图像处理工作,而户外图像采集系统更需要极高的实时性。通过对GPU与CPU分别进行数字图像处理性能测试,结果表明GPU并行计算可以大幅提高图像处理性能:可优化图像预处理、后处理速度,使测绘系统更加实时高效。
关键词 cpu gpu CUDA 并行计算 数字图像处理
下载PDF
多核CPU-GPU协同的并行深度优先算法 被引量:2
17
作者 余莹 李肯立 《计算机应用研究》 CSCD 北大核心 2014年第10期2982-2985,共4页
针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的... 针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的多核执行;GPU执行。混合算法为每种大小的图提供相对更好的性能,且能避免高直径图上的最坏情况。通过比较多CPU和GPU系统,分析底层架构对DFS性能的影响。实验结果表明,一个高端single-socket GPU系统的DFS执行性能相当于一个高端4-socket CPU系统。 展开更多
关键词 多核cpu gpu 深度优先搜索 并行 异构
下载PDF
大型复杂油藏CPU与GPU混合并行数值模拟 被引量:1
18
作者 廉培庆 计秉玉 +1 位作者 段太忠 姜凤光 《中国科技论文》 CAS 北大核心 2020年第5期537-541,共5页
为了实现大型复杂油藏混合并行数值模拟,通过高速InfiniBand网络连接多个机群的CPU节点,建立了新型计算平台,安装了并行油藏数值模拟软件系统,实现了大规模油藏数值模拟的并行计算。提出了不同CPU分区负载平衡优化方法,旨在研究GPU与CP... 为了实现大型复杂油藏混合并行数值模拟,通过高速InfiniBand网络连接多个机群的CPU节点,建立了新型计算平台,安装了并行油藏数值模拟软件系统,实现了大规模油藏数值模拟的并行计算。提出了不同CPU分区负载平衡优化方法,旨在研究GPU与CPU并行加速技术,提高大型复杂油藏数值模拟的时效性。以某油田为例,开展了多组分千万网格模型并行数值模拟的测试。测试结果显示:在保持各CPU分区负载平衡率高于90%的情况下,计算时间缩短了25%;随着CPU核数增加,加速比增幅逐渐减小;CPU与GPU混合并行,可比单纯CPU并行提速3.96~6.81倍,CPU核数越多,各分区数据交换量也随之增加,GPU承担的计算量增大。GPU与CPU并行加速技术及多组分千万网格模型并行数值模拟的实现,为实现复杂油藏精细地质和流体模拟提供了基础。 展开更多
关键词 组分模型 数值模拟 千万网格 负载平衡优化 cpugpu并行
下载PDF
CPU/GPU协同运算技术在舰载警戒雷达实验室模拟仿真中的应用 被引量:2
19
作者 饶世钧 邢忠臣 洪俊 《实验室研究与探索》 CAS 北大核心 2017年第7期118-121,共4页
针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模... 针对舰载警戒雷达实验室建设雷达模拟仿真过程中模拟数据计算量大、模拟数据类型多、更新速度快及雷达回波显示难的问题,在分析雷达模拟数据处理特点的基础上,介绍了CPU/GPU协同运算技术的基本情况,提出了CPU/GPU协同运算技术在雷达模拟数据生成与回波显示方面的具体应用方法,明确了CPU/GPU协同运算基本流程与各自任务分工,建立了CPU雷达模拟仿真数据组织与生成模型,给出了GPU雷达回波渲染与显示方法,并采用向量元素的遍历查找算法完成雷达回波数据获取和雷达回波纹理数据更新。通过在通用计算机对传统CPU运算和CPU/GPU协同运算两种方法进行仿真,仿真结果证明了这一技术应用的可行性与先进性,这种技术的应用对于提高舰载警戒雷达模拟仿真效率与逼真度有着重要意义。 展开更多
关键词 舰载警戒雷达 cpu/gpu协同运算 回波渲染 模拟仿真 数据处理 回波显示
下载PDF
CPU/GPU协同计算在频率域二维全波形反演中的应用 被引量:2
20
作者 王小青 谭捍东 许自龙 《CT理论与应用研究(中英文)》 2016年第1期23-32,共10页
全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并... 全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并行计算,同时利用GPU技术加速正演过程中大型稀疏线性代数方程组的求解,以提高频率域全波形反演的计算效率。通过理论模型验证本文方法的正确性和有效性,给出不同数据量与GPU计算效率的相关分析结论,提出频率域全波形反演CPU/GPU协同并行计算的制约瓶颈和发展方向。 展开更多
关键词 频率域正演 稀疏矩阵 BI-CGSTAB cpu/gpu协同计算
下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部