期刊文献+
共找到191篇文章
< 1 2 10 >
每页显示 20 50 100
论GPU-CPU协作计算模式的应用研究 被引量:2
1
作者 李超 《电子商务》 2010年第11期54-54,共1页
根据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,本文对GPU-CPU协作计算模式的特点进行介绍,再对GPU-CPU协作计算模式的应用进行研究,最后对GPU-CPU协作计算模式的发展展望。
关键词 gpu-cpu协作 计算模式 特点 应用研究
下载PDF
基于GPU-CPU协同的遥感影像坐标转换研究与实现
2
作者 侯飞 《测绘与空间地理信息》 2020年第11期29-31,共3页
2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的... 2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的影像坐标转换方法效率较低,且大数据量影像难以转换,鉴于此,本文将GPU-CPU协同处理技术引入到影像坐标转换过程,建立GPU-CPU协同的影像并行转换流程,通过分块处理策略和GPU处理优化加速整个处理过程。经过系统数据实验,本文方法较普通坐标转换方法有极大的效率提升,在国土资源数据2000国家大地坐标系转换工作中得到了良好的推广应用。 展开更多
关键词 gpu-cpu协同 遥感影像 坐标转换 并行计算
下载PDF
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法 被引量:16
3
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中... 随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。 展开更多
关键词 N-1潮流计算 gpu-cpu异构运算架构 并行化 拼接求解 迭代法
下载PDF
GPU-CPU协同航空影像快速正射纠正方法 被引量:8
4
作者 李朋龙 邓非 +2 位作者 何江 陈朝霞 杨丽颖 《测绘地理信息》 2016年第2期44-47,共4页
为满足应急测绘中大序列航空影像快速正射纠正的要求,提出了一种GPU-CPU协同快速正射纠正方法。实验结果表明,通过对GPU程序进行配置选择优化和存储层次性优化,该方法较传统的基于CPU正射纠正方法,其平均加速比达到52倍。
关键词 gpu-cpu协同 CUDA 航空影像 正射纠正
原文传递
基于有效区域约束的GPU-CPU协同影像快拼方法 被引量:3
5
作者 李朋龙 邓非 +3 位作者 李海亮 李勇 何江 王岚 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2018年第2期304-310,共7页
提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被... 提出了一种以有效区域约束的Voronoi图为拼接线网络,利用GPU-CPU协同处理航空影像快速拼接方法。首先,基于成像有效区域生成有效区域约束的Voronoi图拼接线网络,解决了传统Voronoi图拼接线网络在低重叠度条件下拼接后影像局部区域不被覆盖的问题,然后利用GPU-CPU协同处理将正射纠正嵌入到影像拼接的过程中,并且只对每张影像的有效区域进行纠正,再通过选择配置优化和存储层次性优化进一步提高拼接效率。实验表明,对237张高分辨率航空影像进行快速正射纠正和拼接,本文算法较传统先纠正再拼接的方法效率提高近20倍,同时保证很高的拼接精度,可以满足应急测绘要求。 展开更多
关键词 航空影像 正射纠正 影像拼接 有效区域约束的Voronoi图 gpu-cpu协同处理
原文传递
电力系统全纯嵌入潮流的并行计算
6
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 CPU-GPU异构运算平台 预处理器
下载PDF
任意起伏地形下重力异常三维正演及并行计算
7
作者 戴世坤 朱德祥 +4 位作者 张莹 李昆 陈轻蕊 凌嘉宣 田红军 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期768-780,共13页
为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转... 为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转化为两个一维傅里叶变换,一维傅里叶变换积分离散为多个单元积分累加和,离散单元中原函数采用二次插值形函数拟合,求出单元积分的解析表达式.相比现有的傅里叶变换算法,新方法具有采样灵活、积分精度高、计算速度快和傅里叶变换的截断效应小等优势.利用空间-波数域算法的高度并行性,采用CPU并行求解常微分方程,GPU并行计算任意傅里叶变换,实现了CPU-GPU并行加速方案,进一步提升了本文算法效率.利用常密度模型,对比数值解和解析解,结果表明本文算法正确;利用变密度模型对比了任意傅里叶变换算法与高斯快速傅里叶变换算法的计算效率与精度,在相近的数值精度下,本文算法波数选取少,效率高;测试CPU-GPU并行效果,结果表明相比CPU串行算法,CPU-GPU并行算法的计算效率大大提升,千万数量级节点数模型正演仅耗时数秒.最后利用实际地形数据进行三维重力异常场数值模拟,证明了新方法的高效性与实用性,对实现大规模复杂条件下重力异常精细化反演成像与综合解释有重要意义. 展开更多
关键词 空间-波数域 任意傅里叶变换 三维重力异常正演 CPU-GPU并行
下载PDF
基于异构系统的多级并行稀疏张量向量乘算法 被引量:1
8
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
面向深度学习应用的组件式开发框架的设计实现 被引量:1
9
作者 刘祥 华蓓 +1 位作者 林飞 魏宏原 《计算机应用》 CSCD 北大核心 2024年第2期526-535,共10页
针对目前深度学习应用缺少有效的开发与部署工具的问题,提出一个面向深度学习应用的组件式开发框架。所提框架根据应用的资源消耗类型进行功能拆分,使用评测引导的资源分配方案进行瓶颈消除,使用分步装箱方案兼顾高CPU利用率和低显存开... 针对目前深度学习应用缺少有效的开发与部署工具的问题,提出一个面向深度学习应用的组件式开发框架。所提框架根据应用的资源消耗类型进行功能拆分,使用评测引导的资源分配方案进行瓶颈消除,使用分步装箱方案兼顾高CPU利用率和低显存开销的功能放置。基于此框架开发的实时车牌号检测应用,在吞吐优先模式下GPU利用率达到82%,在延迟优先模式下平均应用延迟达到0.73 s,在三种模式下(吞吐优先模式、延迟优先模式以及吞吐/延迟的均衡模式)下,CPU平均利用率达到68.8%。实验结果表明,基于此框架能够进行硬件吞吐与应用延迟的平衡型配置,在吞吐优先模式下高效利用平台的计算资源,在延迟优先模式下满足应用的低延迟需求。相较于MediaPipe,使用本框架能够进行超实时的多人姿态估计应用开发,应用的检测帧率最高提升了1077%。实验结果表明,所提框架能够作为CPU-GPU异构服务器上面向深度学习应用开发部署的有效解决方案。 展开更多
关键词 深度学习应用 开发框架 基于组件的开发 流水线部署 CPU-GPU异构
下载PDF
面向多核CPU与GPU平台的图处理系统关键技术综述 被引量:1
10
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核CPU与GPU平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
下载PDF
雷达回波模拟器的设计与实现
11
作者 李梦圆 开根深 杨刚 《火控雷达技术》 2024年第3期145-152,共8页
性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本... 性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本文通过对数字相控阵雷达建模,基于CPU+GPU平台设计了一种雷达回波模拟器,解决了传统模拟器难以升级维护的问题。在实验室内与雷达波控、信号处理、预处理、数据处理以及终端搭建起一套完整的仿真验证系统,经系统联调验证,该模拟器可以模拟雷达多种工作模式。 展开更多
关键词 回波模拟器 干扰 杂波 CPU+GPU
下载PDF
基于CPU+GPU混合架构的雷达信号处理方法
12
作者 常艳 何涛 朱占宇 《火力与指挥控制》 CSCD 北大核心 2024年第7期80-85,90,共7页
针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积... 针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积累、目标检测、目标检测后处理及解模糊过程,将对应处理映射到CPU+GPU核心以提高加速比。实验结果表明,相比多核DSP信号处理方法,该方法具有更好的性能。 展开更多
关键词 CPU+GPU 混合架构 信号处理 多核DSP
下载PDF
一种面向生物基因多序列比对算法的任务调度方法
13
作者 杨波 王宏杰 +3 位作者 徐胜超 毛明扬 蒋金陵 蒋大锐 《计算机与现代化》 2024年第7期7-12,共6页
针对现阶段生物基因多序列比对算法在面对大规模数据时存在比对效率慢的问题,提出一种面向生物基因多序列比对算法的任务调度方法,以提高生物基因多序列比对的效率。通过Trie树方法对生物基因多序列数据展开分割处理,从而提高后续基因... 针对现阶段生物基因多序列比对算法在面对大规模数据时存在比对效率慢的问题,提出一种面向生物基因多序列比对算法的任务调度方法,以提高生物基因多序列比对的效率。通过Trie树方法对生物基因多序列数据展开分割处理,从而提高后续基因多序列比对过程中数据查找和匹配的效率;构建基因多序列BWT索引,利用BWT索引方法完成生物基因多序列比对;以多序列比对方法为基础,采用CPU与GPU异构并行系统完成多序列比对的任务调度。实验结果表明,所提的面向生物基因多序列比对算法的任务调度方法效率更高、性能更好,且更适合于实际应用。 展开更多
关键词 生物基因 任务调度 多序列比对 CPU与GPU BWT索引方法
下载PDF
航空面阵数字影像多基线立体匹配及协同处理
14
作者 张丽 汤晓涛 李纲 《测绘科学与工程》 2015年第3期31-37,共7页
多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。... 多基线立体匹配技术是获取可靠DSM产品的有效手段之一。本文针对面阵航空数字影像设计了多基线立体匹配的技术流程,根据算法特点提出了基于GPU—CPU的协同处理方案;利用构建的专业级GPU并行计算平台,对协同处理方案进行了实验验证。结果表明,提出的方案在保证DSM产品高精度的同时,大幅提高了多基线立体匹配的计算效率和整体处理能力。 展开更多
关键词 多基线立体匹配 gpu-cpu 协同处理 计算效率
下载PDF
盐下构造速度建模与逆时偏移成像研究及应用 被引量:29
15
作者 刘文卿 王西文 +4 位作者 刘洪 王宇超 王孝 曾华会 邵喜春 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2013年第2期616-625,共10页
盐丘速度建模及成像是盐下油气藏勘探有关技术瓶颈问题.盐下构造由于盐丘速度与围岩地层差异大,且厚度横向变化大,造成地震波场复杂及时间域构造畸变.针对H区复杂盐丘的地质特征,通过技术创新重新认识盐下油气藏.针对盐丘速度建模的难点... 盐丘速度建模及成像是盐下油气藏勘探有关技术瓶颈问题.盐下构造由于盐丘速度与围岩地层差异大,且厚度横向变化大,造成地震波场复杂及时间域构造畸变.针对H区复杂盐丘的地质特征,通过技术创新重新认识盐下油气藏.针对盐丘速度建模的难点,提出了"多信息约束层控实体建模技术",采用序贯高斯模拟及克里金趋势约束速度反演方法,较好解决了盐下速度异常问题,大大提高了速度建模的精度;针对盐下复杂构造成像,基于有限差分方法研究了精确且高效的差分格式逆时波场外推算法.基于GPU/CPU协同平台,将波场延拓通过GPU实现.采用逆时偏移深度域成像技术,使高角度反射界面、甚至超过90°盐丘侧翼界面的反射波精确成像.通过盐丘理论模型试算验证算法及方法的正确性.上述方法解决了盐丘速度建模精度问题、盐丘侧翼的回转构造成像问题,实现了对盐丘边界及盐丘侧翼的准确归位.消除了速度异常造成的时间域构造畸变,使盐下地层在深度域能够准确成像. 展开更多
关键词 盐丘 层控建模 多信息约束 逆时偏移 波动方程 GPU CPU协同计算
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
16
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 GPU/CPU协同计算 随机速度边界
下载PDF
基于Hadoop的高性能海量数据处理平台研究 被引量:32
17
作者 翟岩龙 罗壮 +1 位作者 杨凯 徐晟晨 《计算机科学》 CSCD 北大核心 2013年第3期100-103,共4页
海量数据高性能计算蕴藏着巨大的应用价值,但是目前云计算体系只具有海量数据处理能力,而不具有足够的高性能计算能力。将具有超强并行计算能力的GPU与云计算相融合,提出了基于CPU/GPU协同的异构高性能云计算体系结构。以开源Hadoop为基... 海量数据高性能计算蕴藏着巨大的应用价值,但是目前云计算体系只具有海量数据处理能力,而不具有足够的高性能计算能力。将具有超强并行计算能力的GPU与云计算相融合,提出了基于CPU/GPU协同的异构高性能云计算体系结构。以开源Hadoop为基础,采用注释码的形式对MapReduce函数中需要并行的部分进行标记。通过定制GPU类加载器,将被标记代码转换为CUDA代码并动态编译运行。该平台将GPU的计算能力融合到MapRe-duce框架中,可高效处理海量数据。 展开更多
关键词 CPU GPU协同计算 HADOOP 海量数据处理 高性能计算
下载PDF
基于GPU/CPU和震源随机编码技术的混合域全波形反演 被引量:5
18
作者 冯海新 刘洪 +2 位作者 孙军 胡婷 刘志伟 《石油物探》 EI CSCD 北大核心 2017年第1期107-115,共9页
传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数... 传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数相同的组,各组炮集叠加形成多个组合炮集,然后将组合炮集代替普通炮集进行反演。与传统的相位编码反演方法相比,震源随机编码技术在反演效率和收敛速度方面均有优势,且减少了炮间串扰噪声;并且在GPU的加速下,计算效率会再次提升。Marmousi模型数据测试结果表明:组合炮集方法得到了与普通炮集方法相同的反演效果,但计算效率却比普通炮集方法明显提高,且相较于传统的相位编码技术,组合炮集方法有效抑制了串扰噪声。 展开更多
关键词 混合域 全波形反演 GPU/CPU 组合炮集 震源随机编码
下载PDF
基于GPU的矩阵求逆性能测试和分析 被引量:10
19
作者 刘丽 沈杰 李洪林 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期812-817,共6页
在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并... 在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并行运算,从而获得了较大的加速比。同时,根据程序的执行结果,分析了GPU的单精度与双精度的浮点运算能力及其优、劣势。最后,通过分析数据传输时间对GPU性能的影响,总结出适合GPU的算法特征。 展开更多
关键词 图形处理器(GPU) 计算统一设备架构(CUDA) CPU 并行运算 矩阵求逆
下载PDF
CPU和GPU协同处理的光学卫星遥感影像正射校正方法 被引量:34
20
作者 方留杨 王密 李德仁 《测绘学报》 EI CSCD 北大核心 2013年第5期668-675,共8页
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GP... 系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。 展开更多
关键词 正射校正 CPU和GPU协同处理 层次性分块 配置选择优化 存储层次性访问
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部