期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于CUDA的转换波Kirchhoff叠前时间偏移算法研究及实现 被引量:4
1
作者 喻勤 程冰洁 孔选林 《石油地球物理勘探》 EI CSCD 北大核心 2013年第1期58-63,6-7,共6页
转换波叠前时间偏移计算量巨大、耗费时间长,影响了多波多分量地震数据的处理效率,也限制了转换波技术在生产上的应用规模。目前转换波叠前时间偏移主要采取CPU集群计算方式,但CPU集群存在功耗大、占用空间大和维护成本高等缺点,为缩短... 转换波叠前时间偏移计算量巨大、耗费时间长,影响了多波多分量地震数据的处理效率,也限制了转换波技术在生产上的应用规模。目前转换波叠前时间偏移主要采取CPU集群计算方式,但CPU集群存在功耗大、占用空间大和维护成本高等缺点,为缩短偏移计算耗时和降低计算成本,本文提出一种基于CUDA技术的转换波Kirchhoff叠前时间偏移并行算法。应用理论数据和实际转换波数据在CPU和GPU测试平台对算法进行了对比验证和性能分析,确认GPU并行算法计算速度可提高上百倍,是一种高效、低成本的方法。 展开更多
关键词 转换波 kirchhoff叠前时间偏移 cuda并行计算
下载PDF
基于MPI和CUDA的转换波Kirchhoff叠前时间偏移并行计算 被引量:1
2
作者 喻勤 张少华 孔选林 《石油物探》 EI CSCD 北大核心 2013年第1期60-64,6,共5页
转换波Kirchhoff叠前时间偏移可以实现全空间三维转换波资料的准确成像。但转换波叠前偏移数据量巨大,而且需偏移迭代多次来寻找匹配的偏移速度模型,导致偏移处理周期长、效率低,限制了转换波偏移技术在生产上的应用规模。目前解决海量... 转换波Kirchhoff叠前时间偏移可以实现全空间三维转换波资料的准确成像。但转换波叠前偏移数据量巨大,而且需偏移迭代多次来寻找匹配的偏移速度模型,导致偏移处理周期长、效率低,限制了转换波偏移技术在生产上的应用规模。目前解决海量运算问题的方法主要是应用CPU集群来提高计算效率,但集群存在成本高、功耗大、占用空间大、维护成本高等缺点。给出了一种基于MPI(Message Passing Interface)和CUDA的转换波Kirchhoff叠前时间偏移并行算法,将细粒度线程级的GPU(Graphic Processing Unit)并行计算融入粗粒度进程级MPI并行编程模型。利用实际转换波数据分别在CPU(单核)、GPU(单卡)、MPI和GPU(2个节点)测试平台上对算法性能进行了测试,结果表明,MPI和GPU(2个节点)的计算速度是CPU(单核)的近400倍,可以大幅度提高转换波Kirchhoff叠前时间偏移的计算效率,降低计算成本。 展开更多
关键词 转换波地震数据处理 kirchhoff叠前时间偏移 集群 并行计算
下载PDF
GPU提速叠前时间体偏移技术 被引量:3
3
作者 张慧宇 刘路佳 +2 位作者 张兵 刘伟峰 周李军 《物探化探计算技术》 CAS CSCD 2011年第5期568-571,466,共4页
为了进一步提高叠前时间体偏移的计算效率,实现了在GPU\CPU协同并行计算模式下Kirchhoff叠前时间体偏移技术,并进行优化。经在Nvida Tesla C1060 GPU上的测试表明,GPU(Graphic Processing Unit)的处理速度是CPU(单核)的四十倍左右。同... 为了进一步提高叠前时间体偏移的计算效率,实现了在GPU\CPU协同并行计算模式下Kirchhoff叠前时间体偏移技术,并进行优化。经在Nvida Tesla C1060 GPU上的测试表明,GPU(Graphic Processing Unit)的处理速度是CPU(单核)的四十倍左右。同时表明,CUDA(Com-pute Unified Device Architectare)编程为CPU向GPU的转化提供了一个较为方便的语言环境。 展开更多
关键词 cuda编程 GPU计算 kirchhoff叠前时间体偏移 并行计算
下载PDF
基于多GPU的三维Kirchhoff积分法体偏移
4
作者 刘伟峰 赵改善 +2 位作者 孔祥宁 蔡杰雄 张兵 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期110-114,共5页
提出3种策略挖掘三维Kirchhoff积分法体偏移在众核GPU(图形处理器)上的并行性.首先,使用数据传输线程和GPU计算线程构造流水线并行框架,基于此框架直接实现异步输入输出(I/O)以减少GPU和网络存储之间数据传输所需的时间;其次,使用GPU的... 提出3种策略挖掘三维Kirchhoff积分法体偏移在众核GPU(图形处理器)上的并行性.首先,使用数据传输线程和GPU计算线程构造流水线并行框架,基于此框架直接实现异步输入输出(I/O)以减少GPU和网络存储之间数据传输所需的时间;其次,使用GPU的线程满载策略以使指令吞吐量最大化;最后,应用纹理缓存和常量缓存来减少片外存储器访问,并使用固定功能单元计算超越函数.实验结果表明:相比于IntelXeon E5430CPU上的算法串行版本,在nVidia Tesla C1060GPU上的优化算法实现了约20倍的加速比.比较了算法在3种不同GPU架构上的性能,并给出了CPU与GPU结果在0.5×10-4误差限下仅0.3×10-5的浮点数绝对误差. 展开更多
关键词 并行计算 图形处理器 kirchhoff积分法体偏移 流水线并行 异步输入输出 计算统一设备架构
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部