期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
应用动态生成树的GPU显存数据复用优化
被引量:
1
1
作者
李亮
王恩东
+3 位作者
朱正东
颜康
张保
董小社
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2013年第10期44-50,共7页
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GP...
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
展开更多
关键词
gpu显存
动态生成树
数据复用
数据传输
下载PDF
职称材料
基于超大内存节点的波动方程逆时偏移高效实现
被引量:
1
2
作者
包红林
李敏
张萌
《石油物探》
CSCD
北大核心
2021年第5期732-737,750,共7页
随着地震数据规模不断增大,进行波动方程逆时偏移计算时,采用的重复正传计算与波场数据硬盘缓存的波场数据存储策略是制约逆时偏移计算效率的一个主要因素。为此提出了利用混合内存技术构建高达1.5 TB的超大内存计算节点,以满足大数据...
随着地震数据规模不断增大,进行波动方程逆时偏移计算时,采用的重复正传计算与波场数据硬盘缓存的波场数据存储策略是制约逆时偏移计算效率的一个主要因素。为此提出了利用混合内存技术构建高达1.5 TB的超大内存计算节点,以满足大数据量波场数据无损压缩后内存存储需求,实现最小计算量的全波场数据内存存储策略,解决大数据量波场数据存储问题,提升偏移计算效率。实际生产数据测试结果表明,对于大规模数据,节点配置超大内存可使高密度炮数据偏移计算效率提升46.1%以上,计算效率提升显著,可缩短大规模地震数据逆时偏移计算时间,降低计算能源消耗。该技术还可应用于其它大内存需求的地震数据处理,因此具有很好的实用性和经济效益。
展开更多
关键词
波动方程逆时偏移
计算效率
存储策略
混合内存
傲腾内存
gpu显存
协同计算
下载PDF
职称材料
题名
应用动态生成树的GPU显存数据复用优化
被引量:
1
1
作者
李亮
王恩东
朱正东
颜康
张保
董小社
机构
西安交通大学电子与信息工程学院
浪潮集团高效能服务器和存储技术国家重点实验室
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2013年第10期44-50,共7页
基金
国家自然科学基金资助项目(61173039)
国家"863计划"资助项目(2012AA010904
+1 种基金
2012AA01A306)
国家科技支撑计划资助项目(2011BAH04B03)
文摘
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
关键词
gpu显存
动态生成树
数据复用
数据传输
Keywords
gpu
memory
dynamic spanning tree
data reuse
data transfer
分类号
TP399 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于超大内存节点的波动方程逆时偏移高效实现
被引量:
1
2
作者
包红林
李敏
张萌
机构
中国石油化工股份有限公司石油物探技术研究院
出处
《石油物探》
CSCD
北大核心
2021年第5期732-737,750,共7页
基金
国家重大研发计划项目(2017YFB0202904)
中国石化顺北超深层QRTM地震成像技术应用研究项目(P20055-4)共同资助。
文摘
随着地震数据规模不断增大,进行波动方程逆时偏移计算时,采用的重复正传计算与波场数据硬盘缓存的波场数据存储策略是制约逆时偏移计算效率的一个主要因素。为此提出了利用混合内存技术构建高达1.5 TB的超大内存计算节点,以满足大数据量波场数据无损压缩后内存存储需求,实现最小计算量的全波场数据内存存储策略,解决大数据量波场数据存储问题,提升偏移计算效率。实际生产数据测试结果表明,对于大规模数据,节点配置超大内存可使高密度炮数据偏移计算效率提升46.1%以上,计算效率提升显著,可缩短大规模地震数据逆时偏移计算时间,降低计算能源消耗。该技术还可应用于其它大内存需求的地震数据处理,因此具有很好的实用性和经济效益。
关键词
波动方程逆时偏移
计算效率
存储策略
混合内存
傲腾内存
gpu显存
协同计算
Keywords
wave equation reverse time migration
computing efficiency
storage strategy
mixed memory
Optane DC Persistent Memory
gpu
memory
collaborative computing
分类号
P631 [天文地球—地质矿产勘探]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
应用动态生成树的GPU显存数据复用优化
李亮
王恩东
朱正东
颜康
张保
董小社
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2013
1
下载PDF
职称材料
2
基于超大内存节点的波动方程逆时偏移高效实现
包红林
李敏
张萌
《石油物探》
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部