期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Bellman-Ford算法性能可移植的GPU并行优化
被引量:
7
1
作者
刘磊
王燕燕
+2 位作者
申春
李玉祥
刘雷
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015年第5期1559-1564,共6页
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AM...
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。
展开更多
关键词
计算机软件
Bellman-Ford算法
gpu
并行编程及
优化
技术
并行归约算法
性能可移植性
下载PDF
职称材料
简化的混合域全波形反演方法及GPU加速
被引量:
2
2
作者
桂生
刘洪
李飞
《石油物探》
EI
CSCD
北大核心
2017年第1期99-106,共8页
全波形反演(FWI)方法综合利用叠前地震波场的动力学和运动学信息,能够高精度地重建地下介质模型参数场,但巨大的计算量一直是制约其发展的一个重要因素。GPU组成的高性能计算集群为提高全波形反演计算效率提供了重要的硬件基础。基于GP...
全波形反演(FWI)方法综合利用叠前地震波场的动力学和运动学信息,能够高精度地重建地下介质模型参数场,但巨大的计算量一直是制约其发展的一个重要因素。GPU组成的高性能计算集群为提高全波形反演计算效率提供了重要的硬件基础。基于GPU平台,采用简化的混合域全波形反演算法实现了更快速的三维全波形反演计算。首先简单介绍了GPU加速技术应用于简化的混合域全波形反演时的一些优化技巧,包括线程调度、GPU之间数据传输以及共享内存的使用等,然后通过多GPU全波形反演测试了简化的混合域全波形反演的效果,证明了GPU加速技术能够有效地提高全波形反演的计算效率,相比CPU具有十几倍的加速比。
展开更多
关键词
gpu
技术
高性能计算
gpu技术优化
全波形反演
下载PDF
职称材料
基于口令自生成的GPU暴力破解优化技术
被引量:
3
3
作者
谢鑫君
罗顺
杨士华
《信息安全与通信保密》
2013年第3期82-84,共3页
文中在GPU硬件解密加速技术领域中,提出了对规则化口令穷举时,口令在设备端自动生成的技术。采用设备端每个并行线程唯一具有的线程号,建立线程号与口令的对应规则,以规则代替IO操作,并基于其中的一种对应规则进行了具体实现。最后以一...
文中在GPU硬件解密加速技术领域中,提出了对规则化口令穷举时,口令在设备端自动生成的技术。采用设备端每个并行线程唯一具有的线程号,建立线程号与口令的对应规则,以规则代替IO操作,并基于其中的一种对应规则进行了具体实现。最后以一个约20MB的规则口令库,对GPU口令自生成技术在暴力破解中的应用性能进行了测试。
展开更多
关键词
gpu
优化
技术
规则口令
自生成
原文传递
题名
Bellman-Ford算法性能可移植的GPU并行优化
被引量:
7
1
作者
刘磊
王燕燕
申春
李玉祥
刘雷
机构
吉林大学计算机科学与技术学院
中信证券有限公司
中国科学院计算技术研究所
出处
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015年第5期1559-1564,共6页
基金
吉林省重大科技攻关项目(20130206052GX)
'863'国家高技术研究发展计划项目(2012AA010902)
'973'国家重点基础研究计划项目(2011CB302500)
文摘
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。
关键词
计算机软件
Bellman-Ford算法
gpu
并行编程及
优化
技术
并行归约算法
性能可移植性
Keywords
computer software
Bellman-Ford algorithm
gpu
parallel programing and optimization techniques
parallel reduction algorithm
performance portability
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
简化的混合域全波形反演方法及GPU加速
被引量:
2
2
作者
桂生
刘洪
李飞
机构
中国科学院地质与地球物理研究所
中国科学院油气资源研究重点实验室
出处
《石油物探》
EI
CSCD
北大核心
2017年第1期99-106,共8页
基金
国家高技术研究发展计划(863计划)(2012AA061202)资助~~
文摘
全波形反演(FWI)方法综合利用叠前地震波场的动力学和运动学信息,能够高精度地重建地下介质模型参数场,但巨大的计算量一直是制约其发展的一个重要因素。GPU组成的高性能计算集群为提高全波形反演计算效率提供了重要的硬件基础。基于GPU平台,采用简化的混合域全波形反演算法实现了更快速的三维全波形反演计算。首先简单介绍了GPU加速技术应用于简化的混合域全波形反演时的一些优化技巧,包括线程调度、GPU之间数据传输以及共享内存的使用等,然后通过多GPU全波形反演测试了简化的混合域全波形反演的效果,证明了GPU加速技术能够有效地提高全波形反演的计算效率,相比CPU具有十几倍的加速比。
关键词
gpu
技术
高性能计算
gpu技术优化
全波形反演
Keywords
gpu
technology
high performance computing(HPC)
gpu
technology optimization
full waveform inversion(FWI)
分类号
P631 [天文地球—地质矿产勘探]
下载PDF
职称材料
题名
基于口令自生成的GPU暴力破解优化技术
被引量:
3
3
作者
谢鑫君
罗顺
杨士华
机构
上海通用识别技术研究所
出处
《信息安全与通信保密》
2013年第3期82-84,共3页
文摘
文中在GPU硬件解密加速技术领域中,提出了对规则化口令穷举时,口令在设备端自动生成的技术。采用设备端每个并行线程唯一具有的线程号,建立线程号与口令的对应规则,以规则代替IO操作,并基于其中的一种对应规则进行了具体实现。最后以一个约20MB的规则口令库,对GPU口令自生成技术在暴力破解中的应用性能进行了测试。
关键词
gpu
优化
技术
规则口令
自生成
Keywords
gpu
acceleration
ruly password
self-manufacturing
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
Bellman-Ford算法性能可移植的GPU并行优化
刘磊
王燕燕
申春
李玉祥
刘雷
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015
7
下载PDF
职称材料
2
简化的混合域全波形反演方法及GPU加速
桂生
刘洪
李飞
《石油物探》
EI
CSCD
北大核心
2017
2
下载PDF
职称材料
3
基于口令自生成的GPU暴力破解优化技术
谢鑫君
罗顺
杨士华
《信息安全与通信保密》
2013
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部