期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Bellman-Ford算法性能可移植的GPU并行优化 被引量:7
1
作者 刘磊 王燕燕 +2 位作者 申春 李玉祥 刘雷 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第5期1559-1564,共6页
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AM... 提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。 展开更多
关键词 计算机软件 Bellman-Ford算法 gpu并行编程及优化技术 并行归约算法 性能可移植性
下载PDF
简化的混合域全波形反演方法及GPU加速 被引量:2
2
作者 桂生 刘洪 李飞 《石油物探》 EI CSCD 北大核心 2017年第1期99-106,共8页
全波形反演(FWI)方法综合利用叠前地震波场的动力学和运动学信息,能够高精度地重建地下介质模型参数场,但巨大的计算量一直是制约其发展的一个重要因素。GPU组成的高性能计算集群为提高全波形反演计算效率提供了重要的硬件基础。基于GP... 全波形反演(FWI)方法综合利用叠前地震波场的动力学和运动学信息,能够高精度地重建地下介质模型参数场,但巨大的计算量一直是制约其发展的一个重要因素。GPU组成的高性能计算集群为提高全波形反演计算效率提供了重要的硬件基础。基于GPU平台,采用简化的混合域全波形反演算法实现了更快速的三维全波形反演计算。首先简单介绍了GPU加速技术应用于简化的混合域全波形反演时的一些优化技巧,包括线程调度、GPU之间数据传输以及共享内存的使用等,然后通过多GPU全波形反演测试了简化的混合域全波形反演的效果,证明了GPU加速技术能够有效地提高全波形反演的计算效率,相比CPU具有十几倍的加速比。 展开更多
关键词 gpu技术 高性能计算 gpu技术优化 全波形反演
下载PDF
基于口令自生成的GPU暴力破解优化技术 被引量:3
3
作者 谢鑫君 罗顺 杨士华 《信息安全与通信保密》 2013年第3期82-84,共3页
文中在GPU硬件解密加速技术领域中,提出了对规则化口令穷举时,口令在设备端自动生成的技术。采用设备端每个并行线程唯一具有的线程号,建立线程号与口令的对应规则,以规则代替IO操作,并基于其中的一种对应规则进行了具体实现。最后以一... 文中在GPU硬件解密加速技术领域中,提出了对规则化口令穷举时,口令在设备端自动生成的技术。采用设备端每个并行线程唯一具有的线程号,建立线程号与口令的对应规则,以规则代替IO操作,并基于其中的一种对应规则进行了具体实现。最后以一个约20MB的规则口令库,对GPU口令自生成技术在暴力破解中的应用性能进行了测试。 展开更多
关键词 gpu优化技术 规则口令 自生成
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部