检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

在Intel Knights Corner和NVIDIA Kepler架构上OpenACC的性能可移植性分析被引量：1: 1; 作者王一超秦强 +1 位作者施忠伟林新华《计算机科学》 CSCD 北大核心 2015年第1期75-78,共4页; OpenACC是一套基于指导语句方式的并行编程语言标准。编程者可以通过在代码中添加符合该标准的指导语句,经OpenACC编译器的编译,将串行代码并行化地移植到加速器或者协处理器上,进而获得异构加速器所带来的加速效果。OpenACC与CUDA和Ope... 展开更多; 关键词 OpenACC 性能可移植性高性能计算; 下载PDF 职称材料

Bellman-Ford算法性能可移植的GPU并行优化被引量：7: 2; 作者刘磊王燕燕 +2 位作者申春李玉祥刘雷《吉林大学学报（工学版）》 EI CAS CSCD 北大核心 2015年第5期1559-1564,共6页; 提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明：本文的优化算法在NVIDIA和AM... 展开更多; 关键词计算机软件 Bellman-Ford算法 GPU并行编程及优化技术并行归约算法性能可移植性; 下载PDF 职称材料

CUDA下单源最短路径算法并行优化被引量：3: 3; 作者张晗钱育蓉 +2 位作者王跃飞陈人和田宸玮《计算机工程与设计》北大核心 2019年第8期2181-2189,共9页; 为设计基于固定序的Bellman-Ford算法在CUDA平台下并行优化方案,结合算法计算密集和数据密集的特点。从核函数计算层面,提出访存优化方法和基于固定序优化线程发散;从CPU-GPU传输层面,提出基于CUDA流优化数据传输开销方法。对不同显卡... 展开更多; 关键词固定序改进算法 Bellman-Ford算法并行计算性能可移植性图形处理器统一计算设备架构; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部