期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
CPU+多GPU异构协同计算的体系结构研究
被引量:
3
1
作者
李龙飞
贺占庄
徐丹妮
《微电子学与计算机》
CSCD
北大核心
2014年第3期98-101,共4页
以CUDA架构为例,对传统的CPU+单GPU架构进行了分析,提出了一种CPU+多GPU异构协同计算的系统方案,对关键的CPU对多GPU的管理及多GPU间数据通信等问题做了重点讨论,从理论上进行了可行性分析,并提出了相应的优化方法.
关键词
图形处理器
统一
计算
设备架构
多GPU
异构协同计算
下载PDF
职称材料
面向天河2A系统的基于蒙特卡罗方法的粒子输运异构协同计算
被引量:
3
2
作者
李彪
刘杰
《计算机工程与科学》
CSCD
北大核心
2020年第11期1922-1928,共7页
粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;...
粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;在Matrix2000加速器端,通过OpenMP指令开发程序的线程级并行;优化了原MC程序串行数据收集通信模式,提出了新的二叉树通信模式,极大地减少了通信时间。实现的基于CPU/Matrix2000异构协同计算的并行程序,在天河2A系统上进行测试,大规模测试可以扩展到45万核,相对5万核并行效率保持在22.54%。
展开更多
关键词
粒子输运
异构协同计算
蒙特卡罗方法
OPENMP
国产加速器
下载PDF
职称材料
面向国产异构DCU平台的大规模并行矩量法研究
3
作者
贾瑞鹏
林中朝
+2 位作者
左胜
张玉
杨美红
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配...
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。
展开更多
关键词
高阶矩量法
国产
异构
并行系统
深度
计算
处理器
异构
协同
并行
计算
下载PDF
职称材料
针对天河2号的一种嵌套剖分负载平衡算法
被引量:
1
4
作者
刘旭
杨章
杨扬
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期418-425,共8页
天河2号等亿亿次计算机上的大规模异构协同计算对负载平衡算法提出了3方面要求:低算法复杂度、适应多级嵌套的数据传输系统和支撑异构协同计算.通过组合3级嵌套负载平衡算法框架、贪婪剖分算法和内外子区域剖分算法,设计了一种能够同时...
天河2号等亿亿次计算机上的大规模异构协同计算对负载平衡算法提出了3方面要求:低算法复杂度、适应多级嵌套的数据传输系统和支撑异构协同计算.通过组合3级嵌套负载平衡算法框架、贪婪剖分算法和内外子区域剖分算法,设计了一种能够同时满足这3方面要求的负载平衡算法.模型测试表明,算法可以达到90%以上的负载平衡效率.天河2号上32个节点的测试表明,算法能够保证通信开销较小.5个典型应用在天河2号上最大93.6万核的测试表明,算法能够支撑应用高效扩展,并行效率最高可达80%.
展开更多
关键词
并行
计算
负载平衡
异构协同计算
天河2号
至强融核协处理器
下载PDF
职称材料
题名
CPU+多GPU异构协同计算的体系结构研究
被引量:
3
1
作者
李龙飞
贺占庄
徐丹妮
机构
西安微电子技术研究所
出处
《微电子学与计算机》
CSCD
北大核心
2014年第3期98-101,共4页
基金
国产化指挥平台应用技术研究(204030202)
文摘
以CUDA架构为例,对传统的CPU+单GPU架构进行了分析,提出了一种CPU+多GPU异构协同计算的系统方案,对关键的CPU对多GPU的管理及多GPU间数据通信等问题做了重点讨论,从理论上进行了可行性分析,并提出了相应的优化方法.
关键词
图形处理器
统一
计算
设备架构
多GPU
异构协同计算
Keywords
多GPU
GPU
CUDA
Multi-GPU
heterogeneous collaborative computing
分类号
TN402 [电子电信—微电子学与固体电子学]
下载PDF
职称材料
题名
面向天河2A系统的基于蒙特卡罗方法的粒子输运异构协同计算
被引量:
3
2
作者
李彪
刘杰
机构
国防科技大学并行与分布处理国家重点实验室
复杂系统软件工程湖南省重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2020年第11期1922-1928,共7页
基金
国家重点研发计划(2017YFB0202104)
湖南省自然科学基金(2019JJ40339)
国防科技大学科研项目(ZK18-03-01)。
文摘
粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;在Matrix2000加速器端,通过OpenMP指令开发程序的线程级并行;优化了原MC程序串行数据收集通信模式,提出了新的二叉树通信模式,极大地减少了通信时间。实现的基于CPU/Matrix2000异构协同计算的并行程序,在天河2A系统上进行测试,大规模测试可以扩展到45万核,相对5万核并行效率保持在22.54%。
关键词
粒子输运
异构协同计算
蒙特卡罗方法
OPENMP
国产加速器
Keywords
particle transport
heterogeneous collaborative computing
Monte Carlo method
OpenMP
domestic accelerator
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向国产异构DCU平台的大规模并行矩量法研究
3
作者
贾瑞鹏
林中朝
左胜
张玉
杨美红
机构
西安电子科技大学电子工程学院
齐鲁工业大学计算机科学与技术学院
出处
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024年第2期76-83,共8页
基金
陕西省重点研发计划(2023-ZDLGY-09,2022ZDLGY02-01,2021GXLH-02)
中央高校基本科研业务费专项资金(QTZX23018)。
文摘
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。
关键词
高阶矩量法
国产
异构
并行系统
深度
计算
处理器
异构
协同
并行
计算
Keywords
method of moments
domestic heterogeneous platforms
deep computing unit(DCU)
parallel algorithm
分类号
TN820 [电子电信—信息与通信工程]
下载PDF
职称材料
题名
针对天河2号的一种嵌套剖分负载平衡算法
被引量:
1
4
作者
刘旭
杨章
杨扬
机构
计算物理重点实验室(北京应用物理与计算数学研究所)
北京应用物理与计算数学研究所高性能计算中心
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期418-425,共8页
基金
国家自然科学基金重大研究计划重点项目(91430218)~~
文摘
天河2号等亿亿次计算机上的大规模异构协同计算对负载平衡算法提出了3方面要求:低算法复杂度、适应多级嵌套的数据传输系统和支撑异构协同计算.通过组合3级嵌套负载平衡算法框架、贪婪剖分算法和内外子区域剖分算法,设计了一种能够同时满足这3方面要求的负载平衡算法.模型测试表明,算法可以达到90%以上的负载平衡效率.天河2号上32个节点的测试表明,算法能够保证通信开销较小.5个典型应用在天河2号上最大93.6万核的测试表明,算法能够支撑应用高效扩展,并行效率最高可达80%.
关键词
并行
计算
负载平衡
异构协同计算
天河2号
至强融核协处理器
Keywords
parallel computing
load balance
heterogeneous computing
Tianhe-2
MIC
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
CPU+多GPU异构协同计算的体系结构研究
李龙飞
贺占庄
徐丹妮
《微电子学与计算机》
CSCD
北大核心
2014
3
下载PDF
职称材料
2
面向天河2A系统的基于蒙特卡罗方法的粒子输运异构协同计算
李彪
刘杰
《计算机工程与科学》
CSCD
北大核心
2020
3
下载PDF
职称材料
3
面向国产异构DCU平台的大规模并行矩量法研究
贾瑞鹏
林中朝
左胜
张玉
杨美红
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
4
针对天河2号的一种嵌套剖分负载平衡算法
刘旭
杨章
杨扬
《计算机研究与发展》
EI
CSCD
北大核心
2018
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部