多GPU加速在高性能数值计算中的应用被引量：2

Application of multiple GPUs on high performance numerical calculation

下载PDF

导出

摘要针对核能领域中存在的大量数值计算问题,结合实际应用中多核硬件平台里面的多GPU(图形处理器)计算节点,提出基于CUDA(统一计算设备架构)的任务级的并行编程框架。为核电工程设计中的数值计算提供并行硬件平台下的基础GPU编程模型,将CUDA底层对多GPU的有效调度与上层使用进行分离,隔离底层的编程技术,减轻设计人员和开发人员对CUDA底层接口的使用难度;将主程序中的耗时计算模块用CUDA进行改写,再移植到GPU上执行,提升多GPU对计算任务的加速性能。实验结果表明,该编程框架能有效提升多GPU对计算任务的加速。 Aiming at the numerical calculation of physical problems in the field of nuclear energy,based on the multiple GPU cal-culation elements of multi-core hardware platforms,the programming architecture of multiple GPU development platform on task level parallelization was proposed,which provided basic parallel programming models for the nuclear engineering design proce-dure.The difficulties for the designer and the technical staff were mitigated when they used the low-level interface with CUDA, the programming framework could promote the acceleration performance of computing tasks under multiple GPUs by means of rewriting the time-consuming calculation module and transplanting them to the GPUs.Experimental results showed that the pro-gramming architecture could effectively promote the acceleration performance of computing tasks under multiple GPUs.

作者张娜明平洲王加昌曾辉刘东

机构地区中国核动力研究设计院核反应堆系统设计技术重点实验室

出处《计算机工程与设计》 CSCD 北大核心 2014年第7期2602-2606,共5页 Computer Engineering and Design

基金国防军工技术基础"十二五"科研基金项目(科工技[2010]1425号-41)

关键词并行计算并行编程图形处理器统一计算设备架构数值计算调度策略 parallel computing parallel programming GPU CUDA numerical calculation schedule policy

分类号 TP302.7 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1Nickolls J, Dally W J. The GPU computing era [J]. Micro, IEEE, 2010, 30 (2): 56-69.
2Kindratenko V. Scientific computing with GPUs [J]. Compu- ting in Science Engineering, 2012, 14 (3): 8-9.
3Hsieh C W, Chou C Y, Tsai T C, et al. NCHCs Formosa V GPU cluster enters the TOPS00 ranking [C] //International Conference on Cloud Computing Technology and Science. IEEE, 2012:622-624.
4Ghorpade J, Parande J, Kulkami M, et al. Gpgpu processing in cuda architecture [J]. Advanced Computing: An Internation Journal, 2012, 3 (1): 105-120.
5Garland M, Le Grand S, Nickolls J, et al. Parallel computing expe- riences with CUDA [J]. Micro, IEEE, 2008, 28 (4): 13-27.
6Barnat J, Bauch P, Brim L, et al. Employing multiple cuda de- vices to accelerate ltl model checking [C] //IEEE 16th Interna- tional Conference on Parallel and Distributed Systems, 2010: 259-266.
7Chen L, Villa O, Krishnamoorthy S, et al. Dynamic load balan- cing on single-and multi-GPU systems [C] //IEEE Interna- tional Symposium on Parallel I Distributed Processing, 2010: 1-12.
8Nukada A, Maruyama Y, Matsuoka $. High performance 3-D FFT using multiple CUDA GPUs [C] //Proceedings of the 5th Annual Workshop on General Purpose Processing with Graphics Processing Units. ACM, 2012: 57-63.
9Ioki M, Hozumi S, Chiba S. Writing a modular GPGPU pro- gram in Java [C] //Proceedings of the Workshop on Modular- ity in Systems Software. ACM, 2012: 27-32.
10Sanders J, Kandrot E. CUDA by example: An introduction to general-purpose GPU programming [ M ]. Addison-Wesley Professional, 2010.

同被引文献13

1赵毅,朱鹏,迟学斌,牛铁,曹宗雁.浅析高性能计算应用的需求与发展[J].计算机研究与发展,2007,44(10):1640-1646. 被引量：30
2徐銤.中国实验快堆的安全特性[J].核科学与工程,2011,31(2):116-126. 被引量：32
3王惠,郭培卿,陈小龙.ANSYS和Abaqus软件GPU加速性能典型算例测试与分析[J].计算机工程与科学,2013,35(11):105-110. 被引量：3
4余莹,李肯立,郑光勇.一种基于GPU集群的深度优先并行算法设计与实现[J].计算机科学,2015,42(1):82-85. 被引量：6
5盛冲冲,胡新明,李佳佳,吴百锋.面向节点异构GPU集群的编程框架[J].计算机工程,2015,41(2):292-297. 被引量：3
6张杰,柴志雷,喻津.基于GPU的图像特征并行计算方法[J].计算机科学,2015,42(10):297-300. 被引量：6
7王小青,谭捍东,许自龙.CPU/GPU协同计算在频率域二维全波形反演中的应用[J].CT理论与应用研究（中英文）,2016,25(1):23-32. 被引量：2
8侯景德,陈庆奎,赵海燕.基于MPI的GPU集群并行通信系统实现[J].计算机应用与软件,2016,33(4):116-121. 被引量：3
9韦春丹,龚奕利,李文海.一种基于GPU的移动对象并行处理框架[J].计算机应用与软件,2016,33(10):223-229. 被引量：2
10严健康,陈更生.基于CPU/GPU异构资源协同调度的改进H-Storm平台[J].计算机工程,2018,44(4):1-11. 被引量：7

引证文献2

1高原,顾文杰,丁雨恒,彭晖,陈泊宇,顾雯轩.异构集群中CPU与GPU协同调度算法的设计与实现[J].计算机工程与设计,2020,41(2):592-600. 被引量：7
2聂宁明,姚柯寒,曾艳,冯仰德,王珏,李顺德,张纪林,万健,林克豪,高岳,王彦棡,王宗国.面向结构动力学计算的撕裂有限元方法异构并行优化[J].数值计算与计算机应用,2024,45(2):115-135.

二级引证文献7

1高新成,刘德聚,王莉利,李强,柯璇.异构集群环境下逆时偏移任务调度算法[J].计算机技术与发展,2021,31(9):81-85.
2胡昌秀,张仰森,彭爽,陈涵,祁浩家.异构分布式深度学习平台的构建和优化方法研究[J].重庆理工大学学报（自然科学）,2023,37(9):208-216. 被引量：2
3关智华,郭志彪.基于遗传算法的通信网络节点自适应调度方法[J].现代传输,2023(5):63-66.
4陈宏,张岭乔,张宇峰,林治,曾麟.基于混合粒子群优化的智能电网负荷协同调度[J].电子设计工程,2024,32(16):111-114.
5ZHOU Yiheng,ZENG Wei,ZHENG Qingfang,LIU Zhilong,CHEN Jianping.A Survey on Task Scheduling of CPU-GPU Heterogeneous Cluster[J].ZTE Communications,2024,22(3):83-90.
6王秋琳,梁懿,刘迪,董昌朝,董晓祺.基于强化学习的异构CPU环境网络资源部署方法[J].自动化技术与应用,2024,43(11):140-144.
7董爱强,胡学勇,于兴江,刘旭,戴发玉.超大规模计算平台-感知混合容器集群的高性能计算作业调度[J].自动化与仪器仪表,2024(10):60-64.

1移植、再移植[J].家庭电脑世界,2004(07X):40-40.
2杨宏,李国辉.基于Proteus与单片机的步进电机控制设计[J].现代电子技术,2010,33(5):104-106. 被引量：26
3伍浩松.越南通过《原子能法》[J].国外核新闻,2008(6):8-8. 被引量：1
4唐晓伟,李丽云.哈工程大学构筑仿真“核世界”[J].科技致富向导,2014(9):6-6. 被引量：1
5张潇潇,王士成.基于VPX的网络传输设计[J].飞行器测控学报,2013,32(5):414-418. 被引量：1
6陈兴安.中美学者攻关75载核能领域难题终被破解——“人吸入钍是否致癌”是如何破解的[J].稀土信息,2009,15(9):34-35.
7查凤华.对尖端领域项目文档的控制——以田湾核电站项目文档管理为例[J].中国档案,2009(7):30-31. 被引量：1
8利用iPS细胞（诱导性多能干细胞）培育出健康小鼠[J].中国科学院院刊,2009,24(5):545-546.

计算机工程与设计

2014年第7期

浏览历史

内容加载中请稍等...

多GPU加速在高性能数值计算中的应用被引量：2

参考文献11

同被引文献13

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多GPU加速在高性能数值计算中的应用 被引量：2

参考文献11

同被引文献13

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多GPU加速在高性能数值计算中的应用被引量：2