面向节点异构GPU集群的编程框架被引量：3

Programming Framework for Node Heterogeneous GPU Cluster

下载PDF

导出

摘要基于异构GPU集群的主流编程方法是MPI与CUDA的混合编程或者其简单变形。因为对底层的集群架构不透明,程序员对GPU集群采用MPI与CUDA编写应用程序时需要人为考虑硬件计算资源,复杂度高、可移植性差。为此,基于数据流模型设计和实现面向节点异构GPU集群体系结构的新型编程框架分布式并行编程框架(DISPAR)。DISPAR框架包含2个子系统:(1)代码转换系统Stream CC,是DISPAR源代码到MPI+CUDA代码的自动转换器。(2)任务分配系统Stream MAP,具有自动发现异构计算资源和任务自动映射功能的运行时系统。实验结果表明,该框架有效简化了GPU集群应用程序的编写,可高效地利用异构GPU集群的计算资源,且程序不依赖于硬件平台,可移植性较好。 The mainly used programming method for heterogeneous GPU cluster is hybrid MPI/CUDA or its simple deformation.However,because of its transparency to underlying architecture when using hybrid MPI/CUDA to write code for heterogeneous GPU cluster programmers tend to need detailed knowledge of the hardware resources,which makes the program more complicated and less portable.This paper presents Distributed Parallel Programming Framework（DISPAR）,a new programming framework for node-level heterogeneous GPU cluster based on data flow model.DISPAR framework contains two sub-systems,StreamCC and StreamMAP.StreamCC is a code conversion tool which coverts DISPAR code into hybrid MPI/CUDA code.StreamMAP is a run-time system which can detect heterogeneous computing resources and map the tasks to appropriate computing units automatically.Experimental results show that the methods can make efficient use of the computing resources and simplify the programming on heterogeneous GPU cluster.Besides,it has better portability and scalability as the code does not rely on the execution platform.

作者盛冲冲胡新明李佳佳吴百锋

机构地区复旦大学计算机科学技术学院

出处《计算机工程》 CAS CSCD 北大核心 2015年第2期292-297,共6页 Computer Engineering

基金复旦大学ASIC和系统国家重点实验室基金资助项目华为创新研究计划基金资助项目

关键词 GPU集群异构分布式并行编程框架代码转换任务分配可移植性 GPU cluster heterogeneous Distributed Parallel Programming Framework（DISPAR） code conversion task assignment portability

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1Diamos G,Yalamanchili S.Harmony:An Execution Model and Runtime for Heterogeneous Many Core Systems[C]//Proceedings of the 17th International Symposium on High Performance Distributed Com-puting.[S.l.]:ACM Press,2008:197-200.
2Whiting P G,Pascoe R S V.A History of Data-flow Languages[J].IEEE Annals of the History of Computing,1994,16(4):38-59.
3Keller R M.Data Flow Program Graphs[J].Computer,1982,15(2):26-41.
4Dokulil J,Bajrovic E,Benkner S,et al.High-level Support for Hybrid Parallel Execution of C++Applications Targeting Intel Xeon Phi Coproc-essors[C]//Proceedings of International Conference on Computational Science.[S.l.]:Springer,2013.
5王惠春,朱定局,曹学年,樊建平.基于SMP集群的混合并行编程模型研究[J].计算机工程,2009,35(3):271-273. 被引量：15
6陈勇,陈国良,李春生,何家华.SMP机群混合编程模型研究[J].小型微型计算机系统,2004,25(10):1763-1767. 被引量：19
7Wu Yongwen,Song Junqiang,Lu Fengshun,et al.Communication and Memory Access Latency Character-istics of CPU/GPU Heterogeneous Cluster[C]//Proc-eedings of International Conference on Computational and Information Sciences.Chongqing,China:[s.n.],2012:958-961.
8Kindratenko V V,Enos J J,Shi Guochun,et al.GPU Clusters for High-performance Computing[C]//Proceedings of IEEE International Conference on Cluster Computing.[S.l.]:IEEE Press,2009:1-8.
9许彦芹,陈庆奎.基于SMP集群的MPI+CUDA模型的研究与实现[J].计算机工程与设计,2010,31(15):3408-3412. 被引量：10
10滕人达,刘青昆.CUDA、MPI和OpenMP三级混合并行模型的研究[J].微计算机应用,2010,31(9):63-69. 被引量：9

二级参考文献19

1陈勇,陈国良,李春生,何家华.SMP机群混合编程模型研究[J].小型微型计算机系统,2004,25(10):1763-1767. 被引量：19
2张锦雄.矩阵相乘并行算法的MPI实现[J].广西科学院学报,2004,20(4):217-219. 被引量：3
3赵永华,迟学斌.基于SMP集群的MPI+OpenMP混合编程模型及有效实现[J].微电子学与计算机,2005,22(10):7-11. 被引量：33
4Rabenseifner R. Hybrid Parallel Programming on HPC Platforms[C]//Proc. of the 5th European Workshop on OpenME Aachen, Germany: [s. n.], 2003.
5Valentina E Antonio L, Gabriel G,et al. Parallelism and Granularity in Time Dependent Approaches to Reactive Scattering Calculations[C]//Proc. of the Int'l Conf. on Parallel and Distributed Processing Techniques and Applications. Las Vegas, Nevada, USA: [s. n.], 2000.
6[1]Chen Guo-liang, WU Jun-min and etc. Parallel computer architecture[M]. Beijing: Higher Education Press, 2002.
7[2]Rajkumar Buyya. High performance cluster computing[M]. Beijing: Publishing House of Electronic Industry, 2001.
8[3]Tanaka Y, Matsuda M,Ando M, Kazuto K and Sato M. Compas: a pentium pro PC-based SMP cluster and its experience[J]. IPPS Workshop on Personal Computer Based Networks of Workstations. 1998, 486-497.
9[4]Lusk E L, Gropp W W. A taxonomy of programming models for symmetric multiprocessors and SMP clusters[C]. Proceedings of Programming Models for Massively Parallel Computers. 1995, 2-7.
10[5]Chen Yong, Chen Guo-liang, Xu Yin-long and Shan Jiu-long. Implementation and evaluation of MPI+OpenMP programming model on Dawning3000[C]. Proceedings of the 21st IASTED International Conference. Calgary: ACTA Press. 2003, 732-737.

共引文献43

1单莹,吴建平,王正华.基于SMP集群的多层次并行编程模型与并行优化技术[J].计算机应用研究,2006,23(10):254-256. 被引量：25
2向文,刘青昆,于方,郑晓薇.基于LAM-MPI和OpenMP的机群编程环境配置与应用[J].大连民族学院学报,2007,9(5):41-44. 被引量：3
3李肯立,杨进,彭成斌,秦云川.基于MPI+OpenMP混合模型的并行地震数据处理支撑库的研究[J].计算机工程与科学,2007,29(12):136-139. 被引量：3
4胡晓力,田有先.多粒度并行计算集群研究与应用[J].电力学报,2007,22(4):436-438. 被引量：5
5于方,郑晓薇,孙晓鹏.基于SMP集群的三维网格多粒度混合并行编程模型[J].计算机应用与软件,2009,26(3):138-140. 被引量：6
6韩丽洁,李文,田晏嘉.嵌入式零树小波压缩和解压缩的并行化算法[J].计算机应用,2009,29(B06):209-212. 被引量：2
7王志斌,陈波,万玉发,吴涛,罗兵,沃伟峰.天气雷达资料实时并行处理方法[J].计算机工程,2009,35(23):255-257. 被引量：8
8郭静,田有先.基于各向异性扩散方程的多层次并行图像去噪[J].计算机工程与科学,2010,32(4):49-51. 被引量：1
9李鸿健,白明泽,唐红,孙世新.混合并行技术在激光化学反应模拟中的应用[J].计算机应用,2010,30(6):1687-1689. 被引量：4
10王亮,白明泽,羊金花.分子动力学在小型SMP集群中的并行计算[J].计算机应用,2010,30(A01):235-236. 被引量：2

同被引文献14

1祝永志,王国仁,李丙锋,魏榕晖.异构并行计算系统可扩展模型的实现[J].计算机工程,2009,35(17):97-99. 被引量：3
2王刚,唐杰,武港山.基于多GPU集群的编程框架[J].计算机技术与发展,2014,24(1):9-13. 被引量：3
3刘颖,吕方,王蕾,陈莉,崔慧敏,冯晓兵.异构并行编程模型研究与进展[J].软件学报,2014,25(7):1459-1475. 被引量：13
4张娜,明平洲,王加昌,曾辉,刘东.多GPU加速在高性能数值计算中的应用[J].计算机工程与设计,2014,35(7):2602-2606. 被引量：1
5余莹,李肯立,郑光勇.一种基于GPU集群的深度优先并行算法设计与实现[J].计算机科学,2015,42(1):82-85. 被引量：6
6张玉洁,吕相文,张云洲.GPU虚拟化环境下的数据通信策略研究[J].计算机技术与发展,2015,25(8):24-28. 被引量：4
7张杰,柴志雷,喻津.基于GPU的图像特征并行计算方法[J].计算机科学,2015,42(10):297-300. 被引量：6
8闵芳,张志先,张玉洁.虚拟化环境下多GPU并行计算研究[J].微电子学与计算机,2016,33(3):69-75. 被引量：5
9王小青,谭捍东,许自龙.CPU/GPU协同计算在频率域二维全波形反演中的应用[J].CT理论与应用研究（中英文）,2016,25(1):23-32. 被引量：2
10侯景德,陈庆奎,赵海燕.基于MPI的GPU集群并行通信系统实现[J].计算机应用与软件,2016,33(4):116-121. 被引量：2

引证文献3

1江慧芳,蔡达,王晓蕊.基于CPU-GPU异构环境的运算代价评估模型[J].计算机工程,2017,43(9):12-16. 被引量：1
2杨志刚,吴俊敏,徐恒,尹燕.基于虚拟化的多GPU深度神经网络训练框架[J].计算机工程,2018,44(2):68-74. 被引量：9
3高原,顾文杰,丁雨恒,彭晖,陈泊宇,顾雯轩.异构集群中CPU与GPU协同调度算法的设计与实现[J].计算机工程与设计,2020,41(2):592-600. 被引量：3

二级引证文献13

1胡挺,祝永新,田犁,封松林,汪辉.面向移动平台的轻量级卷积神经网络架构[J].计算机工程,2019,45(1):17-22. 被引量：12
2沈雁,戴瑜兴.基于GPU的并行Cholesky分解及其应用[J].计算机工程,2019,45(2):284-289. 被引量：1
3刘文超,潘峰,杨晓元,周潭平,涂广升.基于cuFHE的同态比较运算器[J].计算机工程,2019,45(9):143-146.
4柏涛涛.基于深度神经网络与MPI并行计算的人脸识别算法研究[J].西安文理学院学报（自然科学版）,2020,23(2):62-67. 被引量：2
5姜洋洋.基于卷积神经网络与CUDA加速计算的手势识别算法应用研究[J].系统仿真技术,2020,16(1):22-26. 被引量：2
6柏涛涛.基于图像质量分析与多角点融合的车道线识别算法[J].重庆科技学院学报（自然科学版）,2020,22(3):72-75. 被引量：1
7吴鹃.基于深度学习与板卡控制的AOI识别算法应用研究[J].信息技术,2020,44(9):74-78.
8黄莉雅,倪凡,舒彧,杨耀.基于边缘计算的异常用电检测算法研究[J].电子技术与软件工程,2021(15):217-221. 被引量：1
9高新成,刘德聚,王莉利,李强,柯璇.异构集群环境下逆时偏移任务调度算法[J].计算机技术与发展,2021,31(9):81-85.
10孟庆德,张春霞.基于虚拟化平台的档案实时更新系统设计[J].电子设计工程,2021,29(24):89-92. 被引量：3

1霍洪鹏,胡新明,盛冲冲,吴百锋.面向节点异构GPU集群的能量有效调度方案[J].计算机应用与软件,2013,30(3):283-286. 被引量：1
2黄锦增,陈虎,赖路双.异构GPU集群的任务调度方法研究及实现[J].计算机技术与发展,2012,22(5):32-36. 被引量：7
3张纯彬,秦筱桦,郭玉翠,李腾.P2P环境下基于声誉的信任管理模型[J].计算机时代,2012(3):17-19.
4谭学伟.打印设备多微机用户自动转换器[J].计算机技术与发展,1991,13(2):26-29.
5李佳佳,胡新明,吴百锋.基于异构GPU集群的并行分布式编程解决方案[J].计算机应用与软件,2014,31(9):28-31. 被引量：1
6赵庆兰,董春生.面向节点-节点的进化测试改进方法[J].计算机工程,2010,36(9):56-58.
7张金波.基于VIP的遥感数据快速可视化处理[J].皖西学院学报,2005,21(2):92-93.
8袁宁,刘德峰.动态检查点容错技术研究[J].计算机研究与发展,2007,44(z1):221-225.
9李专,王元珍.基于RDF的XML安全推理控制[J].计算机科学,2007,34(4):104-105. 被引量：1
10刘林峰,吴家皋,邹志强,陈行,钮麟.面向节点失效问题的无线传感器网络拓扑自愈算法[J].东南大学学报（自然科学版）,2009,39(4):695-699. 被引量：10

计算机工程

2015年第2期

浏览历史

内容加载中请稍等...

面向节点异构GPU集群的编程框架被引量：3

参考文献12

二级参考文献19

共引文献43

同被引文献14

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

面向节点异构GPU集群的编程框架 被引量：3

参考文献12

二级参考文献19

共引文献43

同被引文献14

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

面向节点异构GPU集群的编程框架被引量：3