面向通用计算GPU集群的任务自动分配系统被引量：2

Automatic Task Assignment System of General Computing Oriented GPU Cluster

下载PDF

导出

摘要当前GPU集群的主流编程模型是MPI与CUDA的松散耦合,采用这种编程模型进行编程,存在编程复杂度大、程序的可移植性差、执行效率低等问题。为此,提出一种面向通用计算GPU集群的任务自动分配系统StreamMAP。对编译器进行改造,以编译制导的方式提供集群任务的计算资源需求,通过运行时系统动态地发现、建立并维护系统资源拓扑,设计一种较为契合GPU集群应用特征的任务分配策略。实验结果表明,StreamMAP系统能降低集群应用程序的编程复杂度,使之较为高效地利用GPU集群的计算资源,且程序的可移植性和可扩展性也得到了保证。 MPI＋CUDA are the mainstream programming models of current GPU cluster architecture. However, by using such a low level programming model, programmers require detailed knowledge of the underlying architecture, which exerts a heavy burden. Besides, the program is less portability and inefficient. This paper proposes StreamMAP, an automatic task assignment system on GPU clusters. It provides powerful, yet concise language extension suitable to describe the compute resource demands of cluster tasks. It develops a run time system to maintain resource information, and supplies an automatic task assignment for GPU cluster. Experiments show that StreamMAP provides programmability, portability and scalability for GPU cluster application.

作者胡新明盛冲冲李佳佳吴百锋

机构地区复旦大学计算机科学技术学院

出处《计算机工程》 CAS CSCD 2014年第3期103-107,119,共6页 Computer Engineering

关键词 GPU集群异构编程模型任务分配可移植性可扩展性 GPU cluster heterogeneous programming model task assignment portability scalability

分类号 N945 [自然科学总论—系统科学]

引文网络
相关文献

参考文献12

1Jacobsen D A, Thibault J C, Senocak I. An MPI-CUDA Implementation for Massively Parallel Incompressible Flow Computations on Multi-GPU Clusters[C]//Proc. of the 48th AIAA Aerospace Sciences Meeting and Exhibit. Orlando, USA: [s. n.], 2010: 1065-1072.
2张繁,王章野,姚建,吴韬,彭群生.应用GPU集群加速计算蛋白质分子场[J].计算机辅助设计与图形学学报,2010,22(3):412-419. 被引量：12
3龙桂华,赵宇波,李小凡,高琴,王周.三维交错网格有限差分地震波模拟的GPU集群实现[J].地球物理学进展,2011,26(6):1938-1949. 被引量：21
4朱晓敏,陆佩忠.异构集群系统中安全关键实时应用调度研究[J].计算机学报,2010,33(12):2364-2377. 被引量：14
5陈勇,陈国良,李春生,何家华.SMP机群混合编程模型研究[J].小型微型计算机系统,2004,25(10):1763-1767. 被引量：19
6王惠春,朱定局,曹学年,樊建平.基于SMP集群的混合并行编程模型研究[J].计算机工程,2009,35(3):271-273. 被引量：15
7Phillips J C, Stone J E, Schulten K. Adapting a Message- driven Parallel Application to GPU-accelerated Clusters[C]// Proc. of ACM/IEEE Conference on Supereomputing. Piscataway, USA: IEEE Press, 2008:81-89.
8许彦芹,陈庆奎.基于SMP集群的MPI+CUDA模型的研究与实现[J].计算机工程与设计,2010,31(15):3408-3412. 被引量：10
9University of Illinois at Urbana-Champaign. Accelerator Cluster Webpage[EB/OL]. [2013-03-12]. http://iacat.illinois. edu/resources/cluster/.
10National Center for Supercomputing Applications. Intel 64 Tesla Linux Cluster Lincoln Webpage[EB/OL]. [2013-03-18]. http://www.ncsa.illinois.edu/UserInfo/Resources/Hardware/Int e164TeslaCluster/.

二级参考文献112

1吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：225
2陈勇,陈国良,李春生,何家华.SMP机群混合编程模型研究[J].小型微型计算机系统,2004,25(10):1763-1767. 被引量：19
3张锦雄.矩阵相乘并行算法的MPI实现[J].广西科学院学报,2004,20(4):217-219. 被引量：3
4赵永华,迟学斌.基于SMP集群的MPI+OpenMP混合编程模型及有效实现[J].微电子学与计算机,2005,22(10):7-11. 被引量：33
5柳有权,刘学慧,吴恩华.基于GPU带有复杂边界的三维实时流体模拟[J].软件学报,2006,17(3):568-576. 被引量：54
6彭群生,胡敏.蛋白质三维结构相似性比较方法综述[J].计算机辅助设计与图形学学报,2006,18(10):1465-1471. 被引量：9
7王童奎,李瑞华,李小凡,张美根,龙桂华.横向各向同性介质中地震波场谱元法数值模拟[J].地球物理学进展,2007,22(3):778-784. 被引量：29
8Rabenseifner R. Hybrid Parallel Programming on HPC Platforms[C]//Proc. of the 5th European Workshop on OpenME Aachen, Germany: [s. n.], 2003.
9Valentina E Antonio L, Gabriel G,et al. Parallelism and Granularity in Time Dependent Approaches to Reactive Scattering Calculations[C]//Proc. of the Int'l Conf. on Parallel and Distributed Processing Techniques and Applications. Las Vegas, Nevada, USA: [s. n.], 2000.
10Gerstein M, Honig B. Sequences and topology [J]. Current Opinion in Structural Biology, 2001, 11(3): 327-329.

共引文献79

1吴涵,廉西猛,孙成禹,芮拥军,蔡瑞乾,邓小凡.叠前深度偏移地震记录直接模拟方法[J].石油地球物理勘探,2020(4):747-753. 被引量：2
2单莹,吴建平,王正华.基于SMP集群的多层次并行编程模型与并行优化技术[J].计算机应用研究,2006,23(10):254-256. 被引量：25
3向文,刘青昆,于方,郑晓薇.基于LAM-MPI和OpenMP的机群编程环境配置与应用[J].大连民族学院学报,2007,9(5):41-44. 被引量：3
4李肯立,杨进,彭成斌,秦云川.基于MPI+OpenMP混合模型的并行地震数据处理支撑库的研究[J].计算机工程与科学,2007,29(12):136-139. 被引量：3
5胡晓力,田有先.多粒度并行计算集群研究与应用[J].电力学报,2007,22(4):436-438. 被引量：5
6于方,郑晓薇,孙晓鹏.基于SMP集群的三维网格多粒度混合并行编程模型[J].计算机应用与软件,2009,26(3):138-140. 被引量：6
7韩丽洁,李文,田晏嘉.嵌入式零树小波压缩和解压缩的并行化算法[J].计算机应用,2009,29(B06):209-212. 被引量：2
8王志斌,陈波,万玉发,吴涛,罗兵,沃伟峰.天气雷达资料实时并行处理方法[J].计算机工程,2009,35(23):255-257. 被引量：8
9郭静,田有先.基于各向异性扩散方程的多层次并行图像去噪[J].计算机工程与科学,2010,32(4):49-51. 被引量：1
10李鸿健,白明泽,唐红,孙世新.混合并行技术在激光化学反应模拟中的应用[J].计算机应用,2010,30(6):1687-1689. 被引量：4

同被引文献14

1Nickolls J,Buck I,Garland M,et al.Scalable Parallel Programming with CUDA[J].Queue,2008,6(2):40-53.
2Yoo A B,Jette M A,Grondona M.SLURM:Simple Linux Utility for Resource Management[C]//Proceedings of JSSPP’03.Berlin,Germany:Springer,2003:44-60.
3Staples G.TORQUE Resource Manager[C]//Proceed-ings of ACM/IEEE Conference on Supercomputing.New York,USA:ACM Press,2006:8.
4沈莉,陈林.一种CPU+GPU资源调度系统的研究[J].高性能计算发展与应用,2011,(1):28-31.
5Newall M,Holmes V,Lunn P.GPU Cluster for Accelerated Processing and Visualisation of Scientific and Engineering Data[C]//Proceedings of Science and Information Conference.Washington D.C.,USA:IEEE Press,2014:140-145.
6Prabhakaran S,Iqbal M,Rinke S,et al.A Dynamic Resource Management System for Network-attached Accelerator Clusters[C]//Proceedings of the 42nd International Conference on Parallel Processing.Washington D.C.,USA:IEEE Press,2013:773-782.
7张繁,王章野,姚建,吴韬,彭群生.应用GPU集群加速计算蛋白质分子场[J].计算机辅助设计与图形学学报,2010,22(3):412-419. 被引量：12
8梁娟娟,任开新,郭利财,刘燕君.GPU上的矩阵乘法的设计与实现[J].计算机系统应用,2011,20(1):178-181. 被引量：7
9刘进锋,郭雷.CPU与GPU上几种矩阵乘法的比较与分析[J].计算机工程与应用,2011,47(19):9-11. 被引量：7
10马梦琦,刘羽,曾胜田.基于CUDA架构矩阵乘法的研究[J].微型机与应用,2011,30(24):62-64. 被引量：2

引证文献2

1屈宜丽,蓝才会,任志国.CPU/GPU异构并行系统研究综述[J].自动化与仪器仪表,2016(4):25-26. 被引量：6
2康雷,张树本,杨坚.基于B/S模式的GPU集群管理系统设计[J].计算机工程,2015,41(10):6-9. 被引量：3

二级引证文献9

1郑志凌,郭李平,范明昊.Web集群管理系统的设计与实现[J].电子技术与软件工程,2016(5):58-59. 被引量：3
2段群,王小妮.MATLAB环境下GPU并行计算的应用[J].自动化与仪器仪表,2017(6):172-174. 被引量：2
3夏岩石,闫静怡.基于B/S模式的图书馆教育信息远程检索系统设计[J].现代电子技术,2017,40(24):71-73. 被引量：8
4任凯斌,曾鹏飞,郝永平.基于数字化生产车间的邮件系统设计与集成[J].信息技术与网络安全,2018,37(4):136-140. 被引量：1
5梁先明.离线信号的并行分析处理技术[J].电讯技术,2018,58(8):939-945.
6陈文洁.一种PSK信号的并行化离线解调优化方法[J].电讯技术,2018,58(8):946-951.
7王钊,李勇,崔维鑫,雒莎.一种星载嵌入式软件容错启动系统设计[J].电子设计工程,2019,27(8):1-5. 被引量：5
8庄跃迁.一种基于高性能GPU的实时脉内分析实现方案[J].电子设计工程,2019,27(19):100-104. 被引量：2
9蒋瀚洋,王丹华,王樱.CPU-GPU异构并行计算体系的设计与实现分析[J].学园,2018,0(36):112-113.

1鲁兴启,王琴.系统科学研究方法的合理性准则[J].系统辩证学学报,2005,13(4):90-94. 被引量：1
2唐艳琴,潘志松,吴君青.基于MapReduce的快速Newman并行算法[J].华中科技大学学报（自然科学版）,2012,40(S1):58-61.
3柳杨,杨贯中.使用Web Service实现系统的重用[J].计算机系统应用,2005,14(12):71-74.
4刘辉,彭滢,龚斌,代斌,魏代政.网格环境下期权定价BSDE模型的并行实现[J].华中科技大学学报（自然科学版）,2011,39(S1):201-204. 被引量：1
5从电子政务网络建设迈向政府数据中心建设[J].华南金融电脑,2009,17(12):26-26. 被引量：1
6赵雪峰,贠超,刘相权,王伟.自动化药房系统调度的优化[J].计算机工程,2009,35(10):193-195. 被引量：15
7刘伟,周月梅.不协调目标的因素分析[J].工业工程,1999,2(1):14-16.
8吕娜.计算世界的奇妙探险——第一位图灵奖女得主Frances E.Allen[J].程序员,2009(9):10-10.
9崔巍,史殿习,丁博,饶翔.Linux在无线传感器Imote2上的移植与应用[J].计算机工程,2010,36(4):291-292. 被引量：2
10王秀丽.汽车电子控制领域编译器安全验证策略[J].上海交通大学学报,2011,45(S1):101-103.

计算机工程

2014年第3期

浏览历史

内容加载中请稍等...

面向通用计算GPU集群的任务自动分配系统被引量：2

参考文献12

二级参考文献112

共引文献79

同被引文献14

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

面向通用计算GPU集群的任务自动分配系统 被引量：2

参考文献12

二级参考文献112

共引文献79

同被引文献14

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

面向通用计算GPU集群的任务自动分配系统被引量：2