基于异构GPU集群的并行分布式编程解决方案被引量：1

AN PARALLEL AND DISTRIBUTED PROGRAMMING SOLUTION BASED ON HETEROGENEOUS GPU CLUSTER

下载PDF

导出

摘要由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。 Due to its characteristics of super powerful computing capability, high-speed memory access bandwidth and supporting large- scale data-level parallel programming, GPUs have become the mainstream accelerators for supercomputers and high performance computing field. GPU-enhanced clusters are showed to be heterogeneous in both node layer and intra-node as the evolvement of the processing elements and the expansion of the cluster nodes, which greatly increases the complexity of GPU cluster programming. Mainstream heterogeneous GPU clusters mostly adopt the way of simple combination of the heterogeneous computing programming model for GPU and the distributed memory- oriented message passing mode], such approach makes the GPU cluster programming lack of determinate criteria and often be inefficient and error-prone. In order to improve the efficiency of programming GPU cluster and to reduce programming complexity, as well as to realise the platform independence, we present a set of parallel and distributed programming solution for heterogeneous GPU cluster. The scheme presents the programming framework DISPAR through the use of the extended language method, and realises the preprocessor system StreamCC. Experiment proves its feasibility.

作者李佳佳胡新明吴百锋

机构地区复旦大学计算机科学技术学院

出处《计算机应用与软件》 CSCD 北大核心 2014年第9期28-31,176,共5页 Computer Applications and Software

关键词 GPU集群编程模型数据级并行 GPU clusters Programming framework Data-level parallel

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献9

1Kindratenko V,Enos J,Shi G,et al.GPU Clusters for High PerformanceComputing[C]//2009 IEEE International Conference on Cluster Com-puting,Computing and Workshops,2009:1-8.
2Message Passing Interface Forum.MPI:A Message-Passing Interface Stand-ard[EB/ OL].http://www.mcs.anl.gov/research/projects/mpi/.
3Khronos Group.The OpenCL Specification 1.0 revision 43[EB/OL].2011.http://www.khronos.org/opencl/.
4Nvidia Corporation.CUDA Programming Guide Version 4.0[EB/OL].2012.http://www.nvidia.com/object/cuda_home.html.
5OpenACC:Directives for Accelerators[EB/OL].http://www.openacc-standard,org.
6Karunadasa N P,Ranasinghe D N.Accelerating High Performance Ap-plications with CUDA and MPI[C]//2009 International Conference onIndustrial and Information Systems,2009.
7Barak A,BenNum T,Levy E,et al.A Package for OpenCL Based Het-erogeneous Computing on Clusters with Many GPU Devices[C]//Clus-ter Computing Workshops and Posters,2010 IEEE International Confer-ence,2010:1-1.
8Zhang Y,Mueller F.Gstream:A General-Purpose Data Streaming Frame-work on GPU Clusters[C]//2011 International Conference on ParallelProcessing,2011:245-254.
9OpenMP Architecture Review Board,OpenMP Specification:OpenMPapplication program interface[EB/OL].http://www.openmp.org/wp/ openmp-specifications/.

同被引文献4

1王珊,王会举,覃雄派,周烜.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752. 被引量：615
2曾青华,袁家斌.基于MapReduce和GPU双重并行计算的云计算模型[J].计算机与数字工程,2013,41(3):333-336. 被引量：4
3付伟,严博,吴晓平.云计算实验平台建设关键技术研究[J].实验室研究与探索,2013,32(11):78-81. 被引量：20
4薛志云,何军,张丹阳,曹维焯.Hadoop和Spark在实验室中部署与性能评估[J].实验室研究与探索,2015,34(11):77-81. 被引量：14

引证文献1

1周情涛,何军,胡昭华.基于GPU的Spark大数据技术在实验室的开发应用[J].实验室研究与探索,2017,36(1):112-116. 被引量：7

二级引证文献7

1叶娟.基于网络数据包的大数据分析程序设计与开发[J].软件工程,2018,21(1):35-37. 被引量：1
2李馥娟.大数据实验室建设与应用研究[J].实验技术与管理,2018,35(5):243-246. 被引量：24
3叶娟.基于信息隐藏工具的大数据信息储存系统开发[J].软件工程,2017,20(11):38-40. 被引量：1
4荆宜青,郭清溥,刘洋.基于高速数据存储的大数据实验室构建方法研究[J].实验技术与管理,2019,36(3):270-272. 被引量：5
5刘海峰,肖超,梁星亮.HECC除子标量乘并行集群算法设计[J].现代电子技术,2019,42(10):23-26.
6熊威,曾有灵,李喆.一种利用Spark-GPU加速CT图像重建的设计[J].暨南大学学报（自然科学与医学版）,2019,40(6):556-564. 被引量：1
7吴建,邓红辉.竞赛驱动下的Spark大数据技术与应用课程教学改革探索[J].教育教学研究前沿,2024,2(4):33-36.

1冯少荣,肖文俊.并行分布环境下的黑板模型[J].华东理工大学学报（自然科学版）,2008,34(1):96-102. 被引量：4
2虞慧群,范贵生.云计算技术的应用及发展趋势综述[J].微型电脑应用,2011(10):1-3. 被引量：26
3黄锦增,陈虎,赖路双.异构GPU集群的任务调度方法研究及实现[J].计算机技术与发展,2012,22(5):32-36. 被引量：7
4杨环俊,王雅琳.ASP.NET中数据库操作通用类的分析与实现[J].湖南科技学院学报,2010,31(8):74-75.
5江小平,李成华,向文,张新访.云计算环境下朴素贝叶斯文本分类算法的实现[J].计算机应用,2011,31(9):2551-2554. 被引量：21
6肖文鹏.开发Linux平台下的高性能并行程序[J].开放系统世界,2002(11):62-67.
7冯颖,方林,谢立.图视化消息传递模型[J].计算机辅助工程,1997,6(4):30-37.
8李涛,杨婷,易学渊,蒲林,钱博文,黄光新,黄虎才,韩俊刚.萤火虫2:一种多态并行机的硬件体系结构[J].计算机工程与科学,2014,36(2):191-200. 被引量：16
9邓华富.面向云计算框架的最大流算法实现研究[J].成都大学学报（自然科学版）,2015,34(2):144-148.
10冯兴杰,赵杰.基于MapReduce的H-mine算法[J].计算机应用研究,2016,33(3):754-758. 被引量：3

计算机应用与软件

2014年第9期

浏览历史

内容加载中请稍等...

基于异构GPU集群的并行分布式编程解决方案被引量：1

参考文献9

同被引文献4

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于异构GPU集群的并行分布式编程解决方案 被引量：1

参考文献9

同被引文献4

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于异构GPU集群的并行分布式编程解决方案被引量：1