一种基于MPI+CUDA的高性能天文数据分发方法

A High-Performance Distribution Method of Astronomical Data Based on MPI + CUDA

下载PDF

导出

摘要天文海量数据的出现给天文软件的开发带来了诸多挑战。近年来,随着并行计算技术的发展,MPI+GPU逐渐成为当前高性能天文数据处理的主要模式。针对太阳高分辨图像重建中如何提高重建性能这一问题,对其中的数据读取与数据分发方法进行了系统研究。传统的MPI并行处理时,主进程将原图切割成子块,随后将子块发送到各子进程重建,重建后的结果返回主进程。当子进程数量较大且计算节点数量较少时,这种数据分发过程显著增加通讯时长,影响整个重建过程的效率。提出MPI+CUDA的一种树状数据分发方法,给出了算法的基本思路与实现方法。实验结果表明,树状分发方式比一般采用的平行分发方式可以提高速度近一倍,成果对天文海量数据开发处理有一定的借鉴作用。 The appearance of massive astronomical data has brought a lot of challenges to the development of astronomy software. In recent years, with the development of parallel computing technology, MPI ＋ GPU mode has become the main mode for current high performance astronomical data processing gradually. For the problem of how to improve reconstruction performance in reconstruction of solar high resolution image, this paper has made systematic research on data reading and data distribution method. During traditional MPI parallel processing, master process cuts original image into sub-blocks, and then delivers sub-blocks into each sub-process for reconstruction, the results after reconstruction will be returned to the master process. When the number of sub-process is big and calculation nodes are few, this data distribution process will increase the time for communication significantly and affect the efficiency of the whole reconstruction process. This paper has proposed a tree data distribution method under MPI ＋ CUDA and offered basic ideas and realization method of the algorithm. Experimental results have shown that tree distribution mode nearly doubles the speed than generally adopted plane distribution mode; its achievements provide certain reference for the development and processing of massive astronomical data.

作者方兵邓辉张晓丽梅盈石聪明陈晓林戴伟吴静平王锋

机构地区昆明理工大学云南省计算机技术应用重点实验室中国科学院云南天文台

出处《天文研究与技术》 CSCD 2017年第4期481-487,共7页 Astronomical Research & Technology

基金国家自然科学基金(U1531132 U1631129 11403009)资助

关键词图像重建 MPI+GPU 数据分发 Image reconstruction The MPI ＋ GPU Data distribution

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1李佳功,徐永华,李志玄,汪敏,季凯帆.基于Mark5B+GPU脉冲星观测系统[J].天文研究与技术,2014,11(4):335-342. 被引量：4
2许彦芹,陈庆奎.基于SMP集群的MPI+CUDA模型的研究与实现[J].计算机工程与设计,2010,31(15):3408-3412. 被引量：10
3施正,向永源,邓辉,季凯帆,卫守林.一米真空太阳望远镜Level 1级图像选帧的GPU实现[J].科学通报,2015,60(15):1408-1413. 被引量：3
4张能维,杨云飞,李冉阳,季凯帆.Hα全日面云污染实时识别和修复系统[J].天文研究与技术,2016,13(2):242-249. 被引量：4
5刘青昆,马名威,阎慰椿.基于MPI+CUDA异步模型的并行矩阵乘法[J].计算机应用,2011,31(12):3327-3330. 被引量：2

二级参考文献43

1罗近涛,李斌,陈岚,郝龙飞,张秀忠.上海天文台25 m射电望远镜首次单天线脉冲星观测[J].中国科学院上海天文台年刊,2011(1):129-135. 被引量：5
2陈勇,陈国良,李春生,何家华.SMP机群混合编程模型研究[J].小型微型计算机系统,2004,25(10):1763-1767. 被引量：19
3张锦雄.矩阵相乘并行算法的MPI实现[J].广西科学院学报,2004,20(4):217-219. 被引量：3
4赵永华,迟学斌.基于SMP集群的MPI+OpenMP混合编程模型及有效实现[J].微电子学与计算机,2005,22(10):7-11. 被引量：33
5NVIDIA CUDA compute unified device architecture:programming guide[Z].Version2.Obeta2,2008.
6Message Passing Interface Forum.MPI-2:Extensions to the message-passing interface[S].1997.
7WANG C F, SAHNI S. Matrix multiplication on the OTIS-mesh op- toeleetronic computer[ J]. IEEE Transactions on Computers, 2001, 50(7) :635 -645.
8ALONSO P, REDDY R, LASTOVETSKY A. Experimental study of six different implementations of parallel matrix multiplication on heterogeneous computational clusters of multicore processors[ C]//18th Euromicro Conference on Parallel, Distributed and Network-based Processing. Washington, DC: IEEE Computer Society, 2010:263 - 270.
9GROPP W, LUSK E, DOSS N, et al. A high-performance, portable implementation of the MPI message-passing interface standard[ J]. Parallel Computing, 1996, 22(6) : 789 - 828.
10NVIDIA Corporation. CUDA Programming Guide 2.3 [ M]. [ s. 1 ] : NVDIA Coporation, 2009:11 - 13.

共引文献17

1刘青昆,马名威,阎慰椿.基于MPI+CUDA异步模型的并行矩阵乘法[J].计算机应用,2011,31(12):3327-3330. 被引量：2
2陈家杰,李会元,张先轶.六边形区域快速傅里叶变换的CUDA-MPI算法及其实现[J].数值计算与计算机应用,2012,33(1):59-72. 被引量：4
3詹云,赵新灿,谭同德.基于OpenCL的异构系统并行编程[J].计算机工程与设计,2012,33(11):4191-4195. 被引量：23
4樊志杰,赵文涛.GRAPES四维变分同化系统MPI和OpenMP混合算法研究[J].计算机光盘软件与应用,2012,15(19):21-23. 被引量：1
5胡新明,盛冲冲,李佳佳,吴百锋.面向通用计算GPU集群的任务自动分配系统[J].计算机工程,2014,40(3):103-107. 被引量：2
6盛冲冲,胡新明,李佳佳,吴百锋.面向节点异构GPU集群的编程框架[J].计算机工程,2015,41(2):292-297. 被引量：3
7董国勇,彭力,吴凡,闻继伟.基于权值和代价函数的WSNs非均匀分簇路由算法[J].传感器与微系统,2015,34(3):134-136. 被引量：6
8胡伟松,赵倩纯,吴百锋.BIM中碰撞检测的可扩展性算法设计[J].微型电脑应用,2015,31(5):5-8.
9徐永华,李纪云,张颖倩,罗近涛,李志玄,郝龙飞,汪敏.相干消色散脉冲星观测系统的研究[J].天文研究与技术,2015,12(4):480-486. 被引量：3
10张能维,杨云飞,李冉阳,季凯帆.Hα全日面云污染实时识别和修复系统[J].天文研究与技术,2016,13(2):242-249. 被引量：4

1黄国良,韩应林.奥美拉唑与雷尼替丁治疗消化性溃疡疗效比较[J].医学理论与实践,2003,16(5):544-545. 被引量：1
2杨小光.中西医结合治疗消化性溃疡疗效观察[J].现代医药卫生,2004,20(19):2032-2033.
3杨晓燕.中西医结合治疗消化性溃疡40例[J].医学信息（下旬刊）,2010,23(12):194-194.
4秦成勇,刘敏.难治性PU[J].山东医药,1999,39(21):40-40.
5赵斌,赵宪邨.老年PU[J].山东医药,1999,39(21):39-40.
6白文元,姚希贤,崔东来.消化性溃疡的内科治疗[J].中国全科医学,2000,3(1):11-12. 被引量：56
7张向东.中西医结合治疗消化性溃疡56例[J].河南中医学院学报,2003,18(5):46-47. 被引量：1
8张晓军,杨灿群,黄春.Java MPI的实现[J].微型机与应用,2000,19(3):41-42. 被引量：2
9王进.消化性溃疡2715例胃镜结果分析[J].郑州大学学报（医学版）,2003,38(5):785-785. 被引量：2
10陆霞芳,郁慕鲁.30例消化性溃疡出血因素分析[J].中国现代医药科技,2003,3(1):14-15.

天文研究与技术

2017年第4期

浏览历史

内容加载中请稍等...

一种基于MPI+CUDA的高性能天文数据分发方法

参考文献5

二级参考文献43

共引文献17

相关作者

相关机构

相关主题

浏览历史