迭代方法中基于渐近规模的通信与计算比分析被引量：6

Analysis of Communication-to-Computation Based on Asymptotic Size for Iterative Methods

下载PDF

导出

摘要迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展趋势要求迭代方法具备细粒度并行可扩展能力.文中引入渐近规模,即满足加速条件的计算规模下界,来反映并行迭代方法适应细粒度并行的能力,并由此刻画通信与计算比.基于矩阵的稀疏模式及其通信模式、机器的通信参数和迭代方法的基本运算,给出了渐近规模的理论预测公式.在一台包含128个双路4核计算节点的并行机上,分别基于纯进程并行(MPI)和进程/线程混合并行(MPI/OpenMP),以实际应用中3种常用迭代方法Jacobi、CG、BiCGSTAB为例,分析其渐近规模.并行可扩展性测试表明了渐近规模用于刻画迭代方法通信与计算比的准确性.对于纯进程情形,给出了渐近规模的理论预测与实际测试的对比,表明了理论预测结果的正确性.最后,基于这些结果,从迭代方法的算法设计和并行实现等方面讨论了面向未来更大规模的计算系统,降低通信与计算比的途径. Iterative method are one of the most efficient numerical algorithms to solve large-scale sparse linear systems arising from scientific computing. The parallel scalability of iterative method can be measured by the communication-to-computation （CtC） during the iterative process. The CtC is high for many iterative methods, as a result, coarse-grain parallelism is needed in order to obtain expected scalability. However, fine-grain parallelism is required for the complicacy of architecture increasing with multi/many-cores. In this paper, we introduce the concept of asymptotic size, which defined as the low bound of the problem size such that satisfying the speedup condition that parallel speedup is more than 1. We hope the asymptotic size can be used to describe the CtC and the ability of fine-grain parallelism for iterative method. Moreover, the theoretical prediction formula of asymptotic size is obtained based on the following parameters, the sparse and communication pattern of matrix, communication parameters of machine, and combination of basic operations of iterative methods. Using asymptotic size, the CtC is analyzed for three popular iterative methods, including Jacobi, CG, BiCGSTAB, on a MPP machine with 128 Double Quad-core nodes. The performance results are given for both MPI-Only and MPI/ OpenMP programming model, which show the usefulness of the asymptotic size for describing the CtC of iterative methods. For MPI-Only case, we also give the comparison of the prediction results and experiment results, which show the validation of the formula of asymptotic size. Finally, future research topics for improving the scalability of the iterative methods on more power supercomputers also discussed based on the analysis conclusions.

作者徐小文莫则尧武林平

机构地区北京应用物理与计算数学研究所

出处《计算机学报》 EI CSCD 北大核心 2013年第4期782-789,共8页 Chinese Journal of Computers

基金国家"九七三"重点基础研究发展规划项目基金(2011CB309702) 国家"八六三"高技术研究发展计划项目基金(2012AA01A309)资助~~

关键词迭代方法通信与计算比并行可扩展渐近规模多核众核体系结构 iterative method communication-to-computation parallel scalability asymptoticsize multi/many-cores

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1Saad Y. Iterative Methods for Sparse Linear Systems. 2ndEdition. Philadelphia:SIAM Publisher, 2003.
2Ang J, Evans K, Geist A, Heroux M, Hovland P, MarquesO,Curfman L,Ng E,Wild S. Extreme-scale solvers:Transi-tion to future architectures. DOE ASCR Report 2012-3,2012.
3Gahvari H, Baker H,Schuiz M, Yang U, Jordan K,GroppW. Modeling the performance of an algebraic multigrid cycleon HPC platforms//Proceedings of the 25th InternationalConference on Super Computing (ICS 2011 ). Tucson, AZ,2011:172-181.
4Ghysels P, Ashby T,Meerbergen K, Vanroose W. Hidingglobal communication latency in the GMRES algorithm onmassively parallel machines. Intel Exascience Lab, Leuven,Belgium:Technical Report 04. 2012. 1,2012.
5莫则尧.实用的并行程序性能分析方法[J].数值计算与计算机应用,2000,21(4):266-275. 被引量：6
6徐小文,莫则尧.并行代数多重网格算法可扩展性能分析[J].计算物理,2007,24(4):387-394. 被引量：9
7Mo Ze-Yao, Zhang Ai-Qing, Cao Xiao-Lin, Liu Qing-Kai,Xu Xiao-Wen, An Heng-Bin, Pei Wen-Bin,Zhu Shao-Ping.JASMIN:A parallel software infrastructure for scientificcomputing. Frontiers of Computer Science in China,2010,4(4):480-488.
8Ballard G, Demmel J, Holtz 0? Schwartz O. Minimizingcommunication in numerical linear algebra. SIAM Journal onMatrix Analysis and Applications, 2011, 32 (3):866-901.

二级参考文献5

1徐小文,莫则尧.一种新的并行代数多重网格粗化算法[J].计算数学,2005,27(3):325-336. 被引量：7
2莫则尧,李晓梅.工作站网络环境下的并行计算[J].计算机学报,1997,20(6):510-517. 被引量：32
3莫则尧.实用的并行程序性能分析方法[J].数值计算与计算机应用,2000,21(4):266-275. 被引量：6
4黄朝晖,常谦顺.基于亏量方程的多重网格解法(英文)[J].计算物理,2001,18(5):423-428. 被引量：2
5Zhao-hui Huang Qian-shun Chang (Academy of Mathematics and System Sciences, Chinese Academy of Sciences, Beijing 100080, China).GAUSS-SEIDEL-TYPE MULTIGRID METHODS[J].Journal of Computational Mathematics,2003,21(4):421-434. 被引量：3

共引文献13

1蒋光庆,文锋.并行程序实用优化方法讨论[J].信息工程大学学报,2006,7(4):361-363. 被引量：1
2徐小文,莫则尧.并行代数多重网格算法可扩展性能分析[J].计算物理,2007,24(4):387-394. 被引量：9
3张理论,吴建平,宋君强.基于前验负载差异的负载平衡性能模型[J].计算机应用,2009,29(10):2849-2851. 被引量：1
4张理论,叶红,吴建平,宋君强.基于最大负载偏移率的并行负载平衡性能分析[J].计算机研究与发展,2010,47(6):1125-1131. 被引量：5
5张理论,宋君强,赵文涛,胡江林.基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题[J].气象学报,2011,69(3):432-439. 被引量：1
6罗红兵,武林平.基于硬件事件的并行程序指令级性能模型与应用[J].计算机工程与科学,2013,35(11):175-181.
7罗红兵,张晓霞,王伟,武林平.科学计算应用程序单核指令级优化研究[J].计算机研究与发展,2014,51(6):1263-1269. 被引量：4
8莫则尧,刘兴平,廖振民.应用程序并行与优化关键技术研究[J].数值计算与计算机应用,2002,23(1):31-40. 被引量：9
9徐小文,莫则尧,安恒斌.求解大规模稀疏线性代数方程组序列的自适应AMG预条件策略[J].中国科学：信息科学,2016,46(10):1411-1420. 被引量：6
10董烨,董志伟,周海京,杨温渊.新型电荷守恒算法在大规模粒子模拟中的应用[J].太赫兹科学与电子信息学报,2016,14(4):574-580.

同被引文献57

1徐小文,莫则尧.一种新的并行代数多重网格粗化算法[J].计算数学,2005,27(3):325-336. 被引量：7
2徐小文,莫则尧.并行代数多重网格算法可扩展性能分析[J].计算物理,2007,24(4):387-394. 被引量：9
3武林平,魏勇,刘旭.多核集群中系统嗓音的测最[C]//2012全国高性能计算学术年会.北京:中国计算机学会,2012:1-5.
4Gioiosa R, Petrini F, Davis K, et al. Analysis of system overhead on parallel computers [C] //Proe of the 4th IEEE Int Symp on Signal Processing and Information Technology. Piscataway, NJ: IEEE, 2004:387-390.
5Beckman P, lskra K, Yoshii K, et al. Benchmarking the effects of operating system interference on extreme-scale parallel machines [J]. Cluster Computing, 2008, 11 (1) : 3- 16.
6Herowx M A. HPCCG; A simple conjugate gradient benchmark code for a 3D chimney domain on an arbitrary numher of processors [CP/OL]. [2014-03-13]. http://www. mantevo, org/downloads/HPCCG-1.0, html.
7Hoefler T, Schneider T, i.urusdaine A. Characterizing the influence of system noise on large scale applications hy simulation [C] //Proc of the 2010 ACM/IEEE Int Conf for High Performance Computing, Networking, Storage and Analysis. Piseataway, NJ: IEEE, 2010:1-11.
8Intel. Intel 64 and IA-32 Architectures Software Developer's Manual, B: Instruction Set Reference, N-Z [M]. Santa Clara, California: Intel Corporation, 2010:251-252.
9Dhabaleswar K. Osu micro-benchmarks [CP/OL]. [2014-03- 13]. http://mvapieh, cse. ohio-state, edu/benchmarks/.
10Petrini F, Kerbyson D K, Pakin S. The case of the missing supercomputer performance: Achieving opllmal performance on the 8192 processors of ASCI Q [C] //Proc of the 2003 ACM/IEEE Con{ on Supereamputing. Piseataway, N J: IEEE, 2003, 55-55.

引证文献6

1武林平,魏勇,徐小文,刘旭.系统噪音影响的量化分析[J].计算机研究与发展,2015,52(5):1146-1152. 被引量：4
2武林平.面向通信密集型大规模作业的系统与算法协同机制[J].中国工程物理研究院科技年报,2015,0(1):150-152.
3徐小文,莫则尧,安恒斌.求解大规模稀疏线性代数方程组序列的自适应AMG预条件策略[J].中国科学：信息科学,2016,46(10):1411-1420. 被引量：6
4徐小文.并行代数多重网格算法:大规模计算应用现状与挑战[J].数值计算与计算机应用,2019,40(4):243-260. 被引量：12
5金煜阳,马子轩,翟季冬.异步感知的异构高性能计算机性能预测方法[J].计算物理,2024,41(1):40-51.
6毛润彰,杜皓,田鸿运,黄思路,张鹏,徐小文.几类典型应用的代数多重网格算法并行可扩展瓶颈分析[J].计算物理,2024,41(4):403-417.

二级引证文献19

1秦尉富,李丽.篮球投篮姿势数学建模与统计学分析[J].湘潭大学自然科学学报,2017,39(3):115-118. 被引量：2
2周轶枫.大型赛事中体育场馆内环境噪音对人群的影响研究[J].环境科学与管理,2017,42(11):87-91. 被引量：7
3王建国,傅文,王延秋.不同级别噪声对矿工生理指标及行为能力的影响研究[J].矿业安全与环保,2019,46(1):99-103. 被引量：11
4徐小文.并行代数多重网格算法:大规模计算应用现状与挑战[J].数值计算与计算机应用,2019,40(4):243-260. 被引量：12
5武林平,景翠萍,刘旭,田鸿运.MPI并行程序中通信等待问题的诊断方法及其应用[J].国防科技大学学报,2020,42(2):47-54. 被引量：1
6谢和虎.子空间扩展算法及其应用[J].数值计算与计算机应用,2020,41(3):169-191. 被引量：2
7韩冰冰.基于矩形有限元离散泊松方程的二重网格法研究[J].安阳师范学院学报,2021(5):5-8.
8张晨松.油藏数值模拟中的线性解法器[J].数值计算与计算机应用,2022,43(1):1-26. 被引量：6
9徐达强,荆燕飞,胡少亮,徐小文.求解稀疏连续线性系统的自适应SGCRO-DR算法[J].数值计算与计算机应用,2022,43(2):125-141.
10刘堂友,于符婷,张笑源.基于加权最小二乘的主结构快速提取算法[J].南京大学学报（自然科学版）,2022,58(3):430-439.

1余强.关于服务器软件实现策略研究[J].四川工业学院学报,2002,21(2):49-50.
2王宁.谈计算机操作系统中的进程并行和互斥[J].皖西学院学报,2004,20(2):62-63. 被引量：1
3李芳,刘建辉.并行程序设计中的互斥与同步问题的归纳[J].科技广场,2008(8):243-244.
4钱卫星,吴弋旻.基于ZigBee技术的无线网络智能家居构建[J].电子工程师,2008,34(12):72-74. 被引量：2
5姜红.了解Linux线程技术[J].开放系统世界,2004(12):97-98.
6王勇,张哲,陶晓玲.一种改进的基于MPI/OpenMP混合编程关联规则算法[J].微电子学与计算机,2014,31(11):156-159.
7田刚,卢风顺.MPI/OpenMP+CUDA高性能计算环境的配置及应用[J].硅谷,2011,4(17):118-119. 被引量：2
8王华,唐国金.函数优化问题的一种异步并行模拟退火算法[J].控制与决策,2005,20(5):579-582. 被引量：5
9朱斌,丰晋军,陈芳园,王名扬.面向云计算的虚拟系统验证框架(英文)[J].集成技术,2012,1(4):41-45. 被引量：1
10黄淑玲.IP多播在局域网中的应用[J].福建电脑,2008,24(10):86-86.

计算机学报

2013年第4期

浏览历史

内容加载中请稍等...

迭代方法中基于渐近规模的通信与计算比分析被引量：6

参考文献8

二级参考文献5

共引文献13

同被引文献57

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

迭代方法中基于渐近规模的通信与计算比分析 被引量：6

参考文献8

二级参考文献5

共引文献13

同被引文献57

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

迭代方法中基于渐近规模的通信与计算比分析被引量：6