基于块子空间迭代算法的GPU加速

On GPU-based acceleration of block subspace iterative methods

下载PDF

导出

摘要利用块Krylov子空间方法结合GPU(图形处理单元)对线性方程组求解进行加速.利用GPU进行计算具有并行度高的好处,并能提高计算效率.数值算例说明,块算法在GPU上的运行效率要高于非块算法在CPU上的运行效率.但是对于块算法,谨慎地选择块的大小对于提升整个问题求解的速度也是非常重要的. The block Krylov subspace method is used to speed up the solution of the system of the linear equation by using the GPU. By the advantages of high degree of parallelism of the GPU, the computational efficiency can be improved. The numerical example shows that the running efficiency of the block algorithm on the GPU is higher than that of the non-block algorithm on the CPU. ~rthermore, for the block algorithm, the size of the block is also very important for improving the speed of the whole problem.

作者骆玮平张振宇

机构地区上海财经大学数学学院

出处《应用数学与计算数学学报》 2016年第1期138-147,共10页 Communication on Applied Mathematics and Computation

关键词块子空间迭代算法 GPU加速大规模稀疏线性代数方程组 block subspace iterative methods GPU-based acceleration large scaled linear algebra equations with sparse coefficient matrix

分类号 O241.6 [理学—计算数学] O246 [理学—计算数学]

引文网络
相关文献

参考文献11

1徐树方.数值线性代数[M].北京:北京大学出版社,2014.
2程豪,张云泉,张先轶,李玉成.CPU-GPU并行矩阵乘法的实现与性能分析[J].计算机工程,2010,36(13):24-26. 被引量：11
3Vzquez F, Fernndez J J, Garzdn E M. A new approach for sparse matrix vector production NVIDIA GPUs [J]. Concurrency and Computation Practice and Experience, 2011, 23(8): 815- 826.
4Demmel J, Hoemmen M, Mohiyuddin M, Yelick K. Minimizing communication in sparse matrix solvers [J]. Sc Conference, 2009, 19(1): 1-12.
5Carson E, Knight N, Demmel J. Avoiding communication in nonsymmetric-Lanczos-based Krylov subspace methods [J]. SIAM Journal on Scientific Computing, 2013, 35(5): $42-$61.
6Demmel J, Hoemmen M. Communication-Avoiding Variants of GMRES and CG [R]. [S.1.]: University of California Berkeley, 2007.
7Demmel J, Hoemmen M, Mohiyuddin M, Yelick K. Avoiding Communication in Computing Krylov Subspaces [R]. IS.1.]: University of California Berkeley, 2007.
8Saal Y. Iterative Methods for Sparse Linear Systems [M]. 2nd ed. [S.1.]: SIAM, 2000.
9Parlett B N. The symmetric eigenvalue problem [J]. Mathematics of Computation, 1981, 37(4): 1-22.
10Walker H F. Implementation of the GMRES method using Householder transformation [J]. SIAM Journal on Scientific Computing, 1988, 9: 152-163.

二级参考文献5

1Volkov V,Demmel J W.Benchmarking GPUs to Tune Dense Linear Algebra[C] //Proc.of the ACM/IEEE Conference on Supercomputing.Austin,Texas,USA:IEEE Press,2008:1-11.
2Hall J D,Cart N A,Hart J C.Cache and Bandwidth Aware Matrix Multiplication on the GPU[R].Dept.of Computer Science,University of Illinois at Urbana-Champaign,Tech.Rep:UIUCDCS-R-2003-2328,2003.
3Li Yinan,Dongarra J,Tomov S.A Note on Auto-tuning GEMM for GPUs[R].Dept.of Computer Science,University of Tennessee,Tech.Rap.:UT-CS-09-635,2009.
4Ohshima S,Kise K,Katagiri T,et al.Parallel Processing of Matrix Multiplication in a CPU and GPU Heterogeneous Environment[C] // Proc.of the 7th International Meeting on High Performance Computing for Computational Science.Rio de Janeiro,Brazil:Springer,2006:305-318.
5Fatiea M.Accelerating Linpack with CUDA on Heterogenous Chsters[C] //Proc.of the 2nd Workshop on General Purpose Processing on Graphics Processing Units.Washington D.C.,USA:ACM Press,2009:46-51.

共引文献10

1魏泉苗,黄冬梅,张弛.数据流优化匹配在数字海洋中的应用[J].计算机工程,2011,37(23):75-76.
2郭绍忠,王伟,周刚,胡艳.基于GPU的单源最短路径算法设计与实现[J].计算机工程,2012,38(2):42-44. 被引量：4
3马海晨,韦刚,吴百峰.基于GPGPU的生物序列快速比对[J].计算机工程,2012,38(4):241-244. 被引量：5
4张凌洁,赵英.基于GPU的并行APSP问题的研究[J].电子设计工程,2012,20(17):15-18. 被引量：2
5郑晓薇,侯立斐,于梦玲.GPU并行计算在LSSVM股票预测上的研究与应用[J].计算机应用与软件,2013,30(1):34-36. 被引量：1
6田盼,华蓓,陆李.基于GPU的K-近邻算法实现[J].计算机工程,2015,41(2):189-192. 被引量：3
7汤佳,龚奕利,李文海.一种基于GPU的KNN动态扩展查询策略[J].计算机工程,2018,44(6):1-7.
8康林瑶,唐兵,夏艳敏,张黎.基于GPU加速和非负矩阵分解的并行协同过滤推荐算法[J].计算机科学,2019,46(8):106-110. 被引量：4
9吴红斌,王旻洋,丁明,孙鸣,毕锐,徐斌.基于AA-SVRPF的配电网负荷供应能力不确定性评估[J].中国电机工程学报,2022,42(22):8153-8163. 被引量：3
10尚智,陈硕.大型矩阵相乘并行计算的特性分析[J].软件工程与应用,2013,2(1):15-19. 被引量：2

1郑小宏,兰杰,郝华,曾雉.GPU加速在第一性原理输运研究中的应用[J].科研信息化技术与应用,2013,4(5):90-96. 被引量：2
2李登峰,陈书燕.对偶框架稀疏性的两个结果[J].数学学报（中文版）,2014,57(4):737-744.
3龚曙光,刘奇良,卢海山,周志勇,张佳.无网格Galerkin法GPU加速并行计算及其应用[J].计算力学学报,2015,32(6):745-751. 被引量：1
4Jianming Xia,Demin Wei.GPU Accelerated Computation for Natural Frequencies of Structures[J].通讯和计算机（中英文版）,2010,7(6):10-13. 被引量：1
5徐骥,葛蔚,任瑛,李静海.Particle-Mesh Ewald(PME)算法的GPU加速[J].计算物理,2010,27(4):548-554. 被引量：5
6丁鹤平,朱竹青,孙敏,王晓雷,周延怀.基于图形处理单元的数字全息图加速再现算法研究[J].中国激光,2010,37(11):2901-2905. 被引量：1
7杭旭登,刘兴平,宋杰.黑油模型新解法器的研制[J].数值计算与计算机应用,2004,25(1):60-64.
8任胜寒,陈雪利,曹旭,朱守平,梁继民.GPU accelerated simplified harmonic spherical approximation equations for three-dimensional optical imaging[J].Chinese Optics Letters,2016,14(7):80-84.
9孔波,刘小茂,曹淑娟,苏展.预抽取相对较近边界向量的选块算法[J].计算机工程与应用,2006,42(28):170-173. 被引量：2
10易茜,武林会,王欣,陈玮婷,张丽敏,赵会娟,高峰.基于GPU加速蒙特卡罗建模的时域荧光扩散层析方法[J].中国激光,2013,40(5):126-132. 被引量：4

应用数学与计算数学学报

2016年第1期

浏览历史

内容加载中请稍等...

基于块子空间迭代算法的GPU加速

参考文献11

二级参考文献5

共引文献10

相关作者

相关机构

相关主题

浏览历史