-
题名基于GPU的稀疏线性系统的预条件共轭梯度法
被引量:10
- 1
-
-
作者
张健飞
沈德飞
-
机构
河海大学力学与材料学院
-
出处
《计算机应用》
CSCD
北大核心
2013年第3期825-829,共5页
-
基金
国家自然科学基金资助项目(51109072)
-
文摘
研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。
-
关键词
图形处理器
稀疏线性方程组
预条件共轭梯度法
压缩稀疏行
统一计算设备架构
-
Keywords
Graphic Processing Unit (GPU)
sparse linear equations
preconditioned conjugate gradient method
Compressed Sparse Row (CSR)
Compute Unified Device Architecture (CUDA)
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向稀疏矩阵向量乘的DMA设计与验证
- 2
-
-
作者
曹亚松
刘胜
-
机构
国防科技大学计算机学院
-
出处
《计算机与数字工程》
2019年第11期2686-2690,共5页
-
文摘
稀疏矩阵向量乘法(SpMV)是迭代法求解大型线性方程组的核心算法,被广泛应用在科研和工程中。高性能共轭梯度算法(HPCG)是评价高性能计算系统性能的测试程序之一,需要多次调用SpMV进行迭代计算。但是,SpMV计算过程中包含大量不规则访存操作,降低了系统计算性能。基于X-DSP项目,在DMA中设计一条面向SpMV的专用数据通道实现不规则访存的功能,提高HPCG算法运算速度。设计代码的验证与综合结果表明预期的功能实现正确,且满足项目对时序、面积和功耗的要求。
-
关键词
稀疏矩阵向量乘法(SpMV)
直接内存存取(DMA)
压缩稀疏行(CSR)
-
Keywords
Sparse Matrix-Vector Multiplication(SpMV)
Direct Memory Access(DMA)
Compressed Sparse Row(CSR)
-
分类号
O183.1
[理学—基础数学]
-