期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于分块存储格式的稀疏线性系统求解优化 被引量:3
1
作者 程凯 田瑾 +2 位作者 吴飞 汪茹 李洪芹 《计算机应用研究》 CSCD 北大核心 2019年第11期3352-3356,共5页
针对基于GPU求解大规模稀疏线性方程组进行了研究,提出一种稀疏矩阵的分块存储格式HMEC(hybrid multiple ELL and CSR)。通过重排序优化系数矩阵的存储结构,将系数矩阵以一定的比例分块存储,采用ELL与CSR存储格式相结合的方式以适应不... 针对基于GPU求解大规模稀疏线性方程组进行了研究,提出一种稀疏矩阵的分块存储格式HMEC(hybrid multiple ELL and CSR)。通过重排序优化系数矩阵的存储结构,将系数矩阵以一定的比例分块存储,采用ELL与CSR存储格式相结合的方式以适应不同的分块特征,分别使用适用于不对称矩阵的不完全LU分解预处理BiCGStab法和对称正定矩阵的不完全Cholesky分解预处理共轭梯度法求解大规模稀疏线性系统。实验表明,应用HMEC格式存储稀疏矩阵并以调用GPU kernel的方式实现前述两种方法,与其他存储格式的实现方式作比较,最优可分别获得31.89%和17.50%的加速效果。 展开更多
关键词 GPU加速 共轭梯度 稳定双共轭梯度 重排序 hmec存储格式 稀疏矩阵与向量乘
下载PDF
基于GPU的高效稀疏矩阵存储格式研究 被引量:8
2
作者 程凯 田瑾 马瑞琳 《计算机工程》 CAS CSCD 北大核心 2018年第8期54-60,共7页
针对基于GPU求解大规模稀疏线性方程组的问题,提出一种稀疏矩阵的存储格式HEC,并应用该格式在统一计算设备架构(CUDA)平台上实现不完全LU分解的预条件共轭梯度(ILUCG)法。该存储格式由ELL与CSR格式混合而成,将其以调用GPU kernel的方式... 针对基于GPU求解大规模稀疏线性方程组的问题,提出一种稀疏矩阵的存储格式HEC,并应用该格式在统一计算设备架构(CUDA)平台上实现不完全LU分解的预条件共轭梯度(ILUCG)法。该存储格式由ELL与CSR格式混合而成,将其以调用GPU kernel的方式实现ILUCG法并应用于大型稀疏线性系统的求解中,可提高稀疏矩阵的存储效率,减少稀疏矩阵与向量乘(SpMV)的运算时间。实验结果表明,与目前广泛使用的基于CSR和HYB存储格式并调用CUSPARSE库函数的实现方式相比,该实现方式最优可得10.4%的加速效果,并且具有良好的SpMV运算性能。 展开更多
关键词 图像处理单元 CUSPARSE库 HEC存储格式 稀疏矩阵与向量乘 不完全LU分解 预条件共轭梯度法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部