期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向异构众核架构的块Gauss-Seidel/Jacobi预条件算法
1
作者 吴立垒 陈荣亮 +4 位作者 罗力 闫争争 廖子菊 迟利华 刘杰 《计算机学报》 EI CSCD 北大核心 2019年第11期2447-2460,共14页
Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将... Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将其作为区域分解算法的子区域求解器.面向神威太湖之光超级计算机的异构众核架构,设计并实现了该算法.为充分利用神威太湖之光国产SW26010芯片中每个CPE拥有的高速LDM(Local Data Memory),缓解通信瓶颈,设计了多行块通信打包、计算与通信重叠性能优化策略和丢弃非关键元素的低通信复杂性数值优化方法.数值实验结果显示,相较于串行Gauss-Seidel算法,优化后的块Gauss-Seidel/Jacobi算法预处理过程加速比最高可达到4.16倍.以1040核的测试数据为基准,在处理器核数达到33280时,块Gauss-Seidel/Jacobi预条件算法的并行效率达到61%. 展开更多
关键词 非结构网格 异构众核架构 区域分解算法 Gauss-Seidel/jacobi算法 神威太湖之光
下载PDF
大型特征值问题的修正块Jacobi-Davidson算法
2
作者 缪红益 《中国校外教育》 2014年第6期80-80,共1页
块Jacobi-Davidson算法是计算大型实对称矩阵特征值问题的有效算法。算法分为内外两层迭代,外层迭代计算矩阵特征对,内层迭代求解校正方程组,计算量主要花费是校正方程组的求解.本文研究块Jacobi—Davidson方法中校正方程的求解.在校正... 块Jacobi-Davidson算法是计算大型实对称矩阵特征值问题的有效算法。算法分为内外两层迭代,外层迭代计算矩阵特征对,内层迭代求解校正方程组,计算量主要花费是校正方程组的求解.本文研究块Jacobi—Davidson方法中校正方程的求解.在校正方程的求解过程中使用外推技术,使收敛的速度加快。 展开更多
关键词 jacobi—Davidson算法 校正方程 外推技术
下载PDF
基于GPU架构的两层并行块Jacobi SVD算法 被引量:2
3
作者 黄荣锋 赵永华 +1 位作者 于天禹 刘世芳 《数值计算与计算机应用》 2022年第4期380-399,共20页
SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了... SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了共享内存不足的问题.此外,块间并行还通过矩阵块操作技术提高数据利用率及数据预取技术实现数据访问和数据计算的重叠.块内并行通过直接更新矩阵列块之间的内积替代了更新矩阵列块以及更新矩阵列块之后计算矩阵列块之间内积的归约操作,增加了GPU线程的利用率.另一方面,块内并行将需要多次访问的数据存储于共享内存或寄存器,减少了对全局内存的访问从而提升了算法实现性能。在NVIDIATeslaV100GPU上的数值实验结果表明,本文的算法较Cusolver库有1.8×倍的加速,较MAGMA库中最快的算法加速达2.5×倍. 展开更多
关键词 奇异值分解 块jacobi算法 并行算法 GPU 数据预取技术
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部