Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将...Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将其作为区域分解算法的子区域求解器.面向神威太湖之光超级计算机的异构众核架构,设计并实现了该算法.为充分利用神威太湖之光国产SW26010芯片中每个CPE拥有的高速LDM(Local Data Memory),缓解通信瓶颈,设计了多行块通信打包、计算与通信重叠性能优化策略和丢弃非关键元素的低通信复杂性数值优化方法.数值实验结果显示,相较于串行Gauss-Seidel算法,优化后的块Gauss-Seidel/Jacobi算法预处理过程加速比最高可达到4.16倍.以1040核的测试数据为基准,在处理器核数达到33280时,块Gauss-Seidel/Jacobi预条件算法的并行效率达到61%.展开更多
For the linear least squares problem with coefficient matrix columns being highly correlated, we develop a greedy randomized Gauss-Seidel method with oblique direction. Then the corresponding convergence result is ded...For the linear least squares problem with coefficient matrix columns being highly correlated, we develop a greedy randomized Gauss-Seidel method with oblique direction. Then the corresponding convergence result is deduced. Numerical examples demonstrate that our proposed method is superior to the greedy randomized Gauss-Seidel method and the randomized Gauss-Seidel method with oblique direction.展开更多
基于高斯-赛德(Gauss-Seidel,GS)和加权Neumann序列展开式(weight Neumann Series Approximation,wNSA)相结合的方法,在大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统中进行信号检测研究。首先,将基于GS的软输出信号检...基于高斯-赛德(Gauss-Seidel,GS)和加权Neumann序列展开式(weight Neumann Series Approximation,wNSA)相结合的方法,在大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统中进行信号检测研究。首先,将基于GS的软输出信号检测算法作为研究对象,证实相比于传统的Neumann算法,GS迭代算法具有更优的性能。其次,在传统Neumann序列展开算法的基础上研究加权Neumann序列展开算法,并将加权Neumann序列作为GS算法的迭代初值,设计得到w NSA-Gauss-Seidel算法,显著提升收敛速率。实验结果表明,相比于现有GS迭代算法和美国国家安全局(National Security Agency,NSA)的信号检测算法,基于wNSAGauss-Seidel的信号检测算法不仅在性能方面具有明显优势,而且在具有挑战性的信道传播环境中能够以较低的复杂度获得接近最小均方误差(Minimum Mean Square Error,MMSE)信号检测算法的性能。展开更多
基金Supported by the National Natural Science Foundation of China under Grant No.60373008(国家自然科学基金)the National High-Tech Research and Development Plan of China under Grant No.2006AA01Z105(国家高技术研究发展计划(863))the Key Project of the Ministry of Education of China under Grant No.106019(国家教育部科学技术研究重点项目)
文摘Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将其作为区域分解算法的子区域求解器.面向神威太湖之光超级计算机的异构众核架构,设计并实现了该算法.为充分利用神威太湖之光国产SW26010芯片中每个CPE拥有的高速LDM(Local Data Memory),缓解通信瓶颈,设计了多行块通信打包、计算与通信重叠性能优化策略和丢弃非关键元素的低通信复杂性数值优化方法.数值实验结果显示,相较于串行Gauss-Seidel算法,优化后的块Gauss-Seidel/Jacobi算法预处理过程加速比最高可达到4.16倍.以1040核的测试数据为基准,在处理器核数达到33280时,块Gauss-Seidel/Jacobi预条件算法的并行效率达到61%.
文摘For the linear least squares problem with coefficient matrix columns being highly correlated, we develop a greedy randomized Gauss-Seidel method with oblique direction. Then the corresponding convergence result is deduced. Numerical examples demonstrate that our proposed method is superior to the greedy randomized Gauss-Seidel method and the randomized Gauss-Seidel method with oblique direction.