期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于可重构计算系统的矩阵三角化分解硬件并行结构研究 被引量:6
1
作者 刘书勇 吴艳霞 +2 位作者 张博为 张国印 戴葵 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1642-1650,共9页
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩... 可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比. 展开更多
关键词 矩阵三角化分解 三角过程 并行算法 LU分解 现场可编程门阵列
下载PDF
基于矩阵三角化分解的Cholesky分解及FPGA并行结构设计 被引量:7
2
作者 刘书勇 林俊宇 +1 位作者 吴艳霞 张博为 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第9期963-968,共6页
矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与... 矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与通用处理器的软件实现相比,本文实现的Cholesky分解的FPGA并行结果在核心计算性能上可以取得10倍以上的加速比,该算法针对矩阵三角化计算过程具有更高的数据和流水并行性。 展开更多
关键词 矩阵三角化分解 CHOLESKY分解 并行结构 现场可编程门阵列
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部