期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
被引量:
6
1
作者
刘书勇
吴艳霞
+2 位作者
张博为
张国印
戴葵
《电子学报》
EI
CAS
CSCD
北大核心
2015年第8期1642-1650,共9页
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩...
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.
展开更多
关键词
矩阵三角化分解
三角
化
过程
并行算法
LU
分解
现场可编程门阵列
下载PDF
职称材料
基于矩阵三角化分解的Cholesky分解及FPGA并行结构设计
被引量:
7
2
作者
刘书勇
林俊宇
+1 位作者
吴艳霞
张博为
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第9期963-968,共6页
矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与...
矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与通用处理器的软件实现相比,本文实现的Cholesky分解的FPGA并行结果在核心计算性能上可以取得10倍以上的加速比,该算法针对矩阵三角化计算过程具有更高的数据和流水并行性。
展开更多
关键词
矩阵三角化分解
CHOLESKY
分解
并行结构
现场可编程门阵列
原文传递
题名
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
被引量:
6
1
作者
刘书勇
吴艳霞
张博为
张国印
戴葵
机构
哈尔滨工程大学计算机科学与技术学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2015年第8期1642-1650,共9页
基金
国家自然科学基金(No.61003036)
计算机体系结构国家重点实验室开放课题(No.CARCH201301)
+1 种基金
博士后科研启动基金(No.LBHQ12134)
中央高校基本科研业务经费专项基金(No.HEUCF100606)
文摘
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.
关键词
矩阵三角化分解
三角
化
过程
并行算法
LU
分解
现场可编程门阵列
Keywords
matrix triangularization decomposition
triangularization process
parallel algorithm
LU decomposition
field programmable gate array
分类号
TP102.1 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于矩阵三角化分解的Cholesky分解及FPGA并行结构设计
被引量:
7
2
作者
刘书勇
林俊宇
吴艳霞
张博为
机构
哈尔滨工程大学计算机科学与技术学院
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第9期963-968,共6页
基金
国家自然科学基金面上项目(61003036)
计算机体系结构国家重点实验室开放课题(CARCH201301)
中央高校基本科研业务经费专项基金(HEUCF100606)
文摘
矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与通用处理器的软件实现相比,本文实现的Cholesky分解的FPGA并行结果在核心计算性能上可以取得10倍以上的加速比,该算法针对矩阵三角化计算过程具有更高的数据和流水并行性。
关键词
矩阵三角化分解
CHOLESKY
分解
并行结构
现场可编程门阵列
Keywords
matrix triangularization decomposition
Cholesky decomposition
parallel structure
field programmable gate array
分类号
TP302.1 [自动化与计算机技术—计算机系统结构]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
刘书勇
吴艳霞
张博为
张国印
戴葵
《电子学报》
EI
CAS
CSCD
北大核心
2015
6
下载PDF
职称材料
2
基于矩阵三角化分解的Cholesky分解及FPGA并行结构设计
刘书勇
林俊宇
吴艳霞
张博为
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016
7
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部