期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多处理机多前端代码的向量化
1
作者
patrick r.amestoy
Lain S.Duff
燕莉
《计算机工程与科学》
CSCD
1990年第2期25-37,共13页
本文介绍为直接求解大型稀疏线性方程组而促进多处理机上多前端(multifrontal)代码的向量化在方法设计上应作的变化。这些变化使用了完全高斯消元法中已成功运用过的技术,并象现Level 2和Level 3 BLAS中实现的那样,以使用“矩阵—向量...
本文介绍为直接求解大型稀疏线性方程组而促进多处理机上多前端(multifrontal)代码的向量化在方法设计上应作的变化。这些变化使用了完全高斯消元法中已成功运用过的技术,并象现Level 2和Level 3 BLAS中实现的那样,以使用“矩阵—向量”和“矩阵—矩阵”核心为基础。通过在IBM3090/VF,ETA-10P及Cray-2上运行,我们说明了改进后代码的性能。虽然我们的实验主要是在这些机器的单处理机上进行,我们却主要考虑多重处理的影响。得到的加速比因数大于11,修改后的代码对标准结构问题在Cray-2的单处理机上执行速度大于200MFLOPS。
展开更多
关键词
多处理机
向量化
高斯消元法
多重处理
执行速度
加速比
矩阵图
主元
并行性
元树
下载PDF
职称材料
题名
多处理机多前端代码的向量化
1
作者
patrick r.amestoy
Lain S.Duff
燕莉
出处
《计算机工程与科学》
CSCD
1990年第2期25-37,共13页
文摘
本文介绍为直接求解大型稀疏线性方程组而促进多处理机上多前端(multifrontal)代码的向量化在方法设计上应作的变化。这些变化使用了完全高斯消元法中已成功运用过的技术,并象现Level 2和Level 3 BLAS中实现的那样,以使用“矩阵—向量”和“矩阵—矩阵”核心为基础。通过在IBM3090/VF,ETA-10P及Cray-2上运行,我们说明了改进后代码的性能。虽然我们的实验主要是在这些机器的单处理机上进行,我们却主要考虑多重处理的影响。得到的加速比因数大于11,修改后的代码对标准结构问题在Cray-2的单处理机上执行速度大于200MFLOPS。
关键词
多处理机
向量化
高斯消元法
多重处理
执行速度
加速比
矩阵图
主元
并行性
元树
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多处理机多前端代码的向量化
patrick r.amestoy
Lain S.Duff
燕莉
《计算机工程与科学》
CSCD
1990
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部