期刊文献+

多处理机多前端代码的向量化

下载PDF
导出
摘要 本文介绍为直接求解大型稀疏线性方程组而促进多处理机上多前端(multifrontal)代码的向量化在方法设计上应作的变化。这些变化使用了完全高斯消元法中已成功运用过的技术,并象现Level 2和Level 3 BLAS中实现的那样,以使用“矩阵—向量”和“矩阵—矩阵”核心为基础。通过在IBM3090/VF,ETA-10P及Cray-2上运行,我们说明了改进后代码的性能。虽然我们的实验主要是在这些机器的单处理机上进行,我们却主要考虑多重处理的影响。得到的加速比因数大于11,修改后的代码对标准结构问题在Cray-2的单处理机上执行速度大于200MFLOPS。
出处 《计算机工程与科学》 CSCD 1990年第2期25-37,共13页 Computer Engineering & Science
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部