-
题名对称矩阵三对角化的有效并行块算法设计
被引量:3
- 1
-
-
作者
赵永华
迟学斌
程强
陈江
赵涛
-
机构
中国科学院计算机网络信息中心超级计算中心
-
出处
《数值计算与计算机应用》
CSCD
2006年第2期123-132,共10页
-
基金
中国科学院知识创新工程信息化建设专项(INF05-SCE)国家"863"项目(863
2002AA104540)国家自然科学基金"当代并行机的并行算法应用基础研究"(2005LB321702)
-
文摘
在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中.本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法.分析块算法大小同矩阵规模和处理器数量的关系.在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能.
-
关键词
对称矩阵
并行块算法
三对角矩阵
特征值
加速比
-
Keywords
symmetric matrix, parallel blocking algorithm, tridiagonal matrix, eigenvalue, speedup
-
分类号
O241.6
[理学—计算数学]
-
-
题名对称矩阵三对角化的混合并行算法设计
被引量:3
- 2
-
-
作者
赵永华
迟学斌
陈江
-
机构
中国科学院计算机网络信息中心超级计算中心
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第22期39-41,53,共4页
-
基金
国家"863"超级计算网格节点建设基金资助项目(2002AA104540)
中国科学院知识创新工程信息化建设专项基金资助项目(INF05-SCE)
-
文摘
基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。
-
关键词
对称矩阵
并行块算法
三对角矩阵
加速比
MPI+OPENMP
-
Keywords
Symmetric matrix
Parallel algorithm
Tridiagonal matrix
Speedup
MPI+OpenMP
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名求解常微分方程初值问题的并行块预估-校正方法
- 3
-
-
作者
沈赤
-
机构
华北电力大学
-
出处
《计算机工程与设计》
CSCD
北大核心
1998年第1期48-51,共4页
-
文摘
针对多处理机系统构造了一类具有较高并行度的并行块预估-校正方法。在k=2,s=3的情况下,给出了一个具有四阶精度的并行计算公式,并讨论了该方法的稳定性。
-
关键词
并行块算法
常微分方程
初值问题
-
Keywords
Multiprocessor system Parallel block method Ordinary Differential equations Predictor-corrector method
-
分类号
O241.81
[理学—计算数学]
-