-
题名分层检查点的近似最优周期计算模型
被引量:1
- 1
-
-
作者
吕宏武
谷雷
王慧强
邹世辰
冯光升
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2017年第1期103-107,共5页
-
基金
国家自然科学基金资助项目(61370212
61402127
+1 种基金
61502118)
黑龙江省自然科学基金资助项目(F2015029)~~
-
文摘
针对大规模高性能计算(HPC)系统中检查点效率提升问题,提出一种面向分层检查点近似最优周期计算模型。首先,通过分析一个HPC系统中应用程序的执行过程,将检查点周期优化抽象为一个非线性的检查点成本模型;其次,通过分析可能故障位置推导出分层检查点成本公式,并引入两个减速因子和一个加速因子来模拟消息日志对分层检查点造成的影响。仿真实验结果表明,所提模型与理论近似最优周期检查点成本平均误差在5%以下,相对传统检查点周期优化模型的平均误差降低了20%,能够有效提高检查点的效率,提升HPC系统可用性。
-
关键词
高性能计算
容错
分层检查点
检查点周期
近似最优解
-
Keywords
High Performance Computation (HPC)
fault tolerance
hierarchical checkpoint
checkpoint period
quasi-optimal solution
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
TP302
[自动化与计算机技术—计算机系统结构]
-