期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
SFT: A Consistent Checkpointing Algorithm with Short Freezing Time
1
作者 魏晓辉 鞠九滨 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第2期169-175,共7页
A consistent checkpointing algorithm with short freezing time (SFT) is presented in this paper. It supports fault-tolerance in distributed systems. The algorithm has shorter freezing time, lower overhead, and simplici... A consistent checkpointing algorithm with short freezing time (SFT) is presented in this paper. It supports fault-tolerance in distributed systems. The algorithm has shorter freezing time, lower overhead, and simplicity of recovery. To make checkpoint time shorter, a special control message (Munblock) is used to ensure that a process can respond the checkpoint event quickly at any given time. Moreover, main memory algorithm is used to improve the concurrency of checkpointing. By using SFT, the freezing time resulted by checkpointing is less than 0.03s. Furthermore, the control message number of SFT is only O(n). 展开更多
关键词 checkpointing fault-tolerance distributed system freezing time
原文传递
SFT:一个具有较短冻结时间的一致检查点算法 被引量:2
2
作者 魏晓辉 鞠九滨 《计算机学报》 EI CSCD 北大核心 1999年第6期645-650,共6页
介绍了一个基于消息记录的一致检查点算法——SFT算法.SFT算法能够实现分布式系统的容错.该算法具有无多米诺效应、冻结时间短、开销小和重启动算法简单的优点.SFT的IPC机制基于PVM,能够保证消息的有序到达,并且其... 介绍了一个基于消息记录的一致检查点算法——SFT算法.SFT算法能够实现分布式系统的容错.该算法具有无多米诺效应、冻结时间短、开销小和重启动算法简单的优点.SFT的IPC机制基于PVM,能够保证消息的有序到达,并且其消息的发送和接收操作都是原子操作.另外,IPC机制中进程的id值编码与所在机器无关.这样一个进程即使从故障机器迁移到其它机器上运行仍可与其它进程继续通信.为提高检查点操作的并行性,SFT算法在进行检查点操作时不但避免使用全局同步操作,而且使用了主存算法.另外,SFT算法中的控制消息Munblock可以使一个进程在任何时刻都能尽快地响应检查点事件.SFT算法的冻结时间小于0.03s,而且其控制消息的数目仅为O(n). 展开更多
关键词 分布式系统 容错 检查点 冻结时间 操作系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部