期刊文献+

动态检查点容错技术研究

Research on Fault Tolerance with Dynamic Checkpointing
下载PDF
导出
摘要 检查点技术是目前普遍使用的一种系统容错方法,能够有效地提高系统运行效率.在传统检查点技术的基础上提出了面向节点瞬时故障的动态检查点容错技术,通过对节点及其运行进程的实时监控数据的分析,给出检查点的引入、保存、恢复和取消的时机.由于检查点技术在实施过程中会影响部分系统运行效率,该技术主要面向可能被瞬时故障影响且运行长时进程的节点.
作者 袁宁 刘德峰
出处 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期221-225,共5页 Journal of Computer Research and Development
关键词 容错 检查点 动态
  • 相关文献

参考文献6

  • 1[1]Top500.List for November 2004.http://www.top500.org/list.htm,2005
  • 2[2]E N Elnozahy,D B Johnson,Y M Wang.A survey of rollback-recovery protocols in message passing systems.Department of Computer Science,Carnegie Mellon University,Tech Rep:CMU-CS-96-181,1996
  • 3[3]陈国梁,吴俊敏,章锋,等.并行计算机体系结构.北京:高等教育出版社,2002
  • 4[4]Jon Stearley.Defining and measuring supercomputer reliability,availability,and serviceability (RAS).The 6th LCI Int'l Conf on Linux Clusters,Chapel hill,North Carolina,2005
  • 5[5]K F Wong,M Franklin.Checkpointing in distributed computing systems.Journal of Parallel and Distributed Computing,1996,35(11):67-75
  • 6[6]Vijay S Pai,Parthasarathy Ranganathan,Sarita V Adve.RSIM Reference Manual.Department of Electrical Computer Engineering,Rice University,Tech Rep:9705,1997.http://www-ece.rice.edu/rsim

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部