-
题名一种新的优化的检查点间隔的求解模型
被引量:1
- 1
-
-
作者
蒋廷耀
李庆华
-
机构
华中科技大学计算机学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第3期448-451,共4页
-
基金
国家高性能计算基金 (993 13 )的资助
-
文摘
在具有容错功能的高性能计算环境中 ,由于加入检查点机制会给系统引入额外负载 ,检查点间隔的适当选定能使系统性能优化 .Vaidya的贡献是用他的模型得出的优化的检查点间隔的求解等式独立于检查点潜伏时间 (L )及检查点恢复时间 (R) ,本文介绍了一种新的基于时间分段的模型 NSBM,引入了系统平均利用率这一容错领域更易理解的概念代替 Vaidya模型中的平均负载率并推导出了也是独立于 L及 R的求解等式 .实验结果表明 NSBM的求解模型比
-
关键词
优化
检查点间隔
求解模型
容错
负载率
利用率
时间分段模型
计算机
-
Keywords
fault tolerant
checkpoint interval
overhead
availability
-
分类号
TP302.8
[自动化与计算机技术—计算机系统结构]
-
-
题名PDES中乐观时间同步的时空损耗研究
被引量:1
- 2
-
-
作者
王学慧
邱晓刚
李革
黄柯棣
-
机构
国防科技大学机电工程与自动化学院军仿
-
出处
《计算机仿真》
CSCD
2006年第2期86-89,共4页
-
文摘
并行离散事件仿真对复杂大规模动态系统的研究以及探索其长远的应用提供了便利,近年来日益成为研究的热点。然而时间同步管理是影响并行离散事件仿真系统高效运行的重要因素之一。乐观的同步是采用检测和回退机制,允许逻辑进程积极的处理本地事件,一旦出现同步错误则利用回退机制从错误中恢复到较早状态,然后再恢复执行。这一切都是通过基于检查点状态保存重建机制来实现的,因而状态保存及状态重建必然伴随着时间和空间的损耗。该文深入研究了在乐观同步机制下,仿真执行时间和内存空间的损耗与检查点间隔之间的关系,并通过推理计算给出了检查点间隔的最优取值范围。
-
关键词
并行离散事件仿真
乐观同步
检查点
时空损耗
检杳点间隔
-
Keywords
Parallel discrete event simulation(PDES)
Optimistic synchronization
checkpoint
Time -space overhead
checkpoint interval
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名减少检查点开销的一种方法
被引量:1
- 3
-
-
作者
李凯原
杨孝宗
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第2期4-5,14,共3页
-
基金
国家自然科学基金!69873013
-
文摘
设置检查点(checkpointing)是容错计算机系统进行故障恢复的重要手段。设置检查点的开销则是影响其性能的一个主要因素。文章提出了一种预先保存部分检查点数据的新方法。该方法不仅能够有效地减少检查点开销,而且具有比较短的检查点延迟。
-
关键词
故障恢复
检查点开销
容错计算机系统
存储器
-
Keywords
fault tolerance, fault recovery, checkpoint overhead, pre-save
-
分类号
TP380.63
[自动化与计算机技术—计算机系统结构]
-
-
题名一种降低并行程序检查点开销的方法
被引量:3
- 4
-
-
作者
周小成
孙凝晖
霍志刚
马捷
-
机构
中国科学院研究生院
中国科学院计算技术研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第12期84-86,共3页
-
基金
中国科学院新一代机群关键技术研究基金资助项目(KGCX2-SW-116)
-
文摘
检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进一步降低检查点开销的方法。通过控制状态保存线程的调度和选择合适的状态保存粒度,该方法能很好地利用通信阻塞时间隐藏状态保存线程运行时带来的开销,从而能进一步降低开销率。
-
关键词
检查点设置和卷回恢复
检查点开销
通信阻塞时间
-
Keywords
checkpointing and rollback recovery
checkpoint overhead
Communication blocking time
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用时间序列分析方法动态确定检查点时间间隔
被引量:2
- 5
-
-
作者
梁蓓
张大方
杨金民
季洁
-
机构
湖南大学计算机与通信学院
-
出处
《系统仿真学报》
CAS
CSCD
2004年第10期2350-2353,共4页
-
基金
国家自然科学基金资助项目(60273070)
-
文摘
设置检查点是容错计算机系统进行故障恢复的重要手段。检查点的开销则是影响其性能的一个主要因素。许多文献已指出检查点开销主要是来自于对进程状态的保存。文章采用时间序列分析的方法对进程状态大小变化情况进行分析和预测,动态选择恰当的检查点时间间隔,减少检查点时需保存的进程状态量,从而减小了检查点的开销。
-
关键词
容错
检查点开销
时间序列分析
进程检查点
-
Keywords
fault tolerance
checkpoint overhead
Time Series Analysis
checkpointing
-
分类号
TP302.08
[自动化与计算机技术—计算机系统结构]
-
-
题名基于并发性发掘的低开销回卷恢复实现方法
- 6
-
-
作者
袁功彪
杨金民
白树仁
-
机构
湖南大学信息科学与工程学院
湖南大学超级计算中心
-
出处
《计算机工程》
CAS
CSCD
2013年第11期46-51,共6页
-
基金
国家自然科学基金资助项目(61272401
61133005)
湖南省科技计划基金资助重点项目(201GK2003)
-
文摘
现有的回卷恢复容错技术存在同步约束和阻塞问题,其时间开销随系统节点规模的增大而剧增。为此,提出一种基于并发性发掘的低开销回卷恢复实现方法。利用消息传递附带跟踪消息依赖的策略解除消息日志中的同步约束,解析进程负载以发掘进程负载的并发性,构建进程负载并发执行的实现架构,采用数据缓存策略和多线程技术实现进程内部各负载的并发执行,以降低故障恢复开销。3个NAS NPB2.3标准性能检测程序的实验结果表明,该方法可使检查点开销从0.63 s、3.19 s、1.21 s分别降低到0.18 s、0.67 s、0.19 s,日志开销率从13.4%、3.5%、18.3%分别降低到0.7%、0.1%、1.0%。
-
关键词
回卷恢复
时间开销
同步约束
并发性挖掘
消息日志
检查点
-
Keywords
rollback recovery
time overhead
synchronization constraint
concurrency exploiting
message log
checkpoint
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-