期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
分布式仿真系统非阻塞式协同检查点协议 被引量:2
1
作者 刘云生 黄健 查亚兵 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第1期71-74,共4页
联邦存储是实现分布式仿真系统容错的基础,IEEE1516-2000中提供了一种阻塞式的系统状态存储协议,实际使用时会给系统带来很大开销。根据对系统状态存储过程中仿真组件状态变化影响因素的分析,提出了一种非阻塞式的系统状态存储协议,该... 联邦存储是实现分布式仿真系统容错的基础,IEEE1516-2000中提供了一种阻塞式的系统状态存储协议,实际使用时会给系统带来很大开销。根据对系统状态存储过程中仿真组件状态变化影响因素的分析,提出了一种非阻塞式的系统状态存储协议,该协议完整地解决了由于在系统状态存储期间允许时间推进导致所保存的RTI状态和对应成员状态时间上的不一致、由于成员间消息传递导致不同成员状态的不一致及in-transit消息问题。先完成状态保存的成员不需阻塞,该协议在一定程度上降低了联邦存储的开销。证明了该协议的正确性。 展开更多
关键词 分布式仿真 容错 联邦存储 非阻塞式协同检查点协议
下载PDF
一种基于移动计算的非阻塞协同检查点算法 被引量:1
2
作者 姚建盛 刘艳玲 《哈尔滨理工大学学报》 CAS 北大核心 2011年第2期60-65,共6页
传统分布式网络中协同检查点算法有许多优点,但移动计算环境有很多新问题,如缺少可靠存储、低无线网络带宽、高移动性、断开连接和能量限制等,使得协同检查点算法不能很好地适用于移动计算环境.为此提出一种适合移动计算环境的非阻塞的... 传统分布式网络中协同检查点算法有许多优点,但移动计算环境有很多新问题,如缺少可靠存储、低无线网络带宽、高移动性、断开连接和能量限制等,使得协同检查点算法不能很好地适用于移动计算环境.为此提出一种适合移动计算环境的非阻塞的协同检查点算法,算法中检查点的发起和同步由移动支持站完成,只需记录部分中途消息就能实现一致可恢复.算法对移动主机是透明的,低开销的. 展开更多
关键词 移动计算 容错 协同检查点 卷回恢复
下载PDF
一种面向大规模并行系统的分组协同检查点算法 被引量:1
3
作者 黄琼 尚利宏 +1 位作者 周密 金惠华 《计算机研究与发展》 EI CSCD 北大核心 2010年第S1期158-163,共6页
随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检... 随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检查点文件,这使得其开销率显著增加.提出一种新的基于分组的协同检查点算法,它使用更好的调度策略使得某一组进程在设置检查点时,其他的进程能够更多地处于计算状态,从而有效地减少了检查点开销.实验表明该算法在系统规模增加时具有良好地可扩展性. 展开更多
关键词 大规模并行系统 协同检查点 检查点
下载PDF
一种费用最小的非阻塞协同检查点算法
4
作者 门朝光 左德承 杨孝宗 《高技术通讯》 EI CAS CSCD 2004年第9期20-24,共5页
将协同检查点策略中采取的最小化同步信息以及检查点数量的策略与不阻塞进程的基本运行策略相结合,提出了一种只需最小数量的进程参与的非阻塞协同检查点算法。该算法利用计算检查点避免由于不阻塞进程的基本执行可能产生的孤儿消息。... 将协同检查点策略中采取的最小化同步信息以及检查点数量的策略与不阻塞进程的基本运行策略相结合,提出了一种只需最小数量的进程参与的非阻塞协同检查点算法。该算法利用计算检查点避免由于不阻塞进程的基本执行可能产生的孤儿消息。通过在广播确认消息中捎带哪些进程产生了新的检查点的信息,使每个进程的检查点序号在所有进程中是一致的。该算法在费用上优于已有的协同检查点算法。 展开更多
关键词 进程 最小化 消息 费用 确认 信息 非阻塞协同检查点算法 分布式容错计算系统 卷回恢复
下载PDF
一个适合大规模集群并行计算的检查点系统 被引量:12
5
作者 周恩强 卢宇彤 沈志宇 《计算机研究与发展》 EI CSCD 北大核心 2005年第6期987-992,共6页
分布式检查点系统是大规模并行计算系统容错的重要手段.协议开销和检查点映像存储成为困扰并行检查点系统可伸缩性的两大瓶颈.针对并行应用程序的执行特征和高性能集群的体系结构特点,C系统分别采用动态虚连接技术和分布存储检查点映像... 分布式检查点系统是大规模并行计算系统容错的重要手段.协议开销和检查点映像存储成为困扰并行检查点系统可伸缩性的两大瓶颈.针对并行应用程序的执行特征和高性能集群的体系结构特点,C系统分别采用动态虚连接技术和分布存储检查点映像的方法来有效降低协同式检查点的开销,增强检查点系统的可伸缩性.初步测试结果表明,C系统的设计策略适合大规模并行计算的容错. 展开更多
关键词 集群 协同检查点 MPI
下载PDF
基于Lustre文件系统的MPI检查点系统实现技术与性能测试 被引量:4
6
作者 谢旻 卢宇彤 +2 位作者 周恩强 曹宏嘉 杨学军 《计算机研究与发展》 EI CSCD 北大核心 2007年第10期1709-1716,共8页
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同... 基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性. 展开更多
关键词 容错技术 MPICH2 回卷恢复 协同检查点 LUSTRE文件系统
下载PDF
一种基于移动计算环境的因果日志卷回恢复算法 被引量:7
7
作者 张展 左德承 +1 位作者 慈轶为 杨孝宗 《计算机研究与发展》 EI CSCD 北大核心 2008年第2期348-357,共10页
由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法... 由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法完全实现一致的异步卷回恢复.基于因果消息日志,提出一种新的移动计算环境的卷回恢复算法:通过先行图来记录节点间的消息依赖关系,将异步检查点、基于发送方的暂存消息日志和先行图全部在移动支持站上存储和处理,为移动节点提供一种透明的容错服务,完全消除依赖关系在移动节点之间造成的影响.用形式化的方法证明了系统的一致性.仿真结果表明,在卷回开销达到最低的同时,也显著降低了无错运行时的通信和存储开销. 展开更多
关键词 因果日志 先行图 协同检查点 移动节点 移动支持站
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部