期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
分布式仿真系统非阻塞式协同检查点协议
被引量:
2
1
作者
刘云生
黄健
查亚兵
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007年第1期71-74,共4页
联邦存储是实现分布式仿真系统容错的基础,IEEE1516-2000中提供了一种阻塞式的系统状态存储协议,实际使用时会给系统带来很大开销。根据对系统状态存储过程中仿真组件状态变化影响因素的分析,提出了一种非阻塞式的系统状态存储协议,该...
联邦存储是实现分布式仿真系统容错的基础,IEEE1516-2000中提供了一种阻塞式的系统状态存储协议,实际使用时会给系统带来很大开销。根据对系统状态存储过程中仿真组件状态变化影响因素的分析,提出了一种非阻塞式的系统状态存储协议,该协议完整地解决了由于在系统状态存储期间允许时间推进导致所保存的RTI状态和对应成员状态时间上的不一致、由于成员间消息传递导致不同成员状态的不一致及in-transit消息问题。先完成状态保存的成员不需阻塞,该协议在一定程度上降低了联邦存储的开销。证明了该协议的正确性。
展开更多
关键词
分布式仿真
容错
联邦存储
非阻塞式
协同检查点
协议
下载PDF
职称材料
一种基于移动计算的非阻塞协同检查点算法
被引量:
1
2
作者
姚建盛
刘艳玲
《哈尔滨理工大学学报》
CAS
北大核心
2011年第2期60-65,共6页
传统分布式网络中协同检查点算法有许多优点,但移动计算环境有很多新问题,如缺少可靠存储、低无线网络带宽、高移动性、断开连接和能量限制等,使得协同检查点算法不能很好地适用于移动计算环境.为此提出一种适合移动计算环境的非阻塞的...
传统分布式网络中协同检查点算法有许多优点,但移动计算环境有很多新问题,如缺少可靠存储、低无线网络带宽、高移动性、断开连接和能量限制等,使得协同检查点算法不能很好地适用于移动计算环境.为此提出一种适合移动计算环境的非阻塞的协同检查点算法,算法中检查点的发起和同步由移动支持站完成,只需记录部分中途消息就能实现一致可恢复.算法对移动主机是透明的,低开销的.
展开更多
关键词
移动计算
容错
协同检查点
卷回恢复
下载PDF
职称材料
一种面向大规模并行系统的分组协同检查点算法
被引量:
1
3
作者
黄琼
尚利宏
+1 位作者
周密
金惠华
《计算机研究与发展》
EI
CSCD
北大核心
2010年第S1期158-163,共6页
随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检...
随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检查点文件,这使得其开销率显著增加.提出一种新的基于分组的协同检查点算法,它使用更好的调度策略使得某一组进程在设置检查点时,其他的进程能够更多地处于计算状态,从而有效地减少了检查点开销.实验表明该算法在系统规模增加时具有良好地可扩展性.
展开更多
关键词
大规模并行系统
协同检查点
检查点
组
下载PDF
职称材料
一种费用最小的非阻塞协同检查点算法
4
作者
门朝光
左德承
杨孝宗
《高技术通讯》
EI
CAS
CSCD
2004年第9期20-24,共5页
将协同检查点策略中采取的最小化同步信息以及检查点数量的策略与不阻塞进程的基本运行策略相结合,提出了一种只需最小数量的进程参与的非阻塞协同检查点算法。该算法利用计算检查点避免由于不阻塞进程的基本执行可能产生的孤儿消息。...
将协同检查点策略中采取的最小化同步信息以及检查点数量的策略与不阻塞进程的基本运行策略相结合,提出了一种只需最小数量的进程参与的非阻塞协同检查点算法。该算法利用计算检查点避免由于不阻塞进程的基本执行可能产生的孤儿消息。通过在广播确认消息中捎带哪些进程产生了新的检查点的信息,使每个进程的检查点序号在所有进程中是一致的。该算法在费用上优于已有的协同检查点算法。
展开更多
关键词
进程
最小化
消息
费用
确认
信息
非阻塞
协同检查点
算法
分布式容错计算系统
卷回恢复
下载PDF
职称材料
一个适合大规模集群并行计算的检查点系统
被引量:
12
5
作者
周恩强
卢宇彤
沈志宇
《计算机研究与发展》
EI
CSCD
北大核心
2005年第6期987-992,共6页
分布式检查点系统是大规模并行计算系统容错的重要手段.协议开销和检查点映像存储成为困扰并行检查点系统可伸缩性的两大瓶颈.针对并行应用程序的执行特征和高性能集群的体系结构特点,C系统分别采用动态虚连接技术和分布存储检查点映像...
分布式检查点系统是大规模并行计算系统容错的重要手段.协议开销和检查点映像存储成为困扰并行检查点系统可伸缩性的两大瓶颈.针对并行应用程序的执行特征和高性能集群的体系结构特点,C系统分别采用动态虚连接技术和分布存储检查点映像的方法来有效降低协同式检查点的开销,增强检查点系统的可伸缩性.初步测试结果表明,C系统的设计策略适合大规模并行计算的容错.
展开更多
关键词
集群
协同
式
检查点
MPI
下载PDF
职称材料
基于Lustre文件系统的MPI检查点系统实现技术与性能测试
被引量:
4
6
作者
谢旻
卢宇彤
+2 位作者
周恩强
曹宏嘉
杨学军
《计算机研究与发展》
EI
CSCD
北大核心
2007年第10期1709-1716,共8页
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同...
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性.
展开更多
关键词
容错技术
MPICH2
回卷恢复
协同
式
检查点
LUSTRE文件系统
下载PDF
职称材料
一种基于移动计算环境的因果日志卷回恢复算法
被引量:
7
7
作者
张展
左德承
+1 位作者
慈轶为
杨孝宗
《计算机研究与发展》
EI
CSCD
北大核心
2008年第2期348-357,共10页
由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法...
由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法完全实现一致的异步卷回恢复.基于因果消息日志,提出一种新的移动计算环境的卷回恢复算法:通过先行图来记录节点间的消息依赖关系,将异步检查点、基于发送方的暂存消息日志和先行图全部在移动支持站上存储和处理,为移动节点提供一种透明的容错服务,完全消除依赖关系在移动节点之间造成的影响.用形式化的方法证明了系统的一致性.仿真结果表明,在卷回开销达到最低的同时,也显著降低了无错运行时的通信和存储开销.
展开更多
关键词
因果日志
先行图
非
协同检查点
移动节点
移动支持站
下载PDF
职称材料
题名
分布式仿真系统非阻塞式协同检查点协议
被引量:
2
1
作者
刘云生
黄健
查亚兵
机构
国防科技大学三院军用仿真技术教研室
出处
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007年第1期71-74,共4页
基金
国防预研基金项目资助(51404010403KG0155)
文摘
联邦存储是实现分布式仿真系统容错的基础,IEEE1516-2000中提供了一种阻塞式的系统状态存储协议,实际使用时会给系统带来很大开销。根据对系统状态存储过程中仿真组件状态变化影响因素的分析,提出了一种非阻塞式的系统状态存储协议,该协议完整地解决了由于在系统状态存储期间允许时间推进导致所保存的RTI状态和对应成员状态时间上的不一致、由于成员间消息传递导致不同成员状态的不一致及in-transit消息问题。先完成状态保存的成员不需阻塞,该协议在一定程度上降低了联邦存储的开销。证明了该协议的正确性。
关键词
分布式仿真
容错
联邦存储
非阻塞式
协同检查点
协议
Keywords
distributed simulation
fault tolerance
federation save
non-blocking coordinated checkpointing protocol.
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于移动计算的非阻塞协同检查点算法
被引量:
1
2
作者
姚建盛
刘艳玲
机构
吉林师范大学计算机学院
哈尔滨工程大学计算机学院
出处
《哈尔滨理工大学学报》
CAS
北大核心
2011年第2期60-65,共6页
文摘
传统分布式网络中协同检查点算法有许多优点,但移动计算环境有很多新问题,如缺少可靠存储、低无线网络带宽、高移动性、断开连接和能量限制等,使得协同检查点算法不能很好地适用于移动计算环境.为此提出一种适合移动计算环境的非阻塞的协同检查点算法,算法中检查点的发起和同步由移动支持站完成,只需记录部分中途消息就能实现一致可恢复.算法对移动主机是透明的,低开销的.
关键词
移动计算
容错
协同检查点
卷回恢复
Keywords
mobile computing
fault tolerant
coordinated checkpoint
rollback-recovery
分类号
TP302.8 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种面向大规模并行系统的分组协同检查点算法
被引量:
1
3
作者
黄琼
尚利宏
周密
金惠华
机构
北京航空航天大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第S1期158-163,共6页
文摘
随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检查点文件,这使得其开销率显著增加.提出一种新的基于分组的协同检查点算法,它使用更好的调度策略使得某一组进程在设置检查点时,其他的进程能够更多地处于计算状态,从而有效地减少了检查点开销.实验表明该算法在系统规模增加时具有良好地可扩展性.
关键词
大规模并行系统
协同检查点
检查点
组
Keywords
large-scale parallel system
coordinated checkpointing
chechpoint group
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
一种费用最小的非阻塞协同检查点算法
4
作者
门朝光
左德承
杨孝宗
机构
哈尔滨工业大学计算机学院
出处
《高技术通讯》
EI
CAS
CSCD
2004年第9期20-24,共5页
文摘
将协同检查点策略中采取的最小化同步信息以及检查点数量的策略与不阻塞进程的基本运行策略相结合,提出了一种只需最小数量的进程参与的非阻塞协同检查点算法。该算法利用计算检查点避免由于不阻塞进程的基本执行可能产生的孤儿消息。通过在广播确认消息中捎带哪些进程产生了新的检查点的信息,使每个进程的检查点序号在所有进程中是一致的。该算法在费用上优于已有的协同检查点算法。
关键词
进程
最小化
消息
费用
确认
信息
非阻塞
协同检查点
算法
分布式容错计算系统
卷回恢复
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一个适合大规模集群并行计算的检查点系统
被引量:
12
5
作者
周恩强
卢宇彤
沈志宇
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第6期987-992,共6页
基金
国家"八六三"高技术研究发展计划基金项目(2002AA1Z2101)
文摘
分布式检查点系统是大规模并行计算系统容错的重要手段.协议开销和检查点映像存储成为困扰并行检查点系统可伸缩性的两大瓶颈.针对并行应用程序的执行特征和高性能集群的体系结构特点,C系统分别采用动态虚连接技术和分布存储检查点映像的方法来有效降低协同式检查点的开销,增强检查点系统的可伸缩性.初步测试结果表明,C系统的设计策略适合大规模并行计算的容错.
关键词
集群
协同
式
检查点
MPI
Keywords
cluster
coordinated checkpointing
MPI
分类号
TP316.4 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Lustre文件系统的MPI检查点系统实现技术与性能测试
被引量:
4
6
作者
谢旻
卢宇彤
周恩强
曹宏嘉
杨学军
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第10期1709-1716,共8页
基金
国家自然科学基金项目(60621003
60573135)
国家"八六三"高技术研究发展计划基金项目(2006AA01A106)
文摘
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性.
关键词
容错技术
MPICH2
回卷恢复
协同
式
检查点
LUSTRE文件系统
Keywords
fault-tolerant
MPICH2
rollback-recovery
coordinated checkpoint
Lustre file system
分类号
TP316.4 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于移动计算环境的因果日志卷回恢复算法
被引量:
7
7
作者
张展
左德承
慈轶为
杨孝宗
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第2期348-357,共10页
基金
国家"八六三"高技术研究发展计划重大专项基金项目(2006AA01A103)
国家自然科学基金项目(60503015)
文摘
由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法完全实现一致的异步卷回恢复.基于因果消息日志,提出一种新的移动计算环境的卷回恢复算法:通过先行图来记录节点间的消息依赖关系,将异步检查点、基于发送方的暂存消息日志和先行图全部在移动支持站上存储和处理,为移动节点提供一种透明的容错服务,完全消除依赖关系在移动节点之间造成的影响.用形式化的方法证明了系统的一致性.仿真结果表明,在卷回开销达到最低的同时,也显著降低了无错运行时的通信和存储开销.
关键词
因果日志
先行图
非
协同检查点
移动节点
移动支持站
Keywords
station causal logging
antecedence graph
uncoordinated checkpoint
mobile host
mobile service
分类号
TP302.8 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
分布式仿真系统非阻塞式协同检查点协议
刘云生
黄健
查亚兵
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007
2
下载PDF
职称材料
2
一种基于移动计算的非阻塞协同检查点算法
姚建盛
刘艳玲
《哈尔滨理工大学学报》
CAS
北大核心
2011
1
下载PDF
职称材料
3
一种面向大规模并行系统的分组协同检查点算法
黄琼
尚利宏
周密
金惠华
《计算机研究与发展》
EI
CSCD
北大核心
2010
1
下载PDF
职称材料
4
一种费用最小的非阻塞协同检查点算法
门朝光
左德承
杨孝宗
《高技术通讯》
EI
CAS
CSCD
2004
0
下载PDF
职称材料
5
一个适合大规模集群并行计算的检查点系统
周恩强
卢宇彤
沈志宇
《计算机研究与发展》
EI
CSCD
北大核心
2005
12
下载PDF
职称材料
6
基于Lustre文件系统的MPI检查点系统实现技术与性能测试
谢旻
卢宇彤
周恩强
曹宏嘉
杨学军
《计算机研究与发展》
EI
CSCD
北大核心
2007
4
下载PDF
职称材料
7
一种基于移动计算环境的因果日志卷回恢复算法
张展
左德承
慈轶为
杨孝宗
《计算机研究与发展》
EI
CSCD
北大核心
2008
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部