期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于内存功能划分的并行程序检查点策略研究
1
作者 薛瑞尼 陈文光 郑纬民 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第z1期107-110,共4页
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接... 目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性. 展开更多
关键词 容错 检查点设置 卷回恢复 内存排除
下载PDF
最小化多MapReduce任务总完工时间的分析模型及其应用
2
作者 田文洪 陈瑜 +2 位作者 王心阳 薛瑞尼 赵勇 《计算机工程与科学》 CSCD 北大核心 2014年第4期571-578,共8页
随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发... 随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发现多个任务的总完工时间和任务的执行顺序有密切关系。研究目标是设计作业调度系统分析模型,最小化一批MapReduce作业的总完工时间。提出一个更好的调度策略和实现方法,使整个调度系统符合经典Johnson算法的条件,从而可使用经典Johnson算法在线性时间内获取总完工时间的最优解。同时,针对需要使用两个或多个资源池进行平衡的问题,提出了一种线性时间解决方案,优于已知的近似模拟方案。该理论模型可应用于提高系统响应速度、节能和负载均衡等方面,对应的应用实例提供了证实。 展开更多
关键词 HADOOP MAPREDUCE 批量作业 调度优化 最小化总完工时间
下载PDF
面向集群的消息传递并行程序容错系统 被引量:1
3
作者 薛瑞尼 张悠慧 +1 位作者 陈文光 郑纬民 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期67-69,110,共4页
为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以... 为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以及系统自动重构。实验结果表明:检查点设置和系统恢复开销小于10%,符合大规模并行程序容错功能的要求。该系统提高了集群系统的可靠性和可用性,其设计结构和实现方法可以方便地移植到其他消息传递系统。 展开更多
关键词 容错技术 检查点 卷回恢复 消息传递接口 并行程序
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部