期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于内存功能划分的并行程序检查点策略研究
1
作者
薛瑞尼
陈文光
郑纬民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005年第z1期107-110,共4页
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接...
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性.
展开更多
关键词
容错
检查点设置
卷回恢复
内存排除
下载PDF
职称材料
最小化多MapReduce任务总完工时间的分析模型及其应用
2
作者
田文洪
陈瑜
+2 位作者
王心阳
薛瑞尼
赵勇
《计算机工程与科学》
CSCD
北大核心
2014年第4期571-578,共8页
随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发...
随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发现多个任务的总完工时间和任务的执行顺序有密切关系。研究目标是设计作业调度系统分析模型,最小化一批MapReduce作业的总完工时间。提出一个更好的调度策略和实现方法,使整个调度系统符合经典Johnson算法的条件,从而可使用经典Johnson算法在线性时间内获取总完工时间的最优解。同时,针对需要使用两个或多个资源池进行平衡的问题,提出了一种线性时间解决方案,优于已知的近似模拟方案。该理论模型可应用于提高系统响应速度、节能和负载均衡等方面,对应的应用实例提供了证实。
展开更多
关键词
HADOOP
MAPREDUCE
批量作业
调度优化
最小化总完工时间
下载PDF
职称材料
面向集群的消息传递并行程序容错系统
被引量:
1
3
作者
薛瑞尼
张悠慧
+1 位作者
陈文光
郑纬民
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第1期67-69,110,共4页
为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以...
为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以及系统自动重构。实验结果表明:检查点设置和系统恢复开销小于10%,符合大规模并行程序容错功能的要求。该系统提高了集群系统的可靠性和可用性,其设计结构和实现方法可以方便地移植到其他消息传递系统。
展开更多
关键词
容错技术
检查点
卷回恢复
消息传递接口
并行程序
原文传递
题名
基于内存功能划分的并行程序检查点策略研究
1
作者
薛瑞尼
陈文光
郑纬民
机构
清华大学计算机科学与技术系
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005年第z1期107-110,共4页
基金
国家高技术研究发展计划资助项目(2002AA1Z2103)
文摘
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性.
关键词
容错
检查点设置
卷回恢复
内存排除
Keywords
fault tolerance
checkpointing
rollback recovery
memory exclusion
分类号
TP302.8 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
最小化多MapReduce任务总完工时间的分析模型及其应用
2
作者
田文洪
陈瑜
王心阳
薛瑞尼
赵勇
机构
电子科技大学信息与软件工程学院
电子科技大学计算机科学与工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2014年第4期571-578,共8页
基金
国家自然科学基金资助项目(61150110486
61272528)
+1 种基金
中央高校基金资助项目(ID-ZYGX2013J073)
2013年CCF-腾讯科研基金资助项目
文摘
随着大规模的MapReduce集群广泛地用于大数据处理,特别是当有多个任务需要使用同一个Hadoop集群时,一个关键问题是如何最大限度地减少集群的工作时间,提高MapReduce作业的服务效率。可将多个MapReduce作业当做一个调度任务建模,观察发现多个任务的总完工时间和任务的执行顺序有密切关系。研究目标是设计作业调度系统分析模型,最小化一批MapReduce作业的总完工时间。提出一个更好的调度策略和实现方法,使整个调度系统符合经典Johnson算法的条件,从而可使用经典Johnson算法在线性时间内获取总完工时间的最优解。同时,针对需要使用两个或多个资源池进行平衡的问题,提出了一种线性时间解决方案,优于已知的近似模拟方案。该理论模型可应用于提高系统响应速度、节能和负载均衡等方面,对应的应用实例提供了证实。
关键词
HADOOP
MAPREDUCE
批量作业
调度优化
最小化总完工时间
Keywords
Hadoop
MapReduce
batch workloads
optimized schedule
minimized makespan
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向集群的消息传递并行程序容错系统
被引量:
1
3
作者
薛瑞尼
张悠慧
陈文光
郑纬民
机构
清华大学计算机科学与技术系
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第1期67-69,110,共4页
基金
国家"八六三"高技术项目(2002AA1Z2103)
文摘
为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以及系统自动重构。实验结果表明:检查点设置和系统恢复开销小于10%,符合大规模并行程序容错功能的要求。该系统提高了集群系统的可靠性和可用性,其设计结构和实现方法可以方便地移植到其他消息传递系统。
关键词
容错技术
检查点
卷回恢复
消息传递接口
并行程序
Keywords
fault tolerance
checkpointing
rollback recovery
message passing interface
parallel application
分类号
TP302.8 [自动化与计算机技术—计算机系统结构]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于内存功能划分的并行程序检查点策略研究
薛瑞尼
陈文光
郑纬民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005
0
下载PDF
职称材料
2
最小化多MapReduce任务总完工时间的分析模型及其应用
田文洪
陈瑜
王心阳
薛瑞尼
赵勇
《计算机工程与科学》
CSCD
北大核心
2014
0
下载PDF
职称材料
3
面向集群的消息传递并行程序容错系统
薛瑞尼
张悠慧
陈文光
郑纬民
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部