期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向Flink流处理框架的主动备份容错优化 被引量:1
1
作者 刘广轩 黄山 +1 位作者 胡佳丽 段晓东 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期297-305,共9页
针对Flink任务出现故障后因为全局卷回使流处理作业恢复效率低的问题,提出基于缓存队列的容错策略.在作业中找出恢复时间最长的算子作为关键算子,将其处理过的数据存储到缓存队列中,并为其进行主动备份,备份算子同时接受来自上游的数据... 针对Flink任务出现故障后因为全局卷回使流处理作业恢复效率低的问题,提出基于缓存队列的容错策略.在作业中找出恢复时间最长的算子作为关键算子,将其处理过的数据存储到缓存队列中,并为其进行主动备份,备份算子同时接受来自上游的数据以达到在故障后作业可以瞬时恢复的效果.为了解决主动备份带来的额外消耗,提出数据过滤算法,备份算子在每次处理数据前会到缓存组件中检索当前数据,以判断是否继续处理.当Flink算子自身出现故障后,利用策略中的缓存队列与Flink的JobManager将故障发生时的数据信息发送给备份算子,在备份算子接收到数据后,实现即时恢复的效果.利用4项评价指标对策略进行评估,结果表明,与Flink1.8的故障恢复模式相比,所提策略在Flink任务故障恢复速度上有显著提升,当故障次数分别为1、2、3、4时,恢复效率分别提高56.3%、51.3%、46.2%和45.8%;而在处理时延、CPU利用率以及内存使用率方面仅产生极小的代价. 展开更多
关键词 Apache Flink 流处理容错 主动备份 故障恢复 缓存队列
下载PDF
基于EDF的分布式系统实时容错调度算法 被引量:2
2
作者 叶国骏 李莉丽 雷航 《计算机工程》 CAS CSCD 北大核心 2006年第4期76-78,共3页
将分布式系统的任务分配算法与处理器局部调度算法相结合,提出一种主动备份的、基于EDF的分布式系统实时容错调度算法,其特点是主/副版本执行时间可以重叠。给出了该调度算法的任务集可调度的充分条件、任务集可调度所需最小处理器个数... 将分布式系统的任务分配算法与处理器局部调度算法相结合,提出一种主动备份的、基于EDF的分布式系统实时容错调度算法,其特点是主/副版本执行时间可以重叠。给出了该调度算法的任务集可调度的充分条件、任务集可调度所需最小处理器个数的计算方法。模拟结果比较了主动备份容错调度算法与被动备份容错调度算法,结果表明主动备份算法效率更优。 展开更多
关键词 分布式系统 主动备份 容错调度 主版本/副版本 EDF算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部