-
题名Storm流处理平台中负载均衡机制的实现
被引量:7
- 1
-
-
作者
张楠
柴小丽
谢彬
唐鹏
-
机构
中国电子科技集团公司第三十二研究所信息服务平台室
-
出处
《计算机与现代化》
2017年第12期65-70,76,共7页
-
基金
中国电子科技集团公司第三十二研究所自立项目(ZQ160006
ZQ160007)
-
文摘
Storm流处理平台解决了传统的基于Hadoop的批处理系统实时性不高的问题,为多源异构大数据处理提供了高效、快速、实时的数据处理框架。然而Storm平台在任务分配过程中只考虑了不同节点之间可用Slot的排序,并没有充分考虑节点的实际负载情况,从而容易产生负载不均衡的问题。针对以上问题,本文在Storm分布式流处理系统上实现对可用Slot和节点负载情况的加权排序改进Storm调度算法,通过数据结构设计,保证rowkey的随机性和唯一性,确保Region Server的负载平衡;同时通过批量写入的机制,提高Hbase数写入速度,从而提高流数据存储效率。通过与原生Storm系统的对比实验,表明本文算法的改进和机制优化保证了数据的快速写入,提高了集群资源的利用率,改进后的系统在实用性与效率上具有明显的优势。
-
关键词
STORM
流处理
分布式计算
批量处理
负载均衡
-
Keywords
Storm
streaming processing
distributed computing
batch processing
load balancing
-
分类号
TP702.7
[自动化与计算机技术—检测技术与自动化装置]
-