摘要
随着大数据的到来,数据流处理技术又成为了新的研究热点.回顾了近期提出的面向大数据的流处理技术现状,并且从流处理模型上对这些技术进行了划分,重点分析了面向大数据的并行分布式的流处理模型的设计目标和架构,同时,重点讨论了并行分布式流处理模型的关键技术以及未来技术的展望.
The era of big data is coming,and the users are more eager for fresh and low-latency processing results than ever.For this reason,this paper reviews the recent stream processing models for big data and focuses on the parallel-distributed processing models,and presents their design goals and architectures.Moreover,this paper discusses the main challenges in designing the paralleldistributed stream processing model and future work.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第S2期1-9,共9页
Journal of Computer Research and Development
基金
国家自然科学基金项目(61402464)
中国博士后科学基金面上项目(2013M541076)
国家信息安全支撑计划项目(2013F107)
关键词
数据流
并行化
负载均衡
故障容错
大数据
data stream
parallel-distributed
load balancing
fault-tolerance
big data