期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Hadoop的海量数据TCP报文重组技术 被引量:5
1
作者 刘贤熜 宋斌 《计算机工程》 CAS CSCD 北大核心 2016年第10期113-117,123,共6页
当前基于单机系统的传输控制协议(TCP)报文重组工具随着数据量的增大,运行效率越来越低,难以满足大数据时代的需求。为此,提出一种基于Hadoop的海量数据TCP报文重组系统。利用Hadoop分布式文件系统(HDFS)以及MapReduce并行处理框架,对TC... 当前基于单机系统的传输控制协议(TCP)报文重组工具随着数据量的增大,运行效率越来越低,难以满足大数据时代的需求。为此,提出一种基于Hadoop的海量数据TCP报文重组系统。利用Hadoop分布式文件系统(HDFS)以及MapReduce并行处理框架,对TCP报文重组中的数据读取和结果输出步骤进行并行化处理。采用M apReduce辅助排序技术实现海量TCP数据流的分类。测试结果表明,与基于单机系统的报文重组工具相比,基于Hadoop的报文重组系统工作效率更高,并且当数据量达到100 GB时,运行效率可提升近84%。 展开更多
关键词 海量数据 传输控制协议 报文重组 分布式系统 并行处理 辅助排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部