-
题名基于Hadoop的海量数据TCP报文重组技术
被引量:5
- 1
-
-
作者
刘贤熜
宋斌
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第10期113-117,123,共6页
-
文摘
当前基于单机系统的传输控制协议(TCP)报文重组工具随着数据量的增大,运行效率越来越低,难以满足大数据时代的需求。为此,提出一种基于Hadoop的海量数据TCP报文重组系统。利用Hadoop分布式文件系统(HDFS)以及MapReduce并行处理框架,对TCP报文重组中的数据读取和结果输出步骤进行并行化处理。采用M apReduce辅助排序技术实现海量TCP数据流的分类。测试结果表明,与基于单机系统的报文重组工具相比,基于Hadoop的报文重组系统工作效率更高,并且当数据量达到100 GB时,运行效率可提升近84%。
-
关键词
海量数据
传输控制协议
报文重组
分布式系统
并行处理
辅助排序
-
Keywords
mass data
Transfer Control Protocol (TCP)
packet reassembly
distributed system
parallel processing
secondary sort
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-