-
题名面向大规模网络流量数据的实时汇聚查询关键技术研究
被引量:17
- 1
-
-
作者
郭庆
朱一凡
谢莹莹
张榆
陈小兵
-
机构
北京理工大学计算机学院
中科曙光大数据事业部
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第6期1314-1320,共7页
-
基金
国家重点研发计划项目(2016YFC0802602)资助.
-
文摘
随着互联网发展,用户面临网络流量数据规模大、处理时效要求高的挑战,需解决数据采集、实时处理、存储组织和查询检索中的关键问题,为此,本文提出一种分布式的数据汇聚查询平台,通过半同步半异步模式的分级架构,支持采集超大规模流量数据;利用多分区队列的消息缓存、并行分布式流处理和基于属性划分的数据加载等手段优化组合,实现高效的实时处理;采用基于抽象数据访问驱动的虚分区式数据存储来对异构数据统一管理,具备良好扩展性;通过异步构建的分级索引架构,实现对数据报文的快速检索,最终为用户提供低延迟、高吞吐、快查询的一体化系统.实验证明平台有良好性能和可扩展性,主要环节有数倍以上不同程度的性能提升,并已应用于实际系统.
-
关键词
网络流量数据
大规模数据采集
实时处理
抽象数据访问驱动
分级索引
-
Keywords
network flow
large scale data collect
real-time process
abstract data access driver
hierarchical index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-