摘要
在信息时代下,网络中每天都会有大规模移动流量数据产生。采用面向海量数据处理的高效、可靠的分布式并行计算成为互联网行业和各大营运商研究重点。文章阐述了移动流量数据监测方法和意义,重点对基于图谱分析的网络流量数据分析与识别算法进行研究。对于网页请求间的相互关系分析,采用基于依赖图模型的用户点击识别算法;对于网络实体间的关系结构分析,设计了并行tNMF算法;为对大规模移动网络流量进行精细化分析,提出了基于Spark计算框架的并行快速流式算法。
出处
《电子制作》
2022年第8期47-49,共3页
Practical Electronics
基金
湖南省自然科学基金课题,课题编号:2020JJ7015,课题名称:基于行为图谱的大规模web流量群体识别算法研究与应用。