摘要
网络流量异常检测可以看作一种集体离群点检测问题。当前的离群点检测算法大多针对个体离群点,随着对大数据中离群点的研究深入,对集体离群点检测算法开始引起研究者关注。本文针对集体离群点识别,使用直方图来描述集体观测,提出了基于直方图的集体离群点检测算法。该算法把直方图的向量表示与隔离森林算法相结合,实现集体离群点检测,分别使用基于概率密度向量表示、累积概率密度向量、频数向量表示、累积频数向量表示在公开的有标签的基准数据集上进行实验,AUC值最低为0.972,最高为0.974,实验结果和Web服务器异常访问识别的实际应用表明了基于直方图的集体离群点检测的有效性。
出处
《保密科学技术》
2023年第10期56-62,共7页
Secrecy Science and Technology
基金
教育部教育考试院“十四五”规划支撑专项课题“互联网+”环境中机考平台的设计与应用(NEEA2021064)
河北省学校体育卫生艺术国防教育专项任务项目(202244)。