摘要
针对传统的无监督Kmeans算法聚类时间长、准确率低等问题,提出一种改进型的Canopy-Kmeans++算法对网络威胁流量进行检测。首先,通过前置粗聚类环节确定实际聚类簇数,避免了因簇数选择不准确导致的类标签与实际类特征存在差异的问题;其次,进一步使用Kmeans++算法,引入基于距离加权的概率分布质心选择方案;最后,通过对KDD Cup99数据集中抽样选取的测试子集进行算法效果比对,可以看出所提出方法相比于传统Kmeans、Kmeans++方法在聚类效果和聚类速度上均有提升。相关研究结果可为异常网络流量的聚类算法性能优化提供参考。
出处
《信息技术与信息化》
2024年第7期155-158,共4页
Information Technology and Informatization