针对机器学习在流量异常检测中存在特征选择依赖经验、易受离群点影响导致鲁棒性差等问题,基于因素空间理论的“背景关系-背景分布-背景基”体系提出一种流量异常检测的基点分类方法。首先,数据预处理阶段使用KNN离群点检测算法去除数...针对机器学习在流量异常检测中存在特征选择依赖经验、易受离群点影响导致鲁棒性差等问题,基于因素空间理论的“背景关系-背景分布-背景基”体系提出一种流量异常检测的基点分类方法。首先,数据预处理阶段使用KNN离群点检测算法去除数据中的离群点,降低异常点对后续背景基提取的影响。其次,使用mRMR算法对数据特征进行排序,选择对分类最具影响力的特征标注为类别区分特征。然后,以内点判别法为理论基础优化背景基提取算法,提取训练数据中不同类别数据的背景基,得到各类别的单位认知包。最后,以单位认知包为核心构造基点分类算法(fundamental point classification algorithm,FPCA)实现异常流量的精准二分类。在NSL-KDD数据集上对所提方法的二分类实验准确率和F1-score分别达到92.48%和92.18%,检测性能优于同类型的其他机器学习方法。在CICIDS2017场景数据集上的测试进一步验证了所提方法在实际应用中的可行性。展开更多
文摘针对机器学习在流量异常检测中存在特征选择依赖经验、易受离群点影响导致鲁棒性差等问题,基于因素空间理论的“背景关系-背景分布-背景基”体系提出一种流量异常检测的基点分类方法。首先,数据预处理阶段使用KNN离群点检测算法去除数据中的离群点,降低异常点对后续背景基提取的影响。其次,使用mRMR算法对数据特征进行排序,选择对分类最具影响力的特征标注为类别区分特征。然后,以内点判别法为理论基础优化背景基提取算法,提取训练数据中不同类别数据的背景基,得到各类别的单位认知包。最后,以单位认知包为核心构造基点分类算法(fundamental point classification algorithm,FPCA)实现异常流量的精准二分类。在NSL-KDD数据集上对所提方法的二分类实验准确率和F1-score分别达到92.48%和92.18%,检测性能优于同类型的其他机器学习方法。在CICIDS2017场景数据集上的测试进一步验证了所提方法在实际应用中的可行性。