摘要
针对入侵检测数据集具有的类别不均衡性、数据中心重叠、噪音、分布率变化等问题,提出一种集多种数据挖掘方法的解决方案,包括 k-means、C4.5、SVM、Nave Bayes、Bayes Net、Co-training 等,并进行相关实验.实验结果表明其有效性.
The solution based on multi-approaches of data mining involving k-means, C4.5, NaYve Bayes,Bayes net and Co-training is proposed in order to deal with the major problems of intrusion detection dataset such as class balance, class overlapping, noise, distributions etc. The experiment results show its validity.
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第4期520-526,共7页
Pattern Recognition and Artificial Intelligence
基金
国家自然科学基金项目(No.60503021
60721002)
江苏省高技术研究发展计划项目(No.BG2006027)
江苏省自然科学基金项目(No.BK2005075)资助
关键词
重复性
不均衡
入侵检测
软集成
取样
Duplication, Imbalance, Intrusion Detection, Soft-Ensemble, Sampling