K-MEANS算法在IDS中的应用研究被引量：3

Research on Application of K-MEANS Algorithm in IDS

下载PDF

导出

摘要聚类算法广泛应用于入侵检测系统(IDS)的数据挖掘中。虽然K-MEANS算法是最为经典的聚类算法之一,但是由于入侵检测系统的数据集具有特殊性,直接在其上进行K-MEANS聚类的效果不佳。为了提高K-MEANS在IDS数据集上的聚类准确性,引入一种数据预处理方法。该方法对IDS的记录特征做标准化处理,使原本取值范围差异很大的数值型特征在同一个区间内取值,排除原始数据中不同度量带来的不良影响,从而优化聚类的效果。仿真实验表明,K-MEANS算法对预处理后的IDS数据集的聚类准确度有很大的提高。 Clustering algorithms are widely used in intrusion detection system（IDS） to mine the data.Although K-MEANS is one of the most classical clustering algorithms,the effect is not very good when it is used in IDS directly.The reason is that the data set of intrusion detection system is peculiar.In order to improve the clustering accuracy of K-MEANS on IDS data set,designs a data preprocessing method,which makes the features of IDS record standardized,and makes all features with very different value ranged in the same range.This can exclude the impact of difference between the measured variables of the original data,and can help to improve the effect of clustering.Simulation results show that the clustering accuracy of K-MEANS on the preprocessed IDS data set has been greatly improved.

作者李玲娟李冰薛明

机构地区南京邮电大学计算机学院

出处《计算机技术与发展》 2010年第7期129-131,F0003,共4页 Computer Technology and Development

基金国家自然科学基金(60863001) 江苏省高校自然科学基础研究项目(08KJB620002) 南京邮电大学校科研基金(NY207051)

关键词数据挖掘入侵检测系统 K均值聚类预处理 data mining intrusion detection system K-MEANS clustering preprocessing

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1Anderson J P. Computer security thread monitoring and surveillance[ R ]. Fort Washington, PA: J ames P Anderson Co,1980.
2韩东海，王超，李群编著．入侵检测系统实例剖析[M]．北京：清华大学出版社，2004．
3熊忠阳,周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,17(8):11-14. 被引量：19
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1073
5韩家炜,堪博.数据挖掘:概念与技术[M].第2版.范明,孟小峰,译.北京:机械工业出版社,2007.
6Li Lingjuan, Tang Wenyu, Wang Ruchuan. A CBR Engine Adapting to IDS[J]. Lecture Notes on Artifidal Intelligence, 2005,3802 : 334 - 339.
7MIT. MIT's KDD Cup 99 dataset[EB/OL]. 1999- 10. http://kdd. ics. uci. edu/databases/kddcup99. html.
8李玲娟,梁玉龙,王汝传.适用于IDS中数据分类的数值归约算法[J].计算机应用研究,2007,24(12):146-148. 被引量：1

二级参考文献11

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2Han Jiawei,Kamber M.Data Mining[M].Beijing:Higher Education Press,2000.
3Serivastava J,Cooley R,Deshpande M,et al.Web Usage Mining:Discovery and Applications of Usage Patterns from Web Data[J].ACM SIGKDD Explorations,2000,1 (2):12-23.
4Spiliopoulou M,Mobasher B,Berendt B,et al.A framework for the evaluation of session reconstruction heuristics in Web usage analysis[J].Informs Journal on Coumputing,2003,15(5):171-179.
5Baglioni M,Ferrara U,Romei A,et al.Preprocessing and mining Weblog data for Web personalization[C]//Proceedings of 8th Natl' conf of the Italian Association for Artificial Intelligence.Pisa,Italy:[s.n.],2003.
6Wang Xidong,Ouyang Yiming,Hu Xuegang,et al.Discovery of User Frequent Access Patterns on Web Usage Mining[C]//In:The 8th International Conference on Computer Supported Cooperative Work in Design Proceedings.[s.l.]:IEEE,2003.
7HAN Jia-wei, KAMBER M. Data mining: concepts and techniques[M]. San Francisco: Morgan Kaufmann Publishers Inc, 2001:14-18, 188 -196.
8QUINLAN J R. Induction of decision trees [ J].Machine Learning, 1986,1 (1) :81-106.
9DUNHAM M H．数据挖掘教程[M]．郭崇慧，田凤占，靳晓明，等译．北京：清华大学出版社，2003.79-88．
10赵伟,何丕廉,陈霞,谢振亮.Web日志挖掘中的数据预处理技术研究[J].计算机应用,2003,23(5):62-64. 被引量：62

共引文献1093

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献33

1温珍琴.赣南农村聚落名研究[J].农业考古,2006(3):158-161. 被引量：4
2黄荣杯.CSCL的理论与方法[J].电化教育研究,1999,20(6):25-30. 被引量：101
3曹保平.客家地名与客家方言[J].语文学刊（高等教育版）,2004(4):85-86. 被引量：2
4刘合兵,尚俊平.聚类分析算法研究[J].济源职业技术学院学报,2006,5(4):4-7. 被引量：3
5赵建华,David McConnell.网络学习中的协作知识建构[J].外语电化教学,2007(3):38-46. 被引量：35
6李洋,方滨兴,郭莉,陈友.基于直推式方法的网络异常检测方法[J].软件学报,2007,18(10):2595-2604. 被引量：26
7Johnson D W ,Johnson R T. Learning Together and Along :Co- operative, Competitive and Individualistic Learning [ M ]. [ s. 1. ] :Prentice-Hall,1987.
8何克抗.建构主义一革新传统教学的理论基础[M].北京:教育科学出版社,1997.
9Ashley R. Cooperative Learning [ DB/OL ]. [ 2008 - 04 - 15 ]. http ://members. home. net/riketa/index, htm.
10Handl J, Knowles J, Kell D. Computational cluster validation in post- genomic data analysis [ J ]. Bioinformatics, 2005 ( 15 ) : 3201-3212.

引证文献3

1杨宇舟,张凤荔,王勇.基于K-MEANS聚类的分支定界算法在网络异常检测中的应用[J].计算机科学,2012,39(4):60-62. 被引量：1
2尹晨.E-Learning协作学习中分组策略研究[J].计算机技术与发展,2012,22(12):55-58. 被引量：1
3陈优良,朱倩,陈小芒.基于空间聚类的石城县客家地名景观分布特征研究[J].西北师范大学学报（自然科学版）,2020,56(1):98-106. 被引量：3

二级引证文献5

1钟传校,陈保如.特色地域文化与客家方言形成的内在联系研究[J].汉字文化,2023(19):19-21.
2陈庄,罗告成.一种改进的K-means算法在异常检测中的应用[J].重庆理工大学学报（自然科学）,2015,29(5):66-70. 被引量：11
3程艳,解建华,谭平飞,杨志明.面向虚拟学习社区的学习行为特征挖掘与分组方法的研究[J].江西师范大学学报（自然科学版）,2016,40(6):640-643. 被引量：2
4刘力源,李宏芸.基于GIS的重庆市忠县地名文化景观分析[J].内江师范学院学报,2021,36(4):58-65. 被引量：4
5郑汉奕,陈优良,邹文敏,李玲芝.客家地名文化景观聚类分析——以宁化县为例[J].江西理工大学学报,2022,43(4):73-82. 被引量：1

1张济强,高玉良.遗传模拟退火算法在k—means聚类中的应用[J].电脑知识与技术,2012,8(3):1611-1613. 被引量：1
2文志诚,陈志刚,唐军.基于聚类分析的网络安全态势评估方法[J].上海交通大学学报,2016,50(9):1407-1414. 被引量：18
3刘福荣,王宏伟,高晓智.基于粒子群优化聚类的汽轮机组振动故障诊断[J].振动与冲击,2010,29(8):9-12. 被引量：7
4赵万磊,王永吉,张学杰,李娟.一种优化初始中心点的K平均文本聚类算法[J].计算机应用,2005,25(9):2037-2040. 被引量：6
5鲜敏,郑翔.模拟退火算法优化聚类头节点的MANET服务质量改进[J].计算机应用与软件,2015,32(4):326-329. 被引量：1
6韦相和,李千目,张宏.基于非监督学习的入侵分析新方法[J].计算机应用研究,2007,24(7):146-150.
7庞天杰.基于模糊改进聚类分析的数据挖掘模型[J].太原师范学院学报（自然科学版）,2016,15(2):40-45. 被引量：1
8朱贵良,赵凯,赵锋.基于组合优化方法的K-means聚类算法实现[J].华北水利水电学院学报,2007,28(5):43-45. 被引量：2
9刘昆,陈庆盈,李世中.基于力/力矩传感器的直接示教系统研究[J].自动化与仪表,2016,31(5):10-14. 被引量：3
10孙琛琛,申德荣,寇月,聂铁铮,于戈.面向实体识别的聚类算法[J].软件学报,2016,27(9):2303-2319. 被引量：8

计算机技术与发展

2010年第7期

浏览历史

内容加载中请稍等...

K-MEANS算法在IDS中的应用研究被引量：3

参考文献8

二级参考文献11

共引文献1093

同被引文献33

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

K-MEANS算法在IDS中的应用研究 被引量：3

参考文献8

二级参考文献11

共引文献1093

同被引文献33

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

K-MEANS算法在IDS中的应用研究被引量：3