基于K-means聚类特征消减的网络异常检测被引量：21

K-means based feature reduction for network anomaly detection

导出

摘要针对基础K-means算法在KDD 99数据集中检测罕见攻击效果差且效率低下等问题,该文通过数据统计的方式对数据集中各维度与每类攻击类型的相关分析发现,罕见攻击极易被大量的常见攻击所淹没,而当常见攻击被移去时,这些威胁性更大的罕见攻击则能够被更好地识别出来。基于此,该文提出一种改进的基于K-means分层迭代的检测算法,通过有针对性的特征选择来降低K-means聚类的数据维度,经过多次属性消减的K-means聚类迭代操作可以更加精准地检测到不同异常类型的攻击。在KDD 99数据集上的实验结果表明：该算法对原基础的K-means检测算法难以检测到的罕见攻击类型U2R/R2L攻击检测率几乎达到99%左右。同时随着每次分层迭代聚类维度近50%的降低,进一步节省了约90%的异常检测时间。 Although the basic K-means test was used for anomaly detection in the KDD 99 attack dataset,its accuracy and efficiency for detecting rare attacks needs to be improved.Rare attacks,which are usually greater threats,are easily hidden by common threats so the rare attacks can be more easily identified by removing common attacks.An improved hierarchical iterative K-means method was developed based on this finding to detect all kinds of anomalies using feature reduction through correlations to decrease classification the dimensions.The algorithm is able to detect almost every rare attack with a 99% succesful classification rate and for nearly real-time detection with 90%less computations on the KDD 99 data compared with the basic K-means algorithm.

作者贾凡严妍张家琪

机构地区北京交通大学通信与信息系统北京市重点实验室中国信息安全认证中心

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第2期137-142,共6页 Journal of Tsinghua University(Science and Technology)

基金中央高校基本科研业务费项目(2017JBM005)

关键词异常检测 K-MEANS 特征消减 U2R R2L anomaly detection K-means feature reduction U2R R2L

分类号 O242.21 [理学—计算数学]

引文网络
相关文献

参考文献2

1傅涛,孙文静,孙亚民.基于分箱统计的FCM算法及其在网络入侵检测中的应用[J].计算机科学,2008,35(4):36-39. 被引量：7
2季成,李晓东,袁坚,尉迟学彪,山秀明.基于k-means算法的DNS查询模式分析[J].清华大学学报（自然科学版）,2010,50(4):601-604. 被引量：5

二级参考文献11

1Danzig P B, Obraezka K, Kumar A. An analysis of wide-area name server traffic: A study of the internet domain name system [C]//ACM SIGCOMM Computer Communication Review. New York, 1992, 22(4): 281-292.
2Wessels D, Fomenkov M. Wow, that's a lot of packets [C]//Proc Passive and Active Network Measurement Workshop (PAM). San Diego, 2003.
3Brownlee N, Claffy K, Nemeth E. DNS measurements at a root server [C]//6th Global Internet Symposium. San Antonio, TX, 2001.
4Xu W, Kirkpatrick B, Lacoste-Julien S. Analyzing root DNS traffie [EB/OL] (2004). http://www. eecs. berkeley. edu/ bbkirk/papers/es262a- 2004. pdf.
5Jung J, Sit E, Balakrishnan H, et al. DNS performance and the effectiveness of caching [J]. IEEE/ACM Trans on Networking, 2002, 10(5): 589-603.
6Ishibashi K, Toyono T, Matsuoka H, et al. Measurement of DNS traffic caused by DDoS attack [C]// Proc the Symposium on Applications and the Internet Workshops. Washington, 2005 : 118 - 121.
7Ishibashi K, Toyono T, Toyama K, et al. Detecting mass-mailing worm infected hosts by mining DNS traffic data [C]//Proc the 2005 ACM SIGCOMM Workshop on Mining Network Data. Philadelphia, 2005: 159 - 164.
8Ramaswamy S,Rastogi R,Shim K. Efficiem algorithms for mining outliers from large data sets. In: Proceedings of the ACM SIGMOD International Conference on Management of Data, Dallas, TX, USA, 2000. 427-438
9Portnoy L,Eskin E, Stolfo S J. Intrusion detection withunlabeled data using clustering. In: Proceedings of theACM Workshop on Data Mining Applied to Security,Philadelphia, PA, 2001
10Sequeira K, Zaki M. ADMIT: Anomaly-based data mining for intrusions. In: Proceedings of the 8th ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, Edmonton, Alberta, Canada, 2002. 386-395

共引文献10

1于伟杰,杨文忠,任秋如.基于全词BERT的集成用户画像方法[J].东北师大学报（自然科学版）,2022,54(4):87-92. 被引量：2
2李晓鹏,王京辉,王怀彬.基于人工免疫理论的异常检测动态模型研究[J].天津理工大学学报,2015,31(3):6-11.
3郑海山.基于开源软件的DNS查询日志分析系统[J].厦门大学学报（自然科学版）,2017,56(2):252-258. 被引量：1
4李庆宾,王晓东.分数阶情绪模型的终端滑模控制混沌同步[J].山东大学学报（工学版）,2017,47(3):84-88. 被引量：3
5于青民,李晓磊,翟勇.基于改进EMD和数据分箱的轴承内圈故障特征提取方法[J].山东大学学报（工学版）,2017,47(3):89-95. 被引量：4
6白凡.基于DNS分析恶意行为检测的研究[J].电信网技术,2017(8):80-83.
7陈巧红,凌明杰,孙麒,贾宇波.基于集成学习框架的用户画像方法[J].浙江理工大学学报（自然科学版）,2020,43(1):86-93. 被引量：1
8刘芬,范洪强,吕涛,李谦,钱权.基于卡尔曼滤波的含噪声小样本数据处理方法[J].上海大学学报（自然科学版）,2022,28(3):427-439. 被引量：9
9胡安磊,谢高岗,苑卫国,魏金侠,付豪.基于顶级域解析日志的递归DNS识别方法[J].高技术通讯,2023,33(9):916-926.
10魏林,刘建毅,王枞.Apriori算法在发现用户网页浏览模式上的应用[J].软件工程与应用,2013,2(6):125-130.

同被引文献140

1程柏林,朱元清,马晓岩.一种用于雷达信号分选的改进型神经网络[J].空军雷达学院学报,2005,19(2):18-20. 被引量：4
2杨占华,杨燕.SOM神经网络算法的研究与进展[J].计算机工程,2006,32(16):201-202. 被引量：78
3万建伟,宋小全,皇甫堪,周良柱.神经网络在雷达信号分选中的应用[J].系统工程与电子技术,1996,18(7):29-35. 被引量：9
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1069
5王守信,张莉,李鹤松.一种基于云模型的主观信任评价方法[J].软件学报,2010,21(6):1341-1352. 被引量：119
6赵玲,陈磊琛,余小陆,张盛意.SVM-KNN分类算法研究[J].计算机与数字工程,2010,38(6):29-31. 被引量：3
7赵慧明,刘卫国.基于信息熵聚类的DDoS检测算法[J].计算机系统应用,2010,19(12):164-167. 被引量：3
8王德,张昀.基于语义差别法的上海街道空间感知研究[J].同济大学学报（自然科学版）,2011,39(7):1000-1006. 被引量：53
9褚怀保,杨小林,梁为民,余永强,王立平.煤体爆破损伤规律模拟试验研究[J].采矿与安全工程学报,2011,28(3):488-492. 被引量：20
10闫长斌,李国权,陈东亮,刘振红,刘建磊.基于岩体爆破累积损伤效应的Hoek-Brown准则修正公式[J].岩土力学,2011,32(10):2951-2956. 被引量：34

引证文献21

1张超群,韦川源,梁刚,黑小龙,朱旭东.基于深度学习技术的恶意攻击的分析与识别[J].计算机应用研究,2020,37(S01):283-286. 被引量：6
2吴旭,叶炎.融合异常QoS数据检测的安全云服务选择方法[J].西安邮电大学学报,2018,23(6):74-80. 被引量：2
3蒋复量,杨文超,张帅,刘永,李向阳,黎明,郭锦涛.循环爆破荷载作用下类铀矿岩损伤与氡析出规律的实验研究[J].矿冶工程,2019,39(1):15-20. 被引量：2
4卓曦,唐璐璐,王家主,杨龙清,刘建炜.彩色路面环境下隧道视觉诱导性评价[J].福州大学学报（自然科学版）,2019,47(3):417-423. 被引量：14
5曹卫东,许志香.高效的半监督多层次入侵检测算法[J].计算机应用,2019,39(7):1979-1984. 被引量：2
6史雨璇.基于改进VGG-13卷积神经网络的单脉冲信号分选[J].哈尔滨商业大学学报（自然科学版）,2019,35(4):419-425. 被引量：1
7肖鹏博,闵绍荣,罗威.基于信息熵和K均值的船舶网络入侵检测方法[J].软件,2019,40(9):36-39. 被引量：1
8刘玉梅,乔宁国,庄娇娇,刘鹏程,胡婷,陈立军.基于多传感器数据融合的轨道车辆齿轮箱异常检测[J].吉林大学学报（工学版）,2019,49(5):1465-1470. 被引量：4
9韩存鸽,刘长勇.一种改进的K-Means算法[J].闽江学院学报,2019,40(5):49-54. 被引量：6
10张浩,陈龙,魏志强.基于数据增强和模型更新的异常流量检测技术[J].信息网络安全,2020(2):66-74. 被引量：8

二级引证文献92

1陈小薇,樊振通,余功新,胡贵华,吴平.彩色防滑路面材料组成对其路用性能的影响[J].长安大学学报（自然科学版）,2020,40(1):116-124. 被引量：7
2李红民,王健,闫凯.基于多传感器数据融合的空间结构健康状态评估方法[J].建筑结构学报,2023,44(S01):364-371. 被引量：2
3昌文峰,王霄,杨靖,覃涛.基于CatBoost算法的蓝莓生态适宜性评估模型[J].计算机与数字工程,2023,51(1):206-212.
4李华昌,揭东帅,徐敏.电力市场化改革下的电价敏感性研究[J].中北大学学报（自然科学版）,2020,41(5):431-436. 被引量：4
5万珊,苟文博.基于改进K-means聚类的数据自动采集系统设计[J].自动化与仪器仪表,2020(10):108-112. 被引量：4
6蒋复量,张帅,刘永,单鹏飞,洪昌寿,雷波,郭锦涛.爆破动载作用下含放射性型岩内部损伤演化及表面氡析出率响应特征[J].岩石力学与工程学报,2020,39(S01):2741-2750. 被引量：1
7陈伟.基于路表结构及状态对隧道彩色路面亮度的影响分析[J].福建交通科技,2020(6):61-64. 被引量：1
8郑坤鹏,丁云飞.基于WOA-LSSVM算法的风机齿轮箱故障诊断[J].上海电机学院学报,2020,23(6):317-322. 被引量：7
9罗文华,程家兴.基于Hadoop架构的混合型DDoS攻击分布式检测系统[J].信息网络安全,2021(2):61-69. 被引量：5
10李黎,梁剑.第三方支付系统信息泄露风险预警模型[J].计算机仿真,2021,38(2):394-398. 被引量：3

1黄翊翔.基于协同训练及数据融合技术的网络异常流量检测[J].电脑知识与技术,2017,13(11X):81-82.
2蔺婧娜,刘彩艳.计算机网络攻击效果评估技术分析[J].网络安全技术与应用,2017(9):20-20. 被引量：1
3柴蓓蓓,何培,王惠莹,刘浏,张若鹏,袁彩.1032例男性不育症患者细胞遗传学分析[J].河北医学,2017,23(12):1937-1940. 被引量：5
4柏宇轩.Kmeans应用与特征选择[J].电子技术与软件工程,2018(1):186-187. 被引量：11
5张雪云,牟艳,张九博.基于KELM_AdaBoost的网络入侵检测[J].信息技术,2018,42(1):130-133. 被引量：2
6冯东红.林业病虫害发生原因及无公害防治的措施初探[J].农技服务,2017,34(14):102-102. 被引量：3
7牛雷,孙忠林.PCA-AKM算法及其在入侵检测中的应用[J].计算机科学,2018,45(2):226-230. 被引量：4
8张仲先,唐家祥,张耀庭,李黎,张卉.某22层建筑物之桩基事故现象及其原因分析[J].特种结构,2000,17(4):57-59.
9和伟康,苏向辉,马瑛,王保力.天山北坡城市群土地利用效益测度及时空分异研究[J].中国农业资源与区划,2017,38(10):63-73. 被引量：18
10陈慧,孟昱时,刘仲伟,陈静思,苏娅,宋家美.精液异常患者人口学因素调查[J].中国生育健康杂志,2017,28(6):533-537. 被引量：3

清华大学学报（自然科学版）

2018年第2期

浏览历史

内容加载中请稍等...

基于K-means聚类特征消减的网络异常检测被引量：21

参考文献2

二级参考文献11

共引文献10

同被引文献140

引证文献21

二级引证文献92

相关作者

相关机构

相关主题

浏览历史

基于K-means聚类特征消减的网络异常检测 被引量：21

参考文献2

二级参考文献11

共引文献10

同被引文献140

引证文献21

二级引证文献92

相关作者

相关机构

相关主题

浏览历史

基于K-means聚类特征消减的网络异常检测被引量：21