大数据环境下基于信息论的入侵检测数据归一化方法被引量：65

Normalized Method of Intrusion Detection Data Based on Information Theory in Big Data Environment

导出

摘要在大数据时代,入侵检测作为网络安全的一种重要技术手段被广泛采用.网络入侵检测数据不同的特征属性具有不同的量纲和量纲单位,为了消除特征属性之间的量纲影响,一般在进行数据分析之前采用归一化处理.当前网络入侵检测数据的归一化处理大多只考虑特征属性取值本身的分布情况,没有客观地评估它对类别信息或其他特征属性的影响.针对这个问题,提出了一种基于信息论的网络入侵检测数据归一化方法.对连续特征属性,它以联合信息增益作为区间的分割评估方法,以区间的类别占比作为标准依据进行归一化处理;对离散特征属性,它根据类别条件熵的占比进行了归一化处理.利用NSL-KDD数据集仿真实验,结果表明,该方法不仅能够提高学习算法的收敛性,而且归一化的结果有助于提高分类模型的检测率和降低分类模型的误报率. In the era of big data,intrusion detection is widely used as an important means of network security.Different characteristics of network intrusion detection data have different dimension and dimension units.In order to eliminate the influence of dimension between feature attributes,normalization is usually done before data analysis.Most of the normalized processing only considers the distribution of the attribute value itself without objectively evaluating its influence on the category information or other characteristic attributes.Aiming at this problem,this paper proposes a method of normalizing network intrusion detection data based on information theory.For the continuous feature attributes,the joint information gain is taken as an evaluation method of interval segmentation,and normalization is done according to the proportion of the interval category.For the discrete feature attributes,normalization is done according to the proportion of the conditional entropy.Simulation results using NSL-KDD dataset show that the method can not only improve the convergence of learning algorithms,but also improve the detection rate of classification model and reduce the false alarm rate of classification model.

作者宋勇蔡志平 SONG Yong;CAI Zhiping(Department of Engineering Technology, H unan Vocational College for Nationalities, Yueyang 414000, H unan,China;College of Computer, National University of Defense Technology, Changsha 410073, Hunan, China)

机构地区湖南民族职业学院工程技术系国防科技大学计算机学院

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2018年第2期121-126,共6页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金资助项目(601379145)

关键词归一化入侵检测联合信息增益信息论 normalization intrusion detection joint information gain information theory

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1肖立中,邵志清,马汉华,王秀英,刘刚.网络入侵检测中的自动决定聚类数算法[J].软件学报,2008,19(8):2140-2148. 被引量：46
2张辉宜,谢业名,袁志祥,孙国华.一种基于概率的卡方特征选择方法[J].计算机工程,2016,42(8):194-198. 被引量：9
3罗敏,王丽娜,张焕国.基于无监督聚类的入侵检测方法[J].电子学报,2003,31(11):1713-1716. 被引量：64
4刘珊珊,谢晓尧,景凤宣,徐洋,张帅,汪自旺.基于PCA的PSO-BP入侵检测研究[J].计算机应用研究,2016,33(9):2795-2798. 被引量：23
5钱燕燕,李永忠,余西亚.基于多标记与半监督学习的入侵检测方法研究[J].计算机科学,2015,42(2):134-136. 被引量：15
6梁碧珍,陆月然,杨旭光.一种基于相对距离竞争激活的网络入侵检测算法[J].计算机工程与科学,2011,33(9):13-18. 被引量：2
7黄东.Bad：基于最小描述长度的均衡离散化方法[J].计算机工程与科学,2011,33(12):130-135. 被引量：2
8张逸群.对决策树连续值找分割点的算法的改进[J].计算机光盘软件与应用,2013,16(23):116-117. 被引量：1
9李洋,方滨兴,郭莉,田志宏.基于主动学习和TCM-KNN方法的有指导入侵检测技术[J].计算机学报,2007,30(8):1464-1473. 被引量：31
10姚亚夫,邢留涛.决策树C4.5连续属性分割阈值算法改进及其应用[J].中南大学学报（自然科学版）,2011,42(12):3772-3776. 被引量：41

二级参考文献104

1马锐,刘玉树,杜彦辉.基于ART2神经网络的入侵检测方法[J].北京理工大学学报,2004,24(8):701-704. 被引量：6
2杨德刚.基于模糊C均值聚类的网络入侵检测算法[J].计算机科学,2005,32(1):86-87. 被引量：26
3李昆仑,黄厚宽,田盛丰,刘振鹏,刘志强.模糊多类支持向量机及其在入侵检测中的应用[J].计算机学报,2005,28(2):274-280. 被引量：49
4蒋晓悦,赵荣椿,江泽涛.基于FCM的无监督纹理分割[J].计算机研究与发展,2005,42(5):862-867. 被引量：7
5吴庆涛,邵志清.入侵检测研究综述[J].计算机应用研究,2005,22(12):11-14. 被引量：19
6田大新,刘衍珩,魏达.ARTNIDS:基于自适应谐振理论的网络入侵检测系统[J].计算机学报,2005,28(11):1882-1889. 被引量：8
7余建军,孙树栋,吴秀丽,蔡志强.四种改进免疫算法及其比较[J].系统工程,2006,24(2):106-112. 被引量：11
8韩小云,刘瑞岩.ART－2网络学习算法的改进[J].数据采集与处理,1996,11(4):241-245. 被引量：22
9杨学兵,张俊.决策树算法及其核心技术[J].计算机技术与发展,2007,17(1):43-45. 被引量：87
10王阗,佘光辉.决策树C4.5算法在森林资源二类调查中的应用[J].南京林业大学学报（自然科学版）,2007,31(3):115-118. 被引量：13

共引文献225

1李兵,韩睿,何怡刚,张晓艺,侯金波.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319. 被引量：78
2颜金彪,段晓旗,郑文武,刘媛,邓运员,胡最.顾及空间异质性的自适应IDW插值算法[J].武汉大学学报（信息科学版）,2020,45(1):97-104. 被引量：8
3王志刚,钱兴坤,王东亮.基于PCA的多信息源实时网络入侵检测[J].计算机研究与发展,2006,43(z2):389-392.
4王飞,周鹏程,王雷,徐本连.一种面向新型入侵的获取和分类方法[J].计算机科学,2012,39(S3):45-50.
5赵玲.属性聚类算法在入侵检测中的应用[J].网络安全技术与应用,2004(12):49-51. 被引量：1
6马胜甫,孟雅辉,田俊峰,马国富.蜜罐与入侵检测系统协作模型的研究[J].计算机工程与应用,2005,41(31):127-130. 被引量：3
7张阿品,徐保国.无监督连接划分聚类算法及其在入侵检测中的应用[J].计算机工程与设计,2006,27(3):384-386. 被引量：3
8李玮,范九伦.基于新的聚类算法的入侵检测[J].计算机工程,2006,32(7):149-150. 被引量：6
9张喆,白琳.一种基于克隆网络聚类的入侵检测方法[J].计算机应用,2007,27(1):128-131. 被引量：2
10罗敏,阴晓光,张焕国,王丽娜.基于孤立点检测的入侵检测方法研究[J].计算机工程与应用,2007,43(13):146-149. 被引量：6

同被引文献509

1王晓敏,诸刚,陈云宝,张天放.基于高炉风口图像亮度的铁水温度预测[J].冶金自动化,2021,45(S01):67-73. 被引量：6
2毛群英.大数据背景下农村网络信息安全管理的路径[J].农业经济,2020(2):38-40. 被引量：7
3刘晓建,雷倩,杜茜,刘柯宏.多上下文特征的Android恶意程序静态检测方法[J].华中科技大学学报（自然科学版）,2020,48(2):85-90. 被引量：7
4李启会,刘祥官.高炉铁水含硅量的模糊预测函数控制[J].郑州大学学报（理学版）,2007,39(3):104-108. 被引量：6
5庞红霞.美国第一大城市——纽约[J].中学英语园地（教学指导）,2008,0(9):37-38. 被引量：1
6魏津瑜,张玮,李欣.基于PSO-BP神经网络的高炉煤气柜位预测模型及应用[J].中南大学学报（自然科学版）,2013,44(S1):266-270. 被引量：10
7冯兵,李芝棠,花广路.基于灰度—梯度共生矩阵的图像型垃圾邮件识别方法[J].通信学报,2013,34(S2):1-4. 被引量：11
8熊亚军,廖晓农,李梓铭,张小玲,孙兆彬,赵秀娟,赵普生,马小会,蒲维维.KNN数据挖掘算法在北京地区霾等级预报中的应用[J].气象,2015,41(1):98-104. 被引量：53
9菅志刚,金旭.数据挖掘中数据预处理的研究与实现[J].计算机应用研究,2004,21(7):117-118. 被引量：56
10王祖麟,王丽霞.一种前馈神经网络算法[J].科技广场,2004(8):51-53. 被引量：5

引证文献65

1裴炜旻.基于粗糙集的医院智能仪器数据库安全访问方法[J].自动化与仪器仪表,2020(4):175-178.
2孙致信,龚敏珠,陈琳军,马骏,张志慈,华漱涯,曹晶.自体造血干细胞移植治疗难治性恶性淋巴瘤[J].上海医学,2000,23(5):282-285. 被引量：2
3张登和.冶炼废渣开发利用前景探讨[J].江苏地质,2000,24(1):55-58. 被引量：8
4关连义.抓住机遇调整结构开拓非煤市场[J].煤矿设计,2000(5):3-4.
5杨凝之.基于CNN的入侵检测技术[J].通讯世界,2019,26(1):233-235. 被引量：2
6李强,翟亮.基于Stacking算法的员工离职预测分析与研究[J].重庆工商大学学报（自然科学版）,2019,36(1):117-123. 被引量：9
7王朝,姚敏,富展展.基于模糊综合评价的突发事件分级研究[J].软件导刊,2019,18(4):149-152. 被引量：5
8韩勇森,韩宝三,孙京文,宋成利,闫士举.MR图像纹理特征融合诊断前列腺癌[J].中国医学影像技术,2019,35(5):769-773. 被引量：3
9卢光跃,张宏建,闫真光,吴洋.基于特征选择和SVM的电信客户离网预测[J].西安邮电大学学报,2019,24(2):21-25. 被引量：6
10侯春雨,王戈文,王崇峻.一种改进遗传算法优化SVM的入侵检测方法[J].兵器装备工程学报,2019,40(6):109-114. 被引量：4

二级引证文献206

1马晓青,洪美玲,何士华,任晓华.黄金分割神经网络算法在水质预测中的应用[J].中国水运（下半月）,2020,20(9):53-55. 被引量：4
2何苗,荣宪伟.基于深度卷积神经网络的智能试卷合分系统[J].哈尔滨师范大学自然科学学报,2022,38(3):59-66.
3林桂真,李芳,陈美莲,梁宁宁,黄仁魏,吴祥元,林曲,王东宁.自体与异体造血干细胞移植后造血系统重建的状况与差异分析[J].新医学,2005,36(5):277-278. 被引量：3
4李敬东,韩效林,吴隼,李志英.MAC预处理方案在自体造血干细胞移植中应用31例分析[J].中国误诊学杂志,2006,6(17):3416-3417. 被引量：1
5顾建邦.探析钢渣在道路工程中的应用[J].中国科技信息,2007(7):23-24. 被引量：3
6孟庆余,李伟男,唐志前,姜铁.钒渣道路基层材料的试验研究[J].武汉理工大学学报,2007,29(9):91-94. 被引量：9
7汤睿,方维萱,朱俊宾,胡煜昭.贵州省隆晴锑矿冶炼炉渣中锑和金分布规律、赋存状态与潜在价值[J].矿产综合利用,2010(3):19-22. 被引量：2
8林七女,李志峰,董世颂,艾士云.烧结机头除尘灰生产复合肥的研究[J].再生资源与循环经济,2010,3(7):38-40. 被引量：2
9金俊,张晓萍,覃德波.马钢高钾烧结除尘灰脱钾方法研究[J].烧结球团,2013,38(4):56-59. 被引量：5
10李乐天,郑何真,丁晨,许永峰.基于改进BP神经网络的恐怖袭击事件分级研究[J].软件导刊,2019,18(5):21-26. 被引量：4

1李勇男.信息增益决策树在反恐情报分析中的应用研究[J].情报科学,2018,36(4):80-84. 被引量：12
2焦桂梅,安思琪,陈长香,李建民.中高龄老年人衰弱程度与老年性骨质疏松症的相关性探讨[J].中国骨质疏松杂志,2018,24(3):376-379. 被引量：23
32017年我国出生人口和出生率双酶二孩数量首超一孩[J].世界博览,2018,0(4):6-6.
4覃朗,朱建军,衣柏衡,周新民.非均衡数据下基于信息增益的SMOTE改进SVM模型研究[J].中国管理科学,2016,24(S1):128-136. 被引量：4
5龚晓国.砖瓦大气污染物达标排放控制措施[J].砖瓦世界,2017(9):50-53. 被引量：1
6魏瑶,李红信.一种多分类算法FELM在网络入侵中的应用[J].中国科技纵横,2017,0(9):36-36.
7彭苏萍,王磊,孟召平,段延娥,卞建玲,王英坡.遥感技术在煤矿区积水塌陷动态监测中的应用——以淮南矿区为例[J].煤炭学报,2002,27(4):374-378. 被引量：58
8强制性国标将覆盖所有商品肥料[J].泸天化科技,2017,0(4):222-222.
9刘劲隆.基于朴素贝叶斯分类方法的校园网络入侵行为检测[J].信息与电脑,2016,28(19):173-174. 被引量：1

武汉大学学报（理学版）

2018年第2期

浏览历史

内容加载中请稍等...

大数据环境下基于信息论的入侵检测数据归一化方法被引量：65

参考文献11

二级参考文献104

共引文献225

同被引文献509

引证文献65

二级引证文献206

相关作者

相关机构

相关主题

浏览历史

大数据环境下基于信息论的入侵检测数据归一化方法 被引量：65

参考文献11

二级参考文献104

共引文献225

同被引文献509

引证文献65

二级引证文献206

相关作者

相关机构

相关主题

浏览历史

大数据环境下基于信息论的入侵检测数据归一化方法被引量：65