分布式计算环境下的入侵检测数据分类研究被引量：1

Intrusion Detection Data Classification by Distributed Computing

下载PDF

导出

摘要为了有效处理迅速增长的海量信息数据安全问题,在Hadoop云计算平台上,应用朴素贝叶斯算法和Logistic回归算法对入侵检测大数据进行并行计算分析。实验在伪分布模式和分布模式下进行计算,结果表明2种算法分类准确率均超过90%,Logistic回归算法比朴素贝叶斯算法运行时间更长;集群环境下运行的朴素贝叶斯算法可以有效降低运行时间。综合算法运行时间和分类准确率等因素,朴素贝叶斯算法比Logistic回归算法更能有效处理入侵检测大数据;并行计算下朴素贝叶斯算法可以有效分析入侵检测大数据。 To handle huge amounts of network data effectively which is increasing rapidly, Naive Bayesian parallel algorithm and Logistic Regression parallel algorithm were used to analyze the intrusion detection big data based on Hadoop which is a cloud computing system. The intrusion detection data was computed in the model of pseudo-distribution model and distribution model. The experimental results show that the classification accuracy of the two algorithms can exceed 90% and Logistic Regression algorithm spent more time than Naive Bayesian algorithm. Naive Bayesian algorithm can reduce run time effectively in Hadoop cluster. So Naive Bayesian algorithm is more effectively than Logistic Regression algorithm with the classification accuracy and the algorithm running time considered. Naive Bayesian algorithm can analyze the intrusion detection big data.

作者沈利香曹国

机构地区常州工学院计算机信息工程学院常州工学院经济管理学院

出处《计算机与现代化》 2015年第12期43-47,共5页 Computer and Modernization

基金教育部人文社会科学研究青年基金资助项目(11YJCZH005)

关键词入侵检测朴素贝叶斯 LOGISTIC回归 intrusion detection Naive Bayesian Logistic Regression

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1Chen C L P, Zhang Chun-yang. Data-intensive applications, challenges, techniques and technologies: A survey on big data [ J ]. Information Sciences, 2014,275:314-347.
2Manyika J, Chui M, Brown B, et al. Big Data: The Next Frontier For Innovation, Competition, and Productivity [ EB/OL]. http://www, mckinsey, corn/insights/business _technology/big_data the next_frontier for innovation, 2014-10-30.
3Kambatla K, Kollias G, Kumar V, et al. Trends in big da- ta analytics [ J ]. Journal of Parallel and Distributed Compu- ting, 2014,74(7) :2561-2573.
4Lee Yeonhee, Lee Youngseok. Towards scalable internet traffic measurement and analysis with Hadoop [ J ]. ACM SIGCOMM Computer Communication Review, 2013, 43 ( 1 ) :5-13.
5Edwards M, Rambani A, Zhu Yifeng, et al. Design of Ha- doop-based framework for analyties of large synchmphasor datasets[ J ]. Procedia Computer Science, 2012, 12 : 254- 258.
6Ericson K, Palliekara S. On the performance of high di- mensional data clustering and classification algorithms [ J ]. Future Generation Computer Systems, 2013,29 ( 4 ) : 1024- 1034.
7Caruana G, Li Maozhen, Liu Yang. An ontology enhanced parallel SVM for sealable spam filter training [ J ]. Neuro- computing, 2013,108:45-57.
8Rio S D, Lopez V, Benitez J M, et al. On the use of Ma- pReduce for imbalanced big data using Random Forest [ J ]. Information Sciences, 2014,285 : 112-137.
9Kwon O, Sim J M. Effects of data set features on the per- formances of classification algorithms [ J ]. Expert Systems with Applications, 2013,40 (5) : 1847-1857.
10张新有,曾华燊,贾磊.入侵检测数据集KDD CUP99研究[J].计算机工程与设计,2010,31(22):4809-4812. 被引量：121

二级参考文献4

1史美林,钱俊,许超.入侵检测系统数据集评测研究[J].计算机科学,2006,33(8):1-8. 被引量：24
2祖宝明,詹永照,卿林.一种针对MANET入侵检测Agent分布的分簇方法[J].微计算机信息,2007,23(05X):41-43. 被引量：1
3刘密霞,张秋余,赵宏,余冬梅.入侵检测报警相关性及评测数据集研究[J].计算机应用研究,2008,25(10):3108-3111. 被引量：1
4刘自伟,蔡勇,陈波.KDD在入侵检测中的应用[J].微型机与应用,2003,22(12):55-58. 被引量：2

共引文献120

1王珏,芦斌,祝跃飞.对抗性网络流量的生成与应用综述[J].计算机科学,2022,49(S02):651-661. 被引量：2
2姜家涛,刘志杰,谢晓尧.基于模糊神经网络集成的入侵检测模型[J].山东大学学报（理学版）,2011,46(9):95-98. 被引量：4
3沈利香,曹国.基于数据挖掘的入侵检测多分类模型研究[J].常州工学院学报,2011,24(6):36-40.
4全亮亮,吴卫东.基于支持向量机和贝叶斯分类的异常检测模型[J].计算机应用,2012,32(6):1632-1635. 被引量：7
5沈利香.基于GA与BP神经网络的网络入侵检测组合模型研究[J].常州工学院学报,2012,25(4):27-32. 被引量：3
6夏战国,万玲,蔡世玉,孙鹏辉.一种面向入侵检测的半监督聚类算法[J].山东大学学报（工学版）,2012,42(6):1-7. 被引量：9
7郑继刚.基于数据挖掘Weka平台的拒绝服务攻击关联分析[J].计算机安全,2013(1):28-32. 被引量：1
8梁飞,闫宏印.基于聚类分析的动态自适应入侵检测模式研究[J].计算机工程与设计,2013,34(3):814-820. 被引量：7
9李占波,白全海,申义彩.基于主成分分析的网络入侵检测算法[J].计算机工程,2013,39(5):152-155. 被引量：6
10李科,黄双,周浩,秦元庆,周纯杰.面向工业人机界面的信息安全策略设计及实现[J].计算机工程与设计,2013,34(8):2689-2694. 被引量：1

同被引文献11

1肖政,王建新,侯紫峰,韦卫.基于搜索树的告警高效聚类算法和Bayes分类器的设计和研究[J].计算机科学,2006,33(8):190-194. 被引量：3
2孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
3郑湃,崔立真,王海洋,徐猛.云计算环境下面向数据密集型应用的数据布局策略与方法[J].计算机学报,2010,33(8):1472-1480. 被引量：121
4李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：111
5崔建,李强,杨龙坡.基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法[J].计算机科学,2011,38(4):216-220. 被引量：24
6周涛,陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用,2012,48(12):100-111. 被引量：145
7葛澎.分布式计算技术概述[J].微电子学与计算机,2012,29(5):201-204. 被引量：14
8杜立智,符海东,张鸿,黄远林.P与NP问题研究[J].计算机技术与发展,2013,23(1):37-42. 被引量：12
9覃艳,王洪,周全华.数据挖掘中聚类算法的研究[J].网络安全技术与应用,2014(1):65-66. 被引量：10
10隋新,刘莹.入侵检测技术的研究[J].科技通报,2014,30(11):89-94. 被引量：9

引证文献1

1丁晓阳,罗阳,王建新.层次化聚类在分布式计算环境中的剪枝策略[J].计算机应用与软件,2017,34(5):261-267. 被引量：1

二级引证文献1

1毛昊迪,汤鲲.基于层次聚类的共享单车维修点规划模型[J].电子设计工程,2022,30(21):20-23.

1王艳红,周军.基于Hadoop的网络爬虫技术研究[J].吉林工程技术师范学院学报,2014,30(8):87-89. 被引量：4
2吴晓婷,刘学超.浅谈Hadoop云计算的认识[J].无线互联科技,2014,11(8):45-45. 被引量：2
3李寒,唐兴兴.基于参数优化的Hadoop云计算平台[J].计算机系统应用,2013,22(3):21-24. 被引量：2
4金伟健,王春枝.适于进化算法的迭代式MapReduce框架[J].计算机应用,2013,33(12):3591-3595. 被引量：16
5王静蕾.Hadoop云计算框架中的分布式数据库HBase研究[J].商丘职业技术学院学报,2014,13(2):18-20. 被引量：1
6杜旭,刘森,颜璟仪.基于Hadoop的智能电网监控系统的设计与实现[J].科技创新与应用,2014,4(17):5-7. 被引量：2
7代栋,周学海,杨峰,王超.一种基于模糊推理的Hadoop异构机群自动配置工具[J].中国科学院研究生院学报,2011,28(6):793-800. 被引量：5
8江小平,李成华,向文,张新访.云计算环境下朴素贝叶斯文本分类算法的实现[J].计算机应用,2011,31(9):2551-2554. 被引量：21
9孟海东,肖银龙,宋宇辰.基于Hadoop的Dirichlet朴素贝叶斯文本分类算法[J].现代电子技术,2016,39(4):29-33. 被引量：3
10牛科,贾郭军.基于Hadoop云平台的并行谱聚类算法的设计与实现[J].山西师范大学学报（自然科学版）,2014,28(1):43-46. 被引量：1

计算机与现代化

2015年第12期

浏览历史

内容加载中请稍等...

分布式计算环境下的入侵检测数据分类研究被引量：1

参考文献15

二级参考文献4

共引文献120

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

分布式计算环境下的入侵检测数据分类研究 被引量：1

参考文献15

二级参考文献4

共引文献120

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

分布式计算环境下的入侵检测数据分类研究被引量：1