基于PCA和半监督聚类的入侵检测算法研究被引量：10

Research on intrusion detection algorithm based on PCA and semi-supervised clustering

导出

摘要针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis,PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用少量已标记样本和成对约束信息,通过引入竞争凝聚让系统主动学习,以实现对大量未知样本的检测。在入侵检测数据集和UCI基准数据集上的实验结果表明,该算法能有效提高系统的性能。 In order to solve the problem that lots of redundant information existed in network intrusion detection data and the traditional clustering algorithms were inadequate for detecting outlier, an intrusion detection algorithm based on prin- cipal component analysis （PCA） and semi-supervised clustering was proposed. First, the features of data were extracted by using PCA, and the redundant attributes among the data were eliminated. Then, a few labeled samples and pairwise constraints information were exploited, and competitive agglomeration was introduced to letting the system active learning in order that the detection of lots of unknown samples could be realized. The experimental results on intrusion detection data set and UCI benchmark data sets showed that this algorithm could effectively improve the system performance.

作者丁彦李永忠

机构地区江苏科技大学计算机科学与工程学院

出处《山东大学学报（工学版）》 CAS 北大核心 2012年第5期41-46,共6页 Journal of Shandong University（Engineering Science）

基金江苏省高校自然科学基金资助项目(05KJD52006) 江苏科技大学科研资助项目(2005DX006J)

关键词入侵检测 PCA 半监督聚类成对约束竞争凝聚 intrusion detection principal component analysis （PCA） semi-supervised clustering pairwise constraints competitive agglomeration

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1GUPTA R, GOSAIN A. Validating data warehouse quality metrics using PCA [C]// Proceedings of the Second International Conference on Data Engineering and Management. Tiruchirappalli: Springer-Verlag Press, 2012 : 170-172.
2LIU G S, YI Z, YANG S M. A hierarchical intrusion detection model based on the PCA neural networks [ J]. Neurocomputing, 2007 (70) : 1561-1568.
3韩家炜,堪博 M.数据挖掘:概念与技术[M].范明,孟小峰.译.2版.北京:机械工业出版社,2007:30-65.
4杨洋,王立宏.半监督聚类中成对约束的主动学习[J].广西师范大学学报（自然科学版）,2011,29(1):87-91. 被引量：1
5李明,杨艳屏,占惠融.基于局部聚类与图方法的半监督学习算法[J].自动化学报,2010,36(12):1655-1660. 被引量：6
6陈斌,陈松灿,潘志松,李斌.异常检测综述[J].山东大学学报（工学版）,2009,39(6):13-23. 被引量：39
7MICHEL V, GRAMFORT A, VAROQUAUX G. A supervised clustering approach for fMRI-based inference of brain states [J]. Pattern Recognition, 2012, 45 ( 6 ) : 2041-2049.
8吴庆涛,邵志清.入侵检测研究综述[J].计算机应用研究,2005,22(12):11-14. 被引量：19
9尹柯,李雯睿.基于半监督聚类的入侵检测模型[J].河南大学学报（自然科学版）,2008,38(6):640-643. 被引量：2
10魏小涛,黄厚宽,田盛丰.基于半监督聚类的网络入侵检测算法[J].铁道学报,2010,32(1):49-53. 被引量：2

二级参考文献73

1陈华根,吴健生,王家林,陈冰.模拟退火算法机理研究[J].同济大学学报（自然科学版）,2004,32(6):802-805. 被引量：133
2卿斯汉,蒋建春,马恒太,文伟平,刘雪飞.入侵检测技术研究综述[J].通信学报,2004,25(7):19-29. 被引量：231
3张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
4冯力,管晓宏,郭三刚,高艳,刘培妮.采用规划识别理论预测系统调用序列中的入侵企图[J].计算机学报,2004,27(8):1083-1091. 被引量：11
5徐晓华,陈崚.一种自适应的蚂蚁聚类算法[J].软件学报,2006,17(9):1884-1889. 被引量：55
6Mukkamala S, Janoski G, Sung AH. Intrusion detection using support vector machines and neural networks[J]. Proc. of the IEEE Int'l Joint Conf. on Neural Networks. 2002: 1702--1707.
7Eskin E, Arnold A, Prerau M. A geometric framework for unsupervised anomaly detection: detecting intrusions in unlabeled data[C]. Applications of Data Mining in Computer Security. Kluwer Academic Publisher, Boston, 2002:77-- 102.
8Zhu X j. Semi-Supervised. Learning I.iterature Survey [R]. Computer Sciences TR 1530. University of Wisconsin Madison, 2006.
9Basu S, Bilenko M, Mooney R J. A probabilistic framework for semi-supervised clustering [C]. In Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, WA, 2004: 59--68.
10KDD cup 1999 data[ R/OL]. [2008-- 03-- 28] http://kdd, ics. uci. edu/databases/kddcup99/kddcup99, html.

共引文献72

1董泽,贾昊.基于EWT-LOF的热工过程数据异常值检测方法[J].仪器仪表学报,2020,41(2):126-134. 被引量：23
2张克柱.基于数据挖掘的校园网入侵检测系统研究与应用[J].河北北方学院学报（自然科学版）,2014,30(3):28-30.
3邹文.浅谈入侵检测技术及其发展[J].企业技术开发,2008,27(4):25-26. 被引量：4
4陶敬,马小博,赵娟,郑庆华.基于资源可用性的主机异常检测[J].电子科技大学学报,2007,36(S3):1449-1452. 被引量：3
5贺德荣,蒋白纯.提高电子政务信息共享平台数据质量的对策与方法——一个省级信用信息服务平台数据处理实例[J].电子政务,2010(7):67-76. 被引量：10
6孙静宇,余雪丽,陈俊杰,李鲜花.采样特异性因子及异常检测[J].山东大学学报（工学版）,2010,40(5):56-59.
7谭台哲,梁应毅,刘富春.一种ReliefF特征估计方法在无监督流形学习中的应用[J].山东大学学报（工学版）,2010,40(5):66-71. 被引量：2
8赵希晶,吴小欣,杨薇,王宏旭,曹如琢.面向容忍入侵的先应式入侵响应模型研究[J].通信工程,2011(3):42-43.
9林永菁.基于RBF和BP神经网络的入侵检测模型比较研究[J].长江大学学报（自然科学版）,2011,8(10):86-88. 被引量：1
10张玉飞,董永贵.一种时间序列异常检测用参数化熵滤波器[J].机械工程学报,2011,47(22):13-18. 被引量：2

同被引文献88

1吴旗,刘健男,寇文龙,张宗升.改进的单类支持向量机的网络流量检测[J].吉林大学学报（工学版）,2013,43(S1):124-127. 被引量：3
2李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：880
3刘常昱,冯芒,戴晓军,李德毅.基于云X信息的逆向云新算法[J].系统仿真学报,2004,16(11):2417-2420. 被引量：184
4吴庆涛,邵志清.入侵检测研究综述[J].计算机应用研究,2005,22(12):11-14. 被引量：19
5陈志民,杨敬锋,陈其昌,张嘉琪,陈强.融合监督学习与凝聚层次聚类的土地评价方法[J].计算机工程与应用,2007,43(18):188-190. 被引量：3
6周志华,杨强.机器学习及其应用[M].北京:清华大学出版社,2011.
7BECCHETTI L, CASTILLO C, DONATO D, et al. Web spam detection: link-based and content-based tech- niques [ C ]//The European Integrated Project Dynami- cally Evolving, Large Scale Information Systems (DELLS): proceedings of the final workshop. Pader- born, Germany: [ s. n. ], 2008:99-113.
8CASTILLO C, DONATO D, GIONIS A, et al. Know your neighbors : Web spam detection using the web topol- ogy [ C ]//Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA : ACM, 2007 : 423-430.
9ABERNETHY J, CHAPELLE O, CASTILLO C. Graph regularization methods for Web spam detection [ J ]. Machine Learning, 2010, 81 (2) :207-225.
10GENG Guanggang, LI Qiudan, ZHANG Xinchang. Link based small sample learning for web spam[ C]//Proceed- ings of the 18th International Conference on World Wide Web. New York, USA: ACM, 2009:1185-1186.

引证文献10

1高爽,张化祥,房晓南.基于独立成分分析和协同训练的垃圾网页检测[J].山东大学学报（工学版）,2013,43(2):29-34. 被引量：1
2魏曰海.基于成对约束的半监督凝聚层次聚类算法[J].电脑编程技巧与维护,2013(24):97-97.
3李永忠,张杰.一种基于云模型和半监督聚类的入侵检测算法[J].电子测量与仪器学报,2014,28(12):1376-1381. 被引量：9
4刘宁.一种半监督网络入侵检测系统SSIDS-CV[J].计算机与数字工程,2015,43(4):648-651.
5李琳,尚文利,姚俊,万明,曾鹏.工控系统PCA-OCSVM入侵检测算法[J].计算机工程与设计,2016,37(11):2928-2933. 被引量：7
6王声柱,李永忠.基于深度学习和半监督学习的入侵检测算法[J].信息技术,2017,41(1):101-104. 被引量：9
7唐斯琪,潘志松.基于流形学习的网络数据流异常检测[J].济南大学学报（自然科学版）,2017,31(2):118-128. 被引量：3
8张瑞,陈红卫.基于特征优化与SVPSO的工控入侵检测[J].计算机工程,2020,46(4):19-25. 被引量：12
9赵敏,刘惊雷.基于高斯场和自适应图正则的半监督聚类[J].计算机科学,2021,48(7):137-144.
10张师鹏,李永忠.基于降噪自编码器和三支决策的入侵检测方法[J].计算机科学,2021,48(9):345-351. 被引量：4

二级引证文献44

1张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
2彭荣欣,王书民.法桐草履蚧的发生规律及防治研究[J].河北林果研究,2000,15(1):64-66. 被引量：2
3潘楠,伍星,刘益,杨敬树,羿泽光.线性痕迹激光检测信号自适应匹配算法研究[J].仪器仪表学报,2015,36(6):1372-1380. 被引量：6
4井柯,董黎芳,孙一桉.智能变电站监测预警系统研究与应用[J].电力信息与通信技术,2015,13(11):153-157. 被引量：4
5刘莉,杨傲雷,屠晓伟,费敏锐,彭飞.面向INS数据分类的鲁棒性无监督聚类方法[J].仪器仪表学报,2016,37(1):152-160. 被引量：8
6韩缤,计华.基于关联属性主成分分析的SVM技术应用于Web Spam分类[J].信息技术与信息化,2016(4):65-69.
7潘楠,阚立峰,刘益.犯罪工具图片快速溯源技术研究[J].昆明理工大学学报（自然科学版）,2017,42(3):52-59. 被引量：2
8阎栋,董媛.基于云计算的海量网络流量数据分析研究[J].自动化与仪器仪表,2017(9):32-34. 被引量：9
9刁振军,张琦,曹子建.融合Snort和代理的网络异常检测与防御系统研究[J].电子设计工程,2018,26(1):43-47. 被引量：7
10孟海涛,邵星.基于压缩感知算法的传感器网络异常事件检测[J].吉林大学学报（理学版）,2018,56(2):375-381. 被引量：1

1于平,王士同.基于点密度的半监督CA算法在图像聚类中的应用[J].南京大学学报（自然科学版）,2014,50(4):447-456. 被引量：2
2张明,王艳,李强.浅谈靶场数据挖掘中流数据的特征提取方法[J].通讯世界,2017,23(3):247-248. 被引量：1
3唐利娜.基于竞争凝聚的Web用户聚类[J].福建电脑,2010,26(12):100-102.
4余轶军,林怀忠,陈纯.基于竞争凝聚的个性化网页推荐[J].浙江大学学报（工学版）,2007,41(2):239-244. 被引量：1
5钟将,刘龙海,梁传伟.基于成对约束的主动半监督文本聚类[J].计算机工程,2011,37(13):183-186. 被引量：4
6王娜,刘国胜,李霞.基于成对约束半监督学习的数据相关核优化方法[J].模式识别与人工智能,2011,24(5):685-691.
7盛俊杰,谢丽聪.一种基于类标记和成对约束的半监督聚类算法[J].中国电子商情（通信市场）,2012(5):42-47.
8杨洋,王立宏,刘其成.一种主动式的半监督最近邻学习方法[J].山东大学学报（理学版）,2011,46(5):110-115.
9蒋伟进,许宇晖,王欣.基于谱图和成对约束的主动半监督聚类算法[J].控制与决策,2013,28(6):904-908. 被引量：5
10闫军.带有成对约束半监督聚类算法C-DBSCAN的设计与实现[J].太原城市职业技术学院学报,2012(10):175-177.

山东大学学报（工学版）

2012年第5期

浏览历史

内容加载中请稍等...

基于PCA和半监督聚类的入侵检测算法研究被引量：10

参考文献20

二级参考文献73

共引文献72

同被引文献88

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于PCA和半监督聚类的入侵检测算法研究 被引量：10

参考文献20

二级参考文献73

共引文献72

同被引文献88

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于PCA和半监督聚类的入侵检测算法研究被引量：10