一种新的基于邻居样本分布特征的异常值检测算法研究被引量：4

A New Outlier Detection Algorithm Based on Neighbor Sample Distribution

下载PDF

导出

摘要在数据挖掘领域中,研究的重点之一为异常检测技术。针对数据挖掘中实际采集到的样本数据受众多因素的影响所出现的异常值,本文提出一种新的基于邻居样本分布特征的异常检测算法,该算法通过引用邻域的概念能够处理混合属性的数据集,并且单纯考虑一个样本的的邻域大小和样本的邻域密度不能合理的反映该样本的异常程度,该算法考虑邻域中的所有样本。仿真实验结果表明,在处理混合数据中本文提出的数据异常检测算法相较其他异常检测算法有明显的优势。 In the field of data mining, one of the key research for anomaly detection. The abnormal value appears in view of the influence of many factors of sample data in the data mining the actual audience of the collected, this paper proposes a new anomaly detection algorithm based on neighbor distribution feature, the algorithm by reference to the concept of mixed neighborhood the properties of the data set,and only consider the neighborhood density cannot be a sample of the size of the neighborhood and the samples reasonably reflect the abnormal degree of the sample, the algorithm considers all the samples in the neighborhood. The simulation results show that the anomaly detection algorithm compared to other anomaly detection algorithm has obvious advantages in processing the mixed data is put forward the data.

作者张军刘文杰 Zhang Jun;Liu Wenjie(Jiangsu Maritime Institute,Nanjing 211170,China;School of Computer and Software,Nanjing University of Information Science & Technology,Nanjing 210044,China)

机构地区江苏海事职业技术学院南京信息工程大学计算机与软件学院

出处《科技通报》北大核心 2017年第1期86-88,141,共4页 Bulletin of Science and Technology

基金 2015年江苏省现代教育技术重点研究课题(项目编号:2015-R-42639)

关键词混合数据异常检测异常值邻居样本 mixed data anomaly detection outlier neighbor sample

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1柴争义,王献荣,王亮.用于异常检测的实值否定选择算法[J].吉林大学学报（工学版）,2012,42(1):176-181. 被引量：12
2林硕蕾.基于小数据冲突检测的坏点数据挖掘模型仿真[J].科技通报,2015,31(1):213-216. 被引量：2
3刘良旭,乐嘉锦,乔少杰,宋加涛.基于轨迹点局部异常度的异常点检测算法[J].计算机学报,2011,34(10):1966-1975. 被引量：20

二级参考文献31

1薛安荣,鞠时光,何伟华,陈伟鹤.局部离群点挖掘算法研究[J].计算机学报,2007,30(8):1455-1463. 被引量：96
2Knorr E M, Ng R T, Tucakov V. Distance-based outliers: Algorithms and applications. VLDB Journal, 2000, 8 (3) : 237-253.
3Ramaswamy S, Rastogi R, Shim K. Efficient algorithms for mining outliers from large data sets//Proceedings of the 2000 ACM SIGMOD International Conference. Dallas, TX, USA, 2000:427-438.
4Breunig M M, Kriegel H P, Ng R T, Sander J. LOF: lden tifying density-based local outliers//Proceedings of the 2000 ACM SIGMOD International Conference. Dallas, TX, USA, 2000:93-104.
5Papadimitriou S, Kitagawa H, Gibbons P B, Faloutsos C. LOCI: Fast outlier detection using the local correlation into gral//Proceedings of the 19th International Conference on Data Engineering. Bangalore, India, 2003:315-326.
6Aggarwal C C, Yu P S. Outlier detection for high dimensional data//Proceedings of the 2001 ACM SIGMOI) International Conference. Santa Barbara, CA USA, 2001:37 -46.
7Li X, Han J, Kim S, Gonzalez H. ROAM: Rule and motifbased anomaly detection in massive moving object data sets// Proceedings of the 7th SIAM International Conferencc on Data Mining. Minneapolis, Minnesota, 2007:296-307.
8Lee J, Han J, Li X. Trajectory outlier detection: A parti tion-and-detect framework//Proceedings of the 24th Interna tional Conference on Data Engineering. Cancun, Mexico,2008:140-149.
9Huttenlocher D P, Klanderman G A, Rucklidge W A. Corn paring images using the hausdorff distance. IEEE Transac tions on Pattern Analysis and Machine Intelligence, 1993 15(9) : 850-863.
10Tao Yufei, Papadias Dimitris, Sun Jimeng. The TPR * tree: An optimized spatio temporal access method for predictive queries//Proeeedings of the 29th International Conference on Very Large Databases. Berlin, Germany, 2003:790 -801.

共引文献31

1柴争义,吴慧欣,吴勇.用于异常检测的免疫实值检测器优化生成算法[J].吉林大学学报（工学版）,2012,42(5):1251-1256. 被引量：3
2伍海波.一种改进的否定选择算法在入侵检测中的应用[J].计算机应用与软件,2013,30(2):174-176. 被引量：4
3赵一丁,李志民,王洪利,刘卫光,楚纪正.基于数据挖掘的仿真模型参数修正[J].计算机应用,2013,33(10):2827-2831.
4李斌,刘瑞琴,刘学军.基于冗余点压缩的趋势异常序列检测[J].传感技术学报,2014,27(3):401-408. 被引量：3
5曹羲,王亮,王清河.一种用于无线局域网用户接入的双层认证方法[J].内蒙古师范大学学报（自然科学汉文版）,2014,43(4):490-493.
6李文海,程志光,文卫东,向隆刚,郭晓倩.基于自适应安全区域的轨道实时化简方法[J].计算机学报,2014,37(9):1922-1935. 被引量：2
7金静,韩虎,崔永君.改进的否定选择算法在入侵检测系统中的应用[J].电子设计工程,2015,23(1):7-9. 被引量：7
8张安玲,邓启森.一种混合人工免疫算法的研究[J].中北大学学报（自然科学版）,2015,36(1):56-60. 被引量：3
9高炜,曹锐.一种基于集群概率的网络入侵检测算法[J].电子技术与软件工程,2015(8):231-233. 被引量：1
10冯利容,彭艳兵,杨美珍.临近基站建议模型在基站位置校正中的应用[J].计算机与现代化,2015(11):6-11. 被引量：2

同被引文献24

1夏敏纳,龚德良,肖娟.一种面向可靠云计算的自适应故障检测方法[J].计算机应用研究,2014,31(2):426-430. 被引量：7
2王宪,柳絮青,宋书林,沈源.一种无监督学习的异常行为检测方法[J].光电工程,2014,41(3):43-48. 被引量：7
3孟强强,杨桄,卢珊,张俭峰,童涛.利用NSCT分解的高光谱异常检测[J].红外技术,2014,36(5):372-376. 被引量：3
4李栋,刘树林,刘颖慧,张宏利.基于自适应超环检测器的设备异常度检测方法[J].机械工程学报,2014,50(12):17-24. 被引量：6
5胡石,李光辉,卢文伟,冯海林.基于神经网络的无线传感器网络异常数据检测方法[J].计算机科学,2014,41(B11):208-211. 被引量：28
6李文璟,袁野,喻鹏,邱雪松.基于改进Kruskal算法的WSN故障节点检测方法[J].北京邮电大学学报,2014,37(4):103-107. 被引量：4
7郑併斌,范新南,李敏,张继.基于轨迹分段LDA主题模型的视频异常行为检测方法[J].计算机应用,2015,35(2):515-518. 被引量：9
8黄静,李长春,延皓,赵旭昌,杨雪松.多尺度直线拟合法在时间序列突变点检测中的应用[J].兵工学报,2015,36(6):1110-1116. 被引量：8
9周洁,郭立君,张荣.基于集群性特征的异常行为检测[J].光电工程,2015,42(9):35-40. 被引量：2
10陈艳,王子健,赵泽,李栋,崔莉.传感器网络环境监测时间序列数据的高斯过程建模与多步预测[J].通信学报,2015,36(10):252-262. 被引量：11

引证文献4

1方玉峰.一种基于信息论的文本数据挖掘算法[J].电子技术与软件工程,2017(12):171-171.
2陈雅.大数据环境下异常信息检测仿真研究[J].计算机仿真,2017,34(9):366-369. 被引量：4
3聂晶.云计算系统服务器节点故障的检测算法[J].内蒙古师范大学学报（自然科学汉文版）,2018,47(1):23-27. 被引量：3
4蔡亮,张忠林.网络化环境病毒防御过程突变数据检测仿真[J].计算机仿真,2018,35(9):373-376. 被引量：1

二级引证文献8

1毛靖.图书资源共享下用户浏览行为差异检测仿真[J].计算机仿真,2018,35(11):401-404. 被引量：1
2马潇源.园林景观格局区域破碎化信息连续检测仿真[J].计算机仿真,2019,36(3):432-435. 被引量：1
3赵磊.多链路即时通信中交互数据异常点检测仿真[J].计算机仿真,2019,36(11):445-448. 被引量：3
4刘红英.大数据下网络化软件时间变化敏感点检测仿真[J].计算机仿真,2019,36(12):353-356. 被引量：1
5来风刚,李济伟,董耀众,宋瑞华,李伟良.PC服务器故障预测分析及维护处理[J].电子技术与软件工程,2020(1):115-116. 被引量：1
6岳少博,王清河,王晓春,谢利德.基于虚拟专用技术的网络空间防御方法仿真[J].计算机仿真,2020,37(5):273-277. 被引量：8
7王宇,孙慕华.桌面虚拟化软件服务器冗余故障自修复仿真[J].计算机仿真,2021,38(3):425-429.
8王红霞.舰船云计算系统服务器故障的识别模型[J].舰船科学技术,2019,41(4):154-156. 被引量：2

1范莹,计华,张化祥.一种新的基于模糊聚类的组合分类器算法[J].计算机应用,2008,28(5):1204-1207. 被引量：3
2曾嵘,蒋新华,刘建成.基于支持向量机的异常值检测的两种方法[J].信息技术,2004,28(5):3-4. 被引量：1
3王快妮,钟萍,赵庄园.基于支持向量机的异常值问题的研究现状[J].计算机工程与设计,2010,31(9):1989-1991. 被引量：2
4梁礼明,冯新刚,陈云嫩,李钟侠.基于样本分布特征的核函数选择方法研究[J].计算机仿真,2013,30(1):323-328. 被引量：10
5高如新,任晓朵,吴献,周世华.基于高斯概率模型的字符识别算法的研究[J].测控技术,2017,36(3):33-36. 被引量：4
6苏加强,丁柳云.基于聚类ORh方法的异常值检测应用研究[J].宁德师范学院学报（自然科学版）,2013,25(1):32-35.
7韩海燕,高婷.基于MATLAB软件的网络媒体中大数据技术研究[J].电子世界,2014(5):10-10.
8苏加强,丁柳云.基于R的监督式AdaBoost异常值检测应用[J].淮海工学院学报（自然科学版）,2013,22(1):22-25.
9陈娇,潘天红,张明.基于信号变化速率的时间序列异常值检测方法[J].北京工业大学学报,2014,40(7):992-995. 被引量：4
10郭金玲.极坐标核在样本分类问题中的应用研究[J].太原师范学院学报（自然科学版）,2016,15(1):43-46.

科技通报

2017年第1期

浏览历史

内容加载中请稍等...

一种新的基于邻居样本分布特征的异常值检测算法研究被引量：4

参考文献3

二级参考文献31

共引文献31

同被引文献24

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种新的基于邻居样本分布特征的异常值检测算法研究 被引量：4

参考文献3

二级参考文献31

共引文献31

同被引文献24

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种新的基于邻居样本分布特征的异常值检测算法研究被引量：4