一种两阶段异常检测方法被引量：7

Two-Stage Outlier Detection Approach

下载PDF

导出

摘要提出了一种新的距离和对象异常因子的定义,在此基础上提出了一种两阶段异常检测方法TOD,第一阶段利用一种新的聚类算法对数据进行聚类,第二阶段利用对象的异常因子检测异常.TOD的时间复杂度与数据集大小成线性关系,与属性个数成近似线性关系,算法具有好的扩展性,适合于大规模数据集.理论分析和实验结果表明TOD具有稳健性和实用性. In this paper, a new distance definition and outlier factor of object are introduced. On the basis of these, a two-stage outlier detection approach, named [WTBXTOD[WTBZ, is presented, the first stage cluster data by a new clustering method, the second stage identify outliers by the outlier factor of objects. The time complexity of [WTBXTOD[WTBZ is linear with the size of dataset and nearly linear with the number of attributes, which results in good scalability and adapts to large dataset. The theoretic analysis and the experimental results show that the [WTBXTOD[WTBZ is robust and practicable.

作者蒋盛益李庆华赵延喜

机构地区华中科技大学计算机学院

出处《小型微型计算机系统》 CSCD 北大核心 2005年第7期1237-1240,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(60273075)资助

关键词聚类异常因子异常检测 clustering outlier factor outlier detection

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1Knorr E M, Ng R T.Algorithms for mining distance-based outliers in large datasets[C]. In:Proc. 24th Int. Conf. On Very Large Data Bases,New York, NY, 1998:392-403.
2Shenyi-Yi Jiang,Qing-Hua Li,Ken-Li Li,Hui Wang,Zhong-Luo Meng.GLOF:a new approach for mining local outlier[C]. Int. Conf. Mach. Learn. Cybern, 2003,11: 157-162.
3He Zeng-you, Xu Xiao-fei, Deng Sheng-chun. Discovering cluster-based local outliers[J]. Pattern Recognition Letters,2003,24(9-10):1651-1660.
4Leonid Portnoy, Eleazar Eskin and Salvatore J. Stolfo.Intrusion detection with unlabeled data using clustering[C].In:Proc of ACM CSS Workshop on Data Mining Applied to Security (DMSA-2001). Philadelphia, PA, 2001.
5Harkins S,He H,Willams G J, Baster R A. Outlier detection using replicator neural networks[C]. In:Proc. of the 4^th Int. Conf. on Data Warehousing and Knowledge Discovery, Aix-en-Provence France,2002:170-180.
6何增有,徐晓飞,邓胜春.Squeezer：An Efficient Algorithm for Clustering Categorical Data[J].Journal of Computer Science & Technology,2002,17(5):611-624. 被引量：31
7Guha S,Rastogi R,Shim K. ROCK:A robust clustering algorithm for categorical attributes[C].In:Proc. of the 15th ICDE,Sydney Australia, 1999,512-521.
8Merz C J, Merphy P. UCI repository of machine learning databases[EB/OL]. URL: http://www.ics.uci.edu/ mlearn/ MLRRepository.html,1996.
9Eskin E,Arnold A,Prerau M,Portnoy L, Stolfo S. A geometric framework for unsupervised anomaly detection: detecting intrusions in unlabeled data[C]. In:In BarbaraDand Jajodia S(editors), Applications of Data Mining in Computer Securuty, Kluwer,2002.

二级参考文献17

1Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. ROCK: A robust clustering algorithm for categorical attributes. In Proc. 1999 Int. Conf. Data Engineering, Sydney, Australia, Mar., 1999, pp.512-521.
2Alexandros Nanopoulos, Yannis Theodoridis, Yannis Manolopoulos. C2P: Clustering based on closest pairs. In Proc. 27th Int. Conf. Very Large Database, Rome, Italy, September, 2001, pp.331-340.
3Ester M, Kriegel H P, Sander J, Xu X. A density-based algorithm for discovering clusters in large spatial databases.In Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD'96), Portland, Oregon, USA, Aug., 1996,pp.226-231.
4Zhang T, Ramakrishnan R, Livny M. BIRTH: An efficient data clustering method for very large databases. In Proc.the ACM-SIGMOD Int. Conf. Management of Data, Montreal, Quebec, Canada, June, 1996, pp.103-114.
5Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. CURE: A clustering algorithm for large databases. In Proc. the ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington, USA, June, 1998, pp.73-84.
6Karypis G, Han E-H, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. IEEE Computer, 1999, 32(8): 68-75.
7Sheikholeslami G, chatterjee S, Zhang A. WaveCluster: A multi-resolution clustering approach for very large spatial databases. In Proc. 1998 Int. Conf. Very Large Databases, New York, August, 1998, pp.428-439.
8Agrawal R, Gehrke J, Gunopulos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining applications. In Proc. the 1998 ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington,USA, June, 1998, pp.94-105.
9Jiang M FI Tseng S S, Su C M. Two-phase clustering process for outliers detection. Pattern Recognition Letters,2001, 22(6/7): 691-700.
10Venkatesh Ganti, Johannes Gehrke, Raghu Ramakrishnan. CACTUS-clustering categorical data using summaries.In Proc. 1999 Int. Conf. Knowledge Discovery and Data Mining, August, 1999, pp.73-83.

共引文献30

1卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020,37(S01):9-15. 被引量：20
2蒋盛益,李庆华.一种基于引力的聚类方法[J].计算机应用,2005,25(2):286-288. 被引量：9
3蒋盛益,李庆华.聚类分析中的差异性度量方法研究[J].计算机工程与应用,2005,41(11):146-149. 被引量：4
4蒋盛益,李庆华,李新.数据流挖掘算法研究综述[J].计算机工程与设计,2005,26(5):1130-1132. 被引量：21
5蒋盛益,李庆华,王卉,孟中楼.一种基于聚类的有指导的入侵检测方法[J].小型微型计算机系统,2005,26(6):1042-1045. 被引量：6
6蒋盛益,李庆华.基于引力的入侵检测方法[J].系统仿真学报,2005,17(9):2202-2206. 被引量：6
7郝凯,朱敏.有源雷达组网目标定位中去除虚假目标的改进方法[J].四川大学学报（自然科学版）,2006,43(2):315-319. 被引量：4
8蒋盛益,阮幼林,李庆华.面向混合属性的高效聚类算法研究[J].计算机工程,2006,32(12):47-49.
9蒋盛益.基于投票机制的融合聚类算法[J].小型微型计算机系统,2007,28(2):306-309. 被引量：7
10李岩,王惠文,叶明.数据流分析与技术研究[J].计算机工程与应用,2008,44(15):8-11. 被引量：6

同被引文献51

1蒋盛益,李庆华.一种基于引力的聚类方法[J].计算机应用,2005,25(2):286-288. 被引量：9
2蒋盛益,李庆华,王卉,孟中楼.一种增强的局部异常挖掘方法[J].计算机研究与发展,2005,42(2):210-216. 被引量：8
3黄光球,彭绪友,靳峰.基于密度的异常挖掘方法研究与应用[J].微电子学与计算机,2005,22(3):262-265. 被引量：8
4蒋盛益.基于投票机制的融合聚类算法[J].小型微型计算机系统,2007,28(2):306-309. 被引量：7
5蒋盛益,姜灵敏.一种高效异常检测方法[J].计算机工程,2007,33(7):166-168. 被引量：7
6Patcha A, Park J M. An overview of anomaly detection techniques: Existing solutions and latest technological trends[J]. Comp Networks ,2007,51 (12) :3448.
7Jiang M F, Tseng S S, Su C M. Two-phase clustering process for outliers detection[ J]. Computational Statistics and Data Analysis,2001,36 (3) :351.
8Portnoy L, Eskin E, Stolfo S. Intrusion detection with unla- beled data using clustering[ C ]//Proc of the ACM Work- shop on Data Mining Applied to Security, Philadelphia: PA,2001:5 - 8.
9He Z, Xu X, Deng S. Discovering cluster-based local outli- ers [ J ]. Pattern Recognition Letters, 2003, 24 ( 9 - 10) :1651.
10Fred A L. Finding consistent clusters in data partitions [ C ]//Procs of the Second Int Workshop on Multiple Classifier Syst Lecture Notes in Comp Sci, London: Snrineer-Verlag.2001.309 - 318.

引证文献7

1蒋盛益,姜灵敏.一种高效异常检测方法[J].计算机工程,2007,33(7):166-168. 被引量：7
2苏晓珂,兰洋.一种高效混合属性离群检测算法[J].小型微型计算机系统,2010,31(11):2282-2286. 被引量：2
3苏晓珂,王秉政.基于聚类融合的异常检测算法[J].郑州轻工业学院学报（自然科学版）,2011,26(3):8-11. 被引量：1
4苏晓珂,郑远攀,万仁霞.基于共享最近邻的离群检测算法[J].计算机应用研究,2012,29(7):2426-2428. 被引量：2
5张钰莎,蒋盛益.Clementine软件功能缺陷分析[J].信阳师范学院学报（自然科学版）,2015,28(3):450-453. 被引量：2
6李云霞,姚建国,万定生,赵群.一种水文时间序列异常模式检测方法研究[J].计算机技术与发展,2019,29(7):159-163. 被引量：2
7万定生,王坤,朱跃龙,姚成,朱海南,朱青松.中小河流洪水预报智能调度平台关键技术[J].河海大学学报（自然科学版）,2021,49(3):204-212. 被引量：12

二级引证文献27

1李娜娜,赵政,刘伯颖,顾军华.一种基于自我聚类的异常检测学习方法[J].计算机应用,2008,28(6):1438-1440.
2刘尧华,刘卫国.Ad Hoc网络与有线网络互连中的入侵检测[J].计算机系统应用,2010,19(6):86-89. 被引量：1
3陈洪敏.3维模型2维投影图序列特征的异常检测[J].三明学院学报,2010,27(6):513-516.
4苏晓珂,王秉政.基于聚类融合的异常检测算法[J].郑州轻工业学院学报（自然科学版）,2011,26(3):8-11. 被引量：1
5苏晓珂,郑远攀,万仁霞.基于共享最近邻的离群检测算法[J].计算机应用研究,2012,29(7):2426-2428. 被引量：2
6琚春华,李耀林.基于属性关联及匹配差异度的数据流异常检测[J].西南交通大学学报,2013,48(1):107-115.
7王建国,范凯,张文兴.一种结合共享最近邻法和粒度支持向量机的混合模型[J].计算机应用与软件,2015,32(6):236-240.
8王玲玲,付桃芳,杜俊英,梁宜,方剑乔.基于SPSS Clementine的关联规则分析在中医药数据挖掘中的应用优势和局限[J].云南中医学院学报,2016,39(6):98-102. 被引量：40
9刁洪祥.基于多元线性回归分析的数据异常检测研究[J].信息与电脑（理论版）,2011(11):57-58. 被引量：1
10李士果,卢建云,邓剑勋.基于自然最近邻的离群检测方法研究[J].智能计算机与应用,2019,9(4):40-44. 被引量：1

1俞研,郭山清,黄皓.基于数据流的异常入侵检测[J].计算机科学,2007,34(5):66-71. 被引量：11
2蒋盛益,姜灵敏.一种高效异常检测方法[J].计算机工程,2007,33(7):166-168. 被引量：7
3蒋盛益,李庆华.无指导的入侵检测方法[J].计算机工程,2005,31(9):31-33. 被引量：4
4詹艳艳,徐荣聪.时间序列异常模式的k-均距异常因子检测[J].计算机工程与应用,2009,45(9):141-145. 被引量：12
5曲吉林.一种基于Voronoi图的高效异常检测方法[J].计算机工程与应用,2008,44(3):178-179. 被引量：1
6唐永红,刘绪栋.一种基于混合属性数据集的异常检测方法[J].科学技术与工程,2013,21(7):1832-1835. 被引量：1
7陆林花.遗传聚类算法在污水处理异常数据分析中的应用[J].计算机应用与软件,2011,28(6):199-201. 被引量：2
8曹文平,宁彬.基于异常因子的异常模式探测算法[J].计算机工程与设计,2009,30(16):3820-3822. 被引量：1
9张雨婷,叶东毅,柯逍,陈昭炯.适应目标尺度变化的改进压缩跟踪算法[J].模式识别与人工智能,2016,29(11):985-996.
10林硕蕾.基于小数据冲突检测的坏点数据挖掘模型仿真[J].科技通报,2015,31(1):213-216. 被引量：2

小型微型计算机系统

2005年第7期

浏览历史

内容加载中请稍等...

一种两阶段异常检测方法被引量：7

参考文献9

二级参考文献17

共引文献30

同被引文献51

引证文献7

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

一种两阶段异常检测方法 被引量：7

参考文献9

二级参考文献17

共引文献30

同被引文献51

引证文献7

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

一种两阶段异常检测方法被引量：7