基于关联分析的高维空间异常点发现被引量：2

Discovery of High Dimensional Outliers Based on Association Analysis

下载PDF

导出

摘要异常点发现是从大量数据对象中挖掘少量具有异常行为模式的数据对象,很多情况下,这些数据对象较之正常行为模式包含了更多用户感兴趣的信息.该文针对某些具体应用领域中的数据对象具有高维性的特点,利用关联分析知识,提出一种高维空间异常点发现算法,理论分析和实验表明,算法是有效可行的. Discovery of outliers is to extract a few data objects with abnormal behavior patterns, which are more interesting than common patterns in some cases, from a large amount of data. It is of practical significance in intrusion detection systems, credit fraud detection, etc. Data in these domains are usually high dimensional, particularly featured by their sparseness and decline properties. An algorithm that can obtain the outliers with high efficiency is proposed based on association analysis. Effectiveness of the algorithm is shown by theory analysis and experiment results.

作者陆介平倪巍伟孙志挥

机构地区东南大学计算机科学与工程系

出处《应用科学学报》 CAS CSCD 北大核心 2006年第1期60-63,共4页 Journal of Applied Sciences

基金国家自然科学基金(70371015) 教育部高等学校博士学科点专项科研基金(20040286009) 江苏省自然科学基金(BK2004058) 国家科技部中小型企业创新基金(02C26213210070)资助项目

关键词异常点关联规则闭频繁项集 k关系邻域 outlier association analysis closed frequent item-sets k-relational neighboring area

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Johnson T, Kwok I, Ng R. Fast computation of 2-dimensional depth contours. Gregory Piatetsky- Shapiro, eds. Proc. 4 th Int. Conf. on Knowledge Discovery and Data Mining[ C ]. New York, ACM Press. 1998. 224- 228.
2Knorr E, Ng R. Algorithms for mining distance-based outliers in large datasets. Ashish Gupta , eds. Proceedings of the 24 th Conference on VLDB[C]. New York, NY. 1998. 392-403.
3Ramaswamy S, Rastogi R, Shim K. Efficient algorithms for mining outliers from large data sets [J]. ACM Sigmoid Record,2000,29(2) :427 - 438.
4Han J W, Kambr M. Data Mining Concepts and Techniques[ M]. Beijing Higher Education Press,2001.
5Agrawal R, Srikant R. Fast algorithms for mining association rules in large databases. Proceeding of the 20th International Conference on Very Large Database (VLDB) [ C ]. Santigo, Chile,1994,.
6Agrawal R, Limielinski T, Swami A, Mining association rules between sets of items in large databases. Proceeding of ACM SIGMOD International Conference on Management of Data [ C ].Washington DC, 1993. 207 - 216.

同被引文献63

1王宏鼎,童云海,谭少华,唐世渭,杨冬青.异常点挖掘研究进展[J].智能系统学报,2006,1(1):67-73. 被引量：22
2杨宜东,孙志挥,朱玉全,杨明,张柏礼.基于动态网格的数据流离群点快速检测算法[J].软件学报,2006,17(8):1796-1803. 被引量：22
3周晓云,孙志挥,张柏礼,杨宜东.高维类别属性数据流离群点快速检测算法[J].软件学报,2007,18(4):933-942. 被引量：21
4KNORR E M, NG R T. Algorithms for mining distance-based outliers in large datasets[ C]//Proc of VLDB' 98. San Francisco, CA: Morgan Kaufmann Publishers, 1998:392-403.
5HAWKINS D. Identification of outliers [ M ]. London : Chapman & Hall, 1980.
6TAN Pang-ning, STEINBACH M, KUMAR V. Introduction to data mining[ M]. Boston: Pearson Addison-Wesley Education Inc, 2006.
7KNORR E, NG R. Finding intentional knowledge of distance-based outliers[C]//Proc of VLDB'99. Edinburgh: [s. n. ], 1999:211-222.
8KNORR E M, NG R T, TUCAKOV V. Distance-based outliers: algorithms and applications[ J ]. The VLDB Journal, 2000,8 (3-4) : 237-253.
9AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases [ C ]//Proc of SIGMOD' 93. New York: ACM Press, 1993:207-216.
10BREIMAN L, FRIEDMAN J H, OLSHEN R A, et al. Classification and regression trees[M]. New York: Chapman & Hall, 1984.

引证文献2

1徐翔,刘建伟,罗雄麟.离群点挖掘研究[J].计算机应用研究,2009,26(1):34-40. 被引量：27
2吴应清.异常数据挖掘在实际中的应用[J].办公自动化（综合月刊）,2011(5):42-43. 被引量：2

二级引证文献29

1冯泽磊,吴美凤.动态浮箱数据清洗方法在电力系统中的应用[J].发电技术,2019,40(S1):109-113. 被引量：5
2秦艳华.数据挖掘技术中孤立点的分析研究[J].硅谷,2010,3(4):49-50. 被引量：2
3刘欢,吴介军,苏锦旗.基于分化距离的离群点检测算法[J].计算机应用研究,2010,27(9):3316-3318. 被引量：7
4王柯柯,崔贯勋,倪伟,苟光磊.基于单元的快速的大数据集离群数据挖掘算法[J].重庆邮电大学学报（自然科学版）,2010,22(5):673-677. 被引量：7
5陈海宇,曾德胜.基于日志的异常软件使用模式检测[J].淮海工学院学报（自然科学版）,2011,20(1):24-28.
6王瑞伟,李志华.离群数据规则挖掘的决策树构造方法[J].计算机工程与设计,2011,32(5):1781-1784.
7陈海宇,曾德胜.使用日志的异常检测[J].计算机系统应用,2011,20(9):90-94. 被引量：1
8侯天子,朱焱.I-Miner环境下三种离群点挖掘算法的设计与实现[J].软件,2011,32(11):25-28.
9李文忠,左万利,赫枫龄.一种基于信息熵的多维流数据噪声检测算法[J].计算机科学,2012,39(2):191-194. 被引量：5
10李爱春,滕少华.Web挖掘在网络广告点击欺诈检测中的应用[J].计算机工程与设计,2012,33(3):957-962. 被引量：5

1姜志军,黄仙姣.对Java 2 Enterprise Edition主要设计模式的探讨[J].电脑知识与技术,2006,1(2):113-114.
2蔡仲博.云计算中的云采用模式[J].电脑开发与应用,2014,27(9):61-63. 被引量：1
3薛岗,姚绍文,Joan Lu.基于Pi-演算的工作流模式描述[J].计算机科学,2008,35(7):191-194. 被引量：2
4楚旺,钱德沛.支持软件重用的面向模式的软件开发方法[J].南京大学学报（自然科学版）,2005,41(z1):743-748. 被引量：1
5程世鹏,杨钦,李吉刚.一个面向模式的软件系统设计实例研究[J].计算机工程与科学,2006,28(z2):48-51.
6孙达明,张斌,张书波,马安香.基于用户行为的数据关联关系获取方法[J].东北大学学报（自然科学版）,2013,34(12):1707-1711. 被引量：3
7八通道数字输出开关[J].今日电子,2015,0(7):65-66.
8吴方君,易彤.一组实用的Z规格说明度量准则[J].应用科学学报,2005,23(1):6-11.
9邵凯,乔平安,高丽.构建网络化虚拟仪器关键技术研究[J].西安文理学院学报（自然科学版）,2014,17(4):62-66.
10漆东风.计算机应用基础课程建设研究与实践[J].教育界（高等教育）,2013(1):189-189.

应用科学学报

2006年第1期

浏览历史

内容加载中请稍等...

基于关联分析的高维空间异常点发现被引量：2

参考文献6

同被引文献63

引证文献2

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于关联分析的高维空间异常点发现 被引量：2

参考文献6

同被引文献63

引证文献2

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于关联分析的高维空间异常点发现被引量：2