期刊文献+

孤立点挖掘在高等学校科技统计数据分析中的应用 被引量:1

Application of outlier mining in science and technology statistics data analysis
下载PDF
导出
摘要 孤立点挖掘是一项有价值的、重要的知识发现,研究孤立点的异常行为能发现隐藏在数据中有价值的信息。本文在介绍孤立点及其挖掘算法的基础上,讨论了基于距离和的孤立点挖掘算法,并将该算法创新地应用于高等学校科技统计数据分析中。结果表明,该算法可以有效地挖掘出高等学校科技统计数据中的异常现象,对数据的真实性的核对起到非常重要的作用。 Outlier mining is a meaningful and important knowledge discovery task,valuable information hidden in data is found by researching the abnormal behaviors of the outliers.In the paper,the knowledge of outlier and the algorithms for detecting outliers are introduced;an algorithm based on distance sum is discussed to solve science and technology statistics data analysis of colleges and universities.The results of example indicate that the algorithm can effectively dig out the abnormal phenomenon and it is very important for the check of data.
出处 《自动化与仪器仪表》 2012年第1期81-82,85,共3页 Automation & Instrumentation
基金 教育部科技统计研究课题(kjtj-2010-09) 甘肃省建设科技计划项目(JK2011-25)
关键词 孤立点 数据挖掘 科技统计 数据分析 outlier data mining science and technology statistics data analysis
  • 相关文献

参考文献7

二级参考文献29

  • 1Zheng Binxiang,Du Xiuhua & Xi Yugeng Institute of Automation, Shanghai Jiaotong University,Shanghai 200030,P.R.China.Outliers Mining in Time Series Data Sets[J].Journal of Systems Engineering and Electronics,2002,13(1):93-97. 被引量:3
  • 2范大昭,雷蓉,张永生.从地理数据库中探测奇异值[J].测绘科学,2004,29(5):12-15. 被引量:2
  • 3陆声链,林士敏.基于距离的孤立点检测及其应用[J].计算机与数字工程,2004,32(5):94-97. 被引量:23
  • 4崔贯勋,朱庆生.一种改进的基于密度的离群数据挖掘算法[J].计算机应用,2007,27(3):559-560. 被引量:8
  • 5薛安荣,鞠时光,何伟华,陈伟鹤.局部离群点挖掘算法研究[J].计算机学报,2007,30(8):1455-1463. 被引量:96
  • 6D. Hawkins. Identification of Outliers[M]. Champman and Hall, London, 1980.
  • 7M Breunig, Hans-Peter Kriegel, R Ng, et al. LOF: Identifying density-based local outliers. The ACM SIG- MOD 2000 Int'l Conf on Management of Data, Dalles, TX, 2000.
  • 8M. Ankerst, M.M. Breuning, Hans-Peter Kriegel, J. sander. OPTICS.. Ordering Points To Identify the Clustering Structure[C]//ACM SIGMoD Int. Conf. on Management of Data, Philadelphia PA, 1999.
  • 9Bay S D,Schwabacher M. Mining Distance-Based Outliets in Near Linear Time with Randomization and a Simple Pruning Rule. Washington D C: SIGKDD' 03, USA, 2003.
  • 10Aggarwal C C, Yu P S. Outlier detection for high dimensional data. In:Proceedings of the ACM SIGMOD International Conference on Management of data, 2001

共引文献53

同被引文献11

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部