期刊文献+

基于MST聚类的离群检测算法研究

下载PDF
导出
摘要 基于密度的最小生成树聚类算法,将最小生成树理论与基于密度的方法相结合,不仅体现了基于密度聚类方法的优点,而且聚类结果不依赖于用户参数的选择,聚类结果更合理,特别是对大数据集,算法非常有效。因此,本文在基于密度的MST聚类的基础上,通过减少数据集扫描次数以提高离群检测的效率。理论分析表明,检测算法可以有效地处理分布不均的数据集,适用于大规模数据集的挖掘。
出处 《福建电脑》 2007年第9期1-2,共2页 Journal of Fujian Computer
基金 国家自然科学基金项目"面向地学应用的时空多尺度数据挖掘研究"(60602052)
  • 相关文献

参考文献5

二级参考文献35

  • 1Zheng Binxiang,Du Xiuhua & Xi Yugeng Institute of Automation, Shanghai Jiaotong University,Shanghai 200030,P.R.China.Outliers Mining in Time Series Data Sets[J].Journal of Systems Engineering and Electronics,2002,13(1):93-97. 被引量:3
  • 2范大昭,雷蓉,张永生.从地理数据库中探测奇异值[J].测绘科学,2004,29(5):12-15. 被引量:2
  • 3陆声链,林士敏.基于距离的孤立点检测及其应用[J].计算机与数字工程,2004,32(5):94-97. 被引量:23
  • 4Jain AK,Murty MN,Flynn PJ.Data clustefing:a review[J],ACM Computing Surveys, 1999 ; 31 (3) : 264-323.
  • 5Ester M,Kriegel HP,Sander Jet al.A density-based algorithm for discovering clusters in large spatial databases with noise[C].In:Proceedings of the 2^nd Int Conf on Knowledge Discovery and Data Mining.Portland, Dregon,1996:226-231.
  • 6Han J,Kamber M.Data Mining:Concepts and Techniques[M],Simon Fraser University,2000.
  • 7Zahn CT.Graph theoretical methods for detecting and describing gestalt clusters[J].IEEE Transactions on Computers, 1971 ;20( 1 ).
  • 8Johnson DB ,Metaxas P.A parallel algorithm for computing minimum spanning trees[C].In:Proceedings of the 4th annual ACM symposium on Parallel algorithms and architectures, San Diego, California, United States, 1992 : 363-372.
  • 9Algorithms for clustering data[M],New Jersey:Prentice-Hall Inc, 1996.
  • 10Karypis G,Han EH,Kumar V,CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling[J],IEEE Computer, 1999;32 (8) :68-75.

共引文献59

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部