期刊文献+

一个带簇个数估计的推广K-means算法 被引量:1

Extending K-means to Estimate the Number of Clusters
下载PDF
导出
摘要 目前已有大量关于聚类方法的研究.然而,绝大部分现有方法都要求输入簇的个数,该数目在很多情形下都无法事先确定.提出了一个能估计簇的个数的推广的K-means算法.新算法无需对不同的输入参数重复运行,而是在划分过程中分裂某些簇直到满足一定的终止条件.划分过程应用了Ward的最小方差方法(Ward's minimum variance method),最佳的簇个数则由一个基于组间方差的指标决定.实验结果表明,新算法不仅能正确估计实际的簇个数,而且运行效率高.
作者 郑国庆
出处 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期94-99,共6页 Journal of Computer Research and Development
基金 国家自然科学基金项目(10672143)
  • 相关文献

参考文献10

  • 1[1]R Xu,D Wunsch Ⅱ.Survey of clustering algorithms.IEEE Trans on Neural Networks,2005,16(3):645-678
  • 2[2]J Han,M Kamber.Data mining:Concepts and techniques.San Francisco:Morgan Kaufmann,2000
  • 3[3]J MacQueen.Some methods for classification and analysis of multivariate observations.In:Proc of the 5th Berkeley Symp.Berkeley,Calif,University of California Press,1967.281-297
  • 4[4]G Milligan,M Cooper.An examination of procedures for determining the number of clusters in a data set,Psychometrika,1985,50(2):159-179
  • 5[5]A Hardy.On the number of clusters.Computational Statistics and Data Analysis,1996,23(1):83-96
  • 6[6]H Akaike.A new look at the statistical model identification.IEEE Trans on Autom.Control,AC-19,1974,(6):716-722
  • 7[7]M Windham,A Culter.Information ratios for validating mixture analysis,J Amer.Statist.Assoc.,1992,87(420):1188-1192
  • 8[8]D Pelleg,A Moore.X-means:Extending K-means with efficient estimation of the number of clusters.In:Proc of the 17th Int'lConf on Machine Learning (ICML'00).San Francisco:Morgan Kaufmann,2000.727-734
  • 9[9]J A F Costa,M L A Netto.Clustering of complex shaped data sets via Kohonen maps and mathematical morphology.In:Proc of SPIE.Orlando:SPIE Press,2001
  • 10[10]T Ishioka.Extended K-means with an efficient estimation of the number of clusters.Intelligent Data Engineering and Automated Learning (IDEAL 2000),Hong Kong,China,2000

同被引文献4

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部