摘要
目前已有大量关于聚类方法的研究.然而,绝大部分现有方法都要求输入簇的个数,该数目在很多情形下都无法事先确定.提出了一个能估计簇的个数的推广的K-means算法.新算法无需对不同的输入参数重复运行,而是在划分过程中分裂某些簇直到满足一定的终止条件.划分过程应用了Ward的最小方差方法(Ward's minimum variance method),最佳的簇个数则由一个基于组间方差的指标决定.实验结果表明,新算法不仅能正确估计实际的簇个数,而且运行效率高.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期94-99,共6页
Journal of Computer Research and Development
基金
国家自然科学基金项目(10672143)