一个带簇个数估计的推广K-means算法被引量：1

Extending K-means to Estimate the Number of Clusters

下载PDF

导出

摘要目前已有大量关于聚类方法的研究.然而,绝大部分现有方法都要求输入簇的个数,该数目在很多情形下都无法事先确定.提出了一个能估计簇的个数的推广的K-means算法.新算法无需对不同的输入参数重复运行,而是在划分过程中分裂某些簇直到满足一定的终止条件.划分过程应用了Ward的最小方差方法(Ward's minimum variance method),最佳的簇个数则由一个基于组间方差的指标决定.实验结果表明,新算法不仅能正确估计实际的簇个数,而且运行效率高.

作者郑国庆

机构地区华南农业大学理学院数学系

出处《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期94-99,共6页 Journal of Computer Research and Development

基金国家自然科学基金项目(10672143)

关键词基于划分的聚类方法 Ward最小方差方法簇内方差

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1[1]R Xu,D Wunsch Ⅱ.Survey of clustering algorithms.IEEE Trans on Neural Networks,2005,16(3):645-678
2[2]J Han,M Kamber.Data mining:Concepts and techniques.San Francisco:Morgan Kaufmann,2000
3[3]J MacQueen.Some methods for classification and analysis of multivariate observations.In:Proc of the 5th Berkeley Symp.Berkeley,Calif,University of California Press,1967.281-297
4[4]G Milligan,M Cooper.An examination of procedures for determining the number of clusters in a data set,Psychometrika,1985,50(2):159-179
5[5]A Hardy.On the number of clusters.Computational Statistics and Data Analysis,1996,23(1):83-96
6[6]H Akaike.A new look at the statistical model identification.IEEE Trans on Autom.Control,AC-19,1974,(6):716-722
7[7]M Windham,A Culter.Information ratios for validating mixture analysis,J Amer.Statist.Assoc.,1992,87(420):1188-1192
8[8]D Pelleg,A Moore.X-means:Extending K-means with efficient estimation of the number of clusters.In:Proc of the 17th Int'lConf on Machine Learning (ICML'00).San Francisco:Morgan Kaufmann,2000.727-734
9[9]J A F Costa,M L A Netto.Clustering of complex shaped data sets via Kohonen maps and mathematical morphology.In:Proc of SPIE.Orlando:SPIE Press,2001
10[10]T Ishioka.Extended K-means with an efficient estimation of the number of clusters.Intelligent Data Engineering and Automated Learning (IDEAL 2000),Hong Kong,China,2000

同被引文献4

1王树东,胡三高,刘玲,梁双印,徐鸿.600MW机组脱硫系统中循环浆液泵的运行优化与改造研究[J].中国电力,2010,43(11):46-49. 被引量：24
2朱连江,马炳先,赵学泉.基于轮廓系数的聚类有效性分析[J].计算机应用,2010,30(12):139-141. 被引量：117
3雷升锴,刘红阳,何嘉,何险峰,薛勤.动态K-均值聚类算法在RBF神经网络中心选取中的应用[J].信息系统工程,2011(6):83-85. 被引量：9
4沈健,董强强,申军锋.脱硫浆液循环泵运行成本分析及节能控制措施[J].化学工程与装备,2019(1):226-227. 被引量：8

引证文献1

1冯普锋,单涛,陈静,孙晋志,李方强.基于径向基神经网络的浆液循环泵优化研究[J].新型工业化,2021,11(9):107-109.

1谢明霞,郭建忠,陈科.改进k中值聚类及其应用[J].烟台大学学报（自然科学与工程版）,2010,23(3):217-222. 被引量：1
2朱青,张学梦.基于小波变换的卫星云图融合研究[J].中国新技术新产品,2010(4):5-5.
3郑志娴,王敏.基于大数据的K-means聚类算法在网络安全检测中的应用[J].湖北第二师范学院学报,2016,33(2):36-40. 被引量：6
4王欣艺.一种对类别属性进行聚类的算法[J].福建电脑,2013,29(3):129-131.
5黄取治,张军朝.复杂网络中基于采样的近似三角计数方法研究[J].计算机科学,2015,42(11):188-190.
6杨俊,廖闻剑,彭艳兵.一种中文文本聚类算法的研究[J].硅谷,2009,2(5):68-69.
7徐鸣,马龙华,顾江萍,黄跃进,沈希.一种改进的鲁棒多目标优化方法[J].控制与决策,2013,28(8):1178-1182. 被引量：5
8阿晓.VB编程技巧三则[J].电脑知识与技术（过刊）,2003(20):46-46.
9刘园园,边家文,刘永凯,付红伟,王莹.基于惩罚函数的谐波信号个数估计[J].工程地球物理学报,2009,6(2):235-239.
10刘伟峰,柴中,文成林.基于随机采样的多量测目标跟踪算法[J].自动化学报,2013,39(2):168-178. 被引量：7

计算机研究与发展

2007年第z2期

浏览历史

内容加载中请稍等...

一个带簇个数估计的推广K-means算法被引量：1

参考文献10

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

一个带簇个数估计的推广K-means算法 被引量：1

参考文献10

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

一个带簇个数估计的推广K-means算法被引量：1