期刊文献+

简单有效的确定聚类数目算法 被引量:23

Easy and efficient algorithm to determine number of clusters
下载PDF
导出
摘要 很多聚类算法要求用户在聚类之前给出聚类数目,这给用户带来了很大的困难。利用二分思想递归分裂簇内相似度大于给定阈值的簇,最后合并簇间相似度小于给定阈值的簇,来获得最终聚类数目。实验表明提出的算法确定的聚类数目和实际聚类数目相同,并且簇内数据的相似性高,簇间数据的相似性低,该算法简单高效。 Many clustering algorithm request users to identify the number of clusters before cluster data.This is very difficult for users.In this paper,clusters which are bigger than intra similarity threshold value are split repeatedly.At last,the clusters which are smaller than inter similarity threshold value are merged to have the final number of clusters.Experiments show that the number of clusters identified by the algorithm is equal to the natural number of clusters,and the intra similarity is high,the inter similarity is low,so the algorithm is easy and efficient.
出处 《计算机工程与应用》 CSCD 北大核心 2009年第15期166-168,共3页 Computer Engineering and Applications
基金 国家自然科学基金No.60773100 教育部科学技术研究重点项目No.205014~~
关键词 簇内相似度 簇间相似度 分裂 合并 聚类数目 intra similarity inter similarity split merge the number of clusters
  • 相关文献

参考文献7

二级参考文献27

  • 1彭佳红,沈岳,张林峰.数据挖掘中的特征选择及其算法研究[J].计算机工程与设计,2005,26(5):1176-1178. 被引量:14
  • 2邹志文,朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计,2005,26(9):2304-2307. 被引量:52
  • 3Treshansky A,McGraw R.An overview of clustering algorithms[A].Proceedings of SPIE,The International Society for Optical Engineering[C].2001(4367):41-51.
  • 4Clausi D A.K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture segmentation[J].Pattern Recognition,2002,35:1959-1972.
  • 5Bezdek J C,Pal N R.Some new indexes of cluster validity[J].IEEE Transactions on Systems,Man,and Cybernetics _ Part B:Cybernetics,1998,28(3):301-315.
  • 6Ramze R M,Lelieveldt B P F,Reiber J H C.A new cluster validity indexes for the fuzzy c-mean[J].Pattern Recognition Letters,1998,19:237-246.
  • 7王珊.数据仓库技术与联机分析处理[M].北京:科学出版社,1999.47-65.
  • 8HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 9Halkidi M,Batistakis Y,Vazirgiannis M.On clustering validation techniques[J].Journal of Intelligent Information Systems,2001,17(2-3):107-145.
  • 10Halkidi M,Vazirgiannis M.Clustering validity assessment:Finding the optimal partitioning of a data set[C].California,USA:Proceedings of ICDM,2001.

共引文献229

同被引文献265

引证文献23

二级引证文献419

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部