期刊文献+

基于数据分段的K-means的优化研究 被引量:2

Optimizing Research on K-means Based on Data Partition
下载PDF
导出
摘要 K-means聚类算法是一种主流的迭代下降聚类算法,收敛于局部最优化状态。由于K-means随机选取k个初始聚类中心,使得聚类结果的有效性随初始输入而波动,为此文中采取一种预处理的方式来选取初始聚类中心。首先在某种范数的意义下,确定相隔最远的两个数据点之间的距离,然后采用数据分段的方法,将数据集分成k段,在每段中选取一个中心,以此来减小聚类结果随初始输入的波动。实验显示优化后的K-means有效地消除了初始输入的影响,并显著地减少了算法迭代次数和聚类误差。 The K-means clustering algorithm is one kind of mainstream iterative drop clustering algorithm,which restrains in the partial optimized state.Because K-means randomly selects initial clustering center,which result in the result of clustering is obviously fluctuate along with the initial input.Thus this paper adopts the pretreatment way to select the initial clustering center.First under one kind of norm,calculate out the farthest distance,then use the method of data partition to divide the data set into k section and select a center in each section.The experiment demonstrates the optimizing K-means eliminate the initial input influence,effectively reduced the iteration number of times and clustering error.
出处 《计算机技术与发展》 2010年第11期130-132,136,共4页 Computer Technology and Development
基金 青岛市科技计划项目(08-1-3-2-jcb)
关键词 聚类 K-MEANS PK-means 聚类中心 clustering K-means PK-means clustering center
  • 相关文献

参考文献11

二级参考文献55

  • 1钱锋,徐麟文.知识发现中的聚类分析及其应用[J].杭州师范大学学报(自然科学版),2001,5(1):34-37. 被引量:16
  • 2何彬彬,方涛,郭达志.基于不确定性的空间聚类[J].计算机科学,2004,31(11):196-198. 被引量:8
  • 3陈永强.[D].哈尔滨:哈尔滨工业大学,2003.
  • 4马庆国.管理统计[M].科学出版社,2002,8..
  • 5T Kohonen. Solf Organizing Maps, 3rd ed. Berlin: Springer,2001
  • 6Jianwei Han, M Kamber. Data Mining: Concepts and Techniques. San Francisco, CA: Morgan Kaufmann Publishers, 2001
  • 7H Chen, C Schuffels, R Orwig. Internet categorization and search: A self organizing approach. Journal of Visual Communication and Image Representation, 1996, 7 ( 1 ): 88 ~102
  • 8P Willet. Recent trends in hierarchical document clustering: A critical review. Information Processing and Management,1988, 24(5): 577~587
  • 9O Zamir, O Etzioni. Web document clustering: A feasibility demonstration. The 21st Annual Int'l ACM SIGIR Conf on Research and Development in Information Retrieval,Melbourne, Australia, 1998
  • 10M Dorigo, E Bonabeau, G Theraulaz. Ant algorithms and Stigmergy. Future Generation Computer Systems, 2000, 16 (8): 851~871

共引文献386

同被引文献18

引证文献2

二级引证文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部