期刊文献+

基于K-means的文本聚类算法 被引量:9

Text Clustering Algorithm Based on K-Means
下载PDF
导出
摘要 针对K-means算法容易收敛到局部最优以及对初值的依赖性,基于多次采样一次预聚类搜索初始聚类中心的思想,提出了一种改进的K-means文本聚类方法。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。
作者 毛嘉莉
出处 《计算机系统应用》 2009年第10期85-87,共3页 Computer Systems & Applications
基金 四川省教育厅重点科研项目(07ZA121)
  • 相关文献

参考文献8

二级参考文献23

  • 1(加)HanJ KamberM 范明 盂小峰 等译.数据挖掘概念与技术m[M].北京:机械工业出版社,2001.223-262.
  • 2..http://lib, slat. Cmu. Edu/datasets/places. Data,.
  • 3Forgy E. Cluster analysis of multivariate data: Efficiency vs. interpretabillty of classifications[ M]. Biometrics, 1965, 21(3) : 768.
  • 4MacQueen J. Some methods for classlfication and analysis of multivariate observations[ A]. Proceedinss of the Fifth Berkeley Symposium on Mathematical Statistics and Probability[ C]. Volume 1. Le-Cam LM, Neyman N, Ed. University of California Press, 1967.
  • 5Duda RO, Hart PE. Pattern Classification and Scene Analysis[ M].New York: John Wiley and Sons, 1973.
  • 6Selim SZ, Alsultan K. A Simulated Annealing Algorithm for the Clustering Problem[J]. Pattern Recognition, 1991, 24(10): 1003- 1008.
  • 7Fayyad U, Reina C, Bradley PS. Initialization of Iterative Refinement Clustering Algorithms[ R]. Microsoft Research Technical Report MSR-TR-98-38, June 1998.
  • 8Selim SZ, Ismail MA. K-Means-Type Algorithms: A Generalized Convergence Theorem and Charadterization of Local Optimality[ M].IEEE Trans Pattern Analysis and Machine Intelligence, 1984, PA-MI-6(1).
  • 9Kaufman L, Rouseeuw P. Finding Groups in Data: An Introduction to Cluster Analysis[ M]. New York : John Wiley and Sons, 1990.
  • 10Alsabti K, Ranks S, Singh V. An Efficient K-Means Clustering Algorithm[ A]. Proc. First Workshop on High-Performance Data Mining[C], 1997.

共引文献117

同被引文献72

  • 1李胜东,吕学强,魏震,施水才.基于两层阈值的话题/报道表示模型[J].华中科技大学学报(自然科学版),2013,41(S2):117-120. 被引量:1
  • 2刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量:122
  • 3骆卫华,于满泉,许洪波,王斌,程学旗.基于多策略优化的分治多层聚类算法的话题发现研究[J].中文信息学报,2006,20(1):29-36. 被引量:38
  • 4ICTCLAS汉语分词系统.[2008-09-12].http://ictclas.org/index.html.
  • 5Dunn J C. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Cybemet, 1974, 3 (3) : 32 - 57.
  • 6Bezdek J C. Cluster validity with fuzzy sets. Journal of Cybernetics, 1974,3(3) :58 -72.
  • 7北京大学计算语言学研究所.[2009-07-16].http://www.icl.pku.edu.cn/default_cn.asp.
  • 8Frakes W B,Baeza-Yates R. Information retrieval:Data structures and algorithms. New Jersey: Prentice-Hall, Inc., 1992.
  • 9Yang Y M, Liu X. A re -examination of text categorization methods//Hearst M, Gey F, Tong R. Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval. New York : Assoc Computing Machinery, 1999 : 42 - 49.
  • 10Salton G. Buckley C. Term--weighting approaches in automatic retrieval[J]. Information Processing & Management, 1988,24(5) : 513-523.

引证文献9

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部