期刊文献+

初始化簇类中心和重构标度函数的文本聚类 被引量:2

Text clustering method based on centers of initial cluster and anew rescaling function
下载PDF
导出
摘要 根据文本集的中心和初始簇的中心,选择一组具有良好区分度的方向构建IMIC坐标系,在该坐标系下构造出各坐标轴的重新标度函数用于提高聚类决策的有效性。算法IMIC经过多次迭代,收敛到最终解。IMIC算法的时间复杂度与K-means保持在同一量级上。实验结果表明,IMIC算法有较好的聚类质量。 According to the text set center and initial cluster center,in the text clustering process,this paper chose a set of discriminative directions to construct the IMIC coordinate,and constructed each axis to re-scaling function in order to improve the effectiveness of cluster policy,according to the distribution characteristics of the initial clusters.IMIC iterative algorithm ways converged to the final solution.The time complexity of IMIC remained the same as K-means by using a K-means-like ite-ration strategy.Experimental results show that IMIC algorithm has better clustering quality.
出处 《计算机应用研究》 CSCD 北大核心 2011年第11期4115-4117,共3页 Application Research of Computers
基金 淮安科技计划资助项目(HAG09061) 淮阴工学院重点基金资助项目(HGA0907)
关键词 迭代收敛 文本 聚类 iteration convergence text clustering
  • 相关文献

参考文献7

  • 1施培蓓,郭玉堂,胡玉娟,俞骏.初始化独立的谱聚类算法[J].计算机工程与应用,2010,46(25):134-137. 被引量:8
  • 2TAN S B ,CHENG X Q,GHANEM M M,et al. A novel refinement approach for text categorization [ C ]//Proc of the 14th ACM CIKM. [ S. l. ] :ACM Press,2005:469-476.
  • 3SHAWE-TAYLOR J, CRISTIANINI N. Kernel methods for pattern analysis [ M ]. Cambridge : Cambridge University Press,2004.
  • 4边肇祺,张学工.模式识别[M].2版.北京:清华大学出版社,2003.
  • 5刘金岭.基于语义的高质量中文短信文本聚类算法[J].计算机工程,2009,35(10):201-202. 被引量:30
  • 6DUDA R O,HART P E ,STORK D G. Pattern classification[ M]. 2nd ed. New York:Wiley-Interscience Publishers,2000.
  • 7黄良友.垃圾短信治理对策研究[J].重庆邮电大学学报(社会科学版),2010,22(3):25-30. 被引量:9

二级参考文献38

  • 1肖扬.海外手机实名制实施情况以及对中国的启示[J].当代通信,2006,13(9):75-76. 被引量:3
  • 2Liu Qun, Li Sujian. Word Similarity Computing Based on How-net Computational[J]. Linguistics and Chinese Language Processing, 2002, 7(2): 59-76.
  • 3梁奇烽.垃圾短信治理面临三大难题[EB/OL].(2008-04-25)[2009-09-12].http://www.12321.cn/viewnews.php?id=9523.
  • 4日韩如何治理手机短信[N].人民日报(海外版),2005-09-09(8).
  • 5《2007年手机短信息状况调查报告》,http://www.anti-spam.cn/pdf/2007-pnone-dc.pdf.
  • 6《中华人民共和国电信条例》第57条.
  • 7《中国互联网协会反垃圾信息自律公约》第3条.
  • 8《中国互联网协会短信息服务规范》第5条.
  • 9《湖北省短信息服务管理办法(暂行)》.
  • 10《福建省短信息管理暂行规定》.

共引文献43

同被引文献11

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部