期刊文献+

基于改进K-means算法的BBS热点话题发现 被引量:2

Hot Topic Detecting in BBS with Developed K-Means
下载PDF
导出
摘要 详细介绍了经典划分式聚类算法K-means的特点,针对该算法中"聚类中心难以确定"的不足提出"选择最优聚类质心"的改进方案,改进后的算法得到了可靠的聚类质心.最后,基于"中华网BBS"文本数据对改进后的算法进行验证、分析,并与经典K-means算法聚类结果进行对比,得到了更为理想的实验结果,表明算法可行有效. Introducing the feature of classic clustering algorithm K-means of that "cluster centers is difficult to determine".I improved the program for the algorithm of "selecting the optimal clustering centroid",the improved algorithm has been a reliable the cluster centroid.Finally I got a data results to prove the improved algorithm is reliable.
作者 马国栋 李慧
出处 《首都师范大学学报(自然科学版)》 2015年第4期12-15,共4页 Journal of Capital Normal University:Natural Science Edition
关键词 K-MEANS 文本聚类 热点话题发现 K-means text clustering hot topic detection
  • 相关文献

参考文献5

  • 1胡静,蒋外文,朱华.Web文本挖掘中数据预处理技术研究[J].现代计算机,2009,15(3):48-51. 被引量:13
  • 2Yang Y, Pierce T, J Carbonell J. A Study on Retrospective and Online Event Detection[ C]. The 21st Ann Int ACM SIGIR Conference.
  • 3话题发现homepage.http://www.itl.nist.gov/iad/894.01/tests/话题发现/index.htm.
  • 4王旭东.基于Web的信息抽取技术研究[D].西南交通大学硕士学位论文,2007.
  • 5邱立坤,程威,龙志伟,等.面向BBS的话题挖掘初探.全国第八届计算语言学联合学术会议[c],南京,2005401-407.

二级参考文献8

共引文献12

同被引文献17

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部