期刊文献+

增量式聚类的新闻热点话题发现研究 被引量:1

Research on Hot News Topic Detection of Incremental Clustering
下载PDF
导出
摘要 为实现新闻热点话题的排行和发现,对新闻文本进行聚类,通过对报道频率的研究,利用热度公式计算得到新闻热点话题TOP排行榜。针对增量式聚类方法 Single-Pass算法相似度公式计算代价大和特征值选择不够准确的不足提出改进方案,利用抓取的新闻语料库数据对改进算法进行实验验证与分析,实验数据与Single-Pass算法聚类结果进行对比,得到了更理想的新闻热点聚类效果,表明了算法的可行有效性。 News text clustering is applied to achieve ranking and finding hot news topics. To obtain hot topic news ranking by the formula of heat, the reporting rate is studied. To overcome the shortcomings of huge cost of calculation and inaccuracy of selecting eigenvalues when Single-Pass is used to cluster, it's proposed enhanced methods to solve the problems. The improved algorithm is verified and analyzed through the experiment using fetched news corpus. The result of experiments is compared to the Single- Pass, and a more desirable hot news clustering effect is presented, the feasibility of modified algorithm is demonstrated.
作者 王丽颖 葛丽娜 张翼鹏 王红 WANG Li-ying GE Li-na ZHANG Yi-peng WANG Hong(College of Information Science and Engineering, Guangxi University for Nationalities, Nanning 530006, China China-ASEAN Study Center( Guangxi Science Experiment Center) of Guangxi University for Nationalities, Nanning 530006, China)
出处 《计算机与现代化》 2017年第3期46-50,共5页 Computer and Modernization
基金 国家自然科学基金资助项目(61462009) 广西高等学校优秀中青年骨干教师培养工程项目(GXQG012013014) 广西民族大学中国-东盟研究中心(广西科学实验中心)2014年度开放课题项目(TD201404)
关键词 新闻热点话题 文本聚类 Single-Pass算法 热度公式 hot news topic text clustering Single-Pass algorithm formula of heat
  • 相关文献

参考文献13

二级参考文献179

共引文献253

同被引文献13

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部