期刊文献+

四维文档向量模型的k-means新闻文本聚类算法

k-means News Texts Clustering Algorithm Based on 4-Dimensional Document Vector Model
下载PDF
导出
摘要 传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果。本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道。最后,用k-means聚类算法进行新闻报道的的无监督聚类。实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法。 The news report expressed by Traditional 3DVM(3-Dimension Document Vector Model) is low accuracy and affect the clustering results of news reports due to the time factor of news reports excluded from it.In the present paper,a 4-dimensional document vector model(4DVM) was proposed to express news texts by including the time factor in the 3-dimensional document vector model.Finally,the k-means news texts clustering algorithm was used for the unsupervised clustering.The experimental results showed that the clustering algorithm of combining 4DVM with k-means is superior to 3DVM,and the clustering algorithm of combining VSM(vector space mode) with k-means.
机构地区 西藏大学工学院
出处 《西藏大学学报(社会科学版)》 CSSCI 2013年第4期109-112,共4页 Journal of Tibet University
基金 2011年度西藏自治区大学生创新性实验训练计划项目"基于向量空间模型的藏文文本倾向性分析系统的设计与实现"阶段性成果 项目号:2011CX051
关键词 4DVM 新闻文本 K-MEANS聚类 4DVM News texts k-means clustering algorithm
  • 相关文献

参考文献10

二级参考文献108

共引文献472

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部