期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向中文新闻话题检测的多向量文本聚类方法 被引量:6
1
作者 李欣雨 袁方 +1 位作者 刘宇 李琮 《郑州大学学报(理学版)》 CAS 北大核心 2016年第2期47-52,共6页
基于多向量模型,给出一种将话题主题信息与话题文本信息相结合的多向量话题表示方式,使用较低的维度来准确表示一个话题.针对传统TFIDF方法在文本分类问题中对特征项在各个类中分布情况考虑不充分的问题,给出了一种TFIDF改进方法.在TDT... 基于多向量模型,给出一种将话题主题信息与话题文本信息相结合的多向量话题表示方式,使用较低的维度来准确表示一个话题.针对传统TFIDF方法在文本分类问题中对特征项在各个类中分布情况考虑不充分的问题,给出了一种TFIDF改进方法.在TDT4的中文语料上,与传统向量空间模型进行了对比实验.实验结果表明,给出的话题表示方法和TFIDF改进算法能够在较低的维度上,使聚类的准确率得到较大提升. 展开更多
关键词 话题检测 多向量模型 tdt4 改进TFIDF算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部