期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于LDA模型的文本聚类检索 被引量:7
1
作者 李霄野 李春生 +1 位作者 李龙 张可佳 《计算机与现代化》 2018年第6期7-11,共5页
传统的判断2个文档相似性的方法没有考虑到文本背后的语义关联,导致检索系统返回的结果与用户的查询需求之间存在很大的差异。本文提出一种基于LDA主题模型的文本聚类方法,首先介绍LDA主题模型的应用原理,阐述文本挖掘的基本方法,之后构... 传统的判断2个文档相似性的方法没有考虑到文本背后的语义关联,导致检索系统返回的结果与用户的查询需求之间存在很大的差异。本文提出一种基于LDA主题模型的文本聚类方法,首先介绍LDA主题模型的应用原理,阐述文本挖掘的基本方法,之后构建LDA主题模型,采用Gibbs抽样的方法进行推导,得到特征词的概率分布,最后用优化聚类中心选择的K-means++方法对测试数据集合聚类,并把设计的LDA-Gibbs模型与传统的TF-IDF模型进行聚类评价对比。实验结果表明,该模型能够提高数据的检索效果,具有良好的推广价值。 展开更多
关键词 主题模型 文本聚类 潜在狄利克雷分配模型 聚类评价 信息检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部