期刊文献+

一种DF—LDA的文本相似度计算方法

下载PDF
导出
摘要 首先用DF方法对文本进行特征选择,然后使用LDA建模的方法获取文本主题分布;用降维后的文本主题分布计算文本相似度。这种DF和LDA结合的文本相似度计算方法,在考虑到词频信息特征的同时,也考虑了语义信息特征。两次降维不仅降低了算法时间复杂度,而且在文本相似度计算过程中消除了低价值词项的干扰,提高了计算的精度。实验结果表明,DF-LDA算法在Tancrop数据集上F值较LDA方法有了7%的提高。
出处 《汉口学院学报》 2014年第4期1-3,共3页 JOURNAL OF HANKOU UNIVERSITY
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部