摘要
搜索算法可以将文档主题模型具体化成信息检索。举个例子,自60年代以来,基于集群的检索研究最近在语言模型框架方面有了较好的研究成果。一种潜在狄利克雷分配(LDA)基于正式的文件生成模型的建立问题模型的方法,在机器学习的文献中被大量引用,但在信息检索中的可行性和有效性仍是未知的。在本文中,我们研究如何有效地使用LDA提高特设检索。我们提出的语言模型框架,一个基于LDA的文档模型,并评估它在几个TREC集合。吉布斯抽样法进行近似推理和计算复杂度的分析。我们发现,改进使用基于集群的模型检索,可以得到合理的效率。
出处
《中国新通信》
2017年第5期39-40,共2页
China New Telecommunications