期刊文献+

一种基于LDA的在线主题演化挖掘模型 被引量:35

LDA-based Model for Online Topic Evolution Mining
下载PDF
导出
摘要 基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异"。实验结果表明,该模型能从互联网语料中找出主题的演化趋势,具有良好的效果。 A computational model for online topic evolution mining was established through a latent semantic analysis process on textual data.Topical evolutionary analysis was achieved by tracking the topic trends in different time-slices.In this paper,Latent Dirichlet Allocation(LDA)was extended to the context of online text streams,and an online LDA model was proposed and implemented as well.The main idea is to use the posterior of topic-word distribution of each time-slice to influence the inference of the next time-slice,which also maintains the relevance between the topics.The topic-word and document-topic distributions are inferenced by incremental Gibbs algorithm.Kullback Leibler(KL)relative entropy is uesd to measure the similarity between topics in order to identify topic genetic and topic mutation.Experiments show that the proposed model can discover meaningful topical evolution trends both on English and Chinese corpus.
出处 《计算机科学》 CSCD 北大核心 2010年第11期156-159,193,共5页 Computer Science
基金 国家自然科学基金重点项目(60933005) 面上项目(60873204)资助
关键词 主题模型 LDA 演化 舆情 Topic model LDA Evolution Public opinion
  • 相关文献

参考文献7

二级参考文献92

共引文献173

同被引文献397

引证文献35

二级引证文献321

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部