-
题名基于LDA话题演化研究方法综述
被引量:86
- 1
-
-
作者
单斌
李芳
-
机构
上海交通大学计算机科学与工程系中德语言技术联合实验室
-
出处
《中文信息学报》
CSCD
北大核心
2010年第6期43-49,68,共8页
-
基金
国家自然科学基金资助项目(60873134)
-
文摘
现实生活中不断有新话题的产生和旧话题的衰减,同时话题的内容也会随着时间发生变化。自动探测话题随时间的演化越来越受到人们的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应用。该文提出了话题演化的两个方面:内容演化和强度演化,总结了基于LDA话题模型的话题演化方法,根据引入时间的不同方式将目前的研究方法分为三类:将时间信息结合到LDA模型、对文本集合后离散和先离散方法。在详细叙述这三种方法的基础上,针对时间粒度、是否在线等多个特征进行了对比,并且简要描述了目前广泛应用的话题演化评测方法。文章最后分析了目前存在的挑战,并且对该研究方向进行了展望。
-
关键词
话题模型
话题演化
LATENT
DIRICHLET
ALLOCATION
-
Keywords
topic model
topic evolution
Latent Dirichlet Allocation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名特定事件微博与新闻报道话题对比研究
被引量:3
- 2
-
-
作者
周振宇
李芳
-
机构
上海交通大学计算机科学与工程系中德语言技术联合实验室
-
出处
《中文信息学报》
CSCD
北大核心
2014年第1期47-55,共9页
-
基金
国家自然科学基金(60873134)
-
文摘
该文描述了基于特定事件的新闻报道和微博在话题层面的对比研究。首先利用LDA话题模型抽取两种媒体上关于特定事件的话题,然后提出了话题关注度、差异度、演化度的定义和计算公式,改进了不同媒体话题差异度的计算方法,最后,选取四个不同种类的事件,进行实验对比与分析,结果显示,关于同一事件,1)微博上评论性话题较多,话题关注度值比较接近;新闻报道上事实性话题较多,话题关注度值差异较大;2)微博与新闻报道对评论性话题词汇差异度大,事实性话题词汇差异度小;3)微博上评论性话题持续时间较长,内容变化较少;新闻报道上事实性话题持续时间较长,内容变化较少。
-
关键词
话题模型
微博
新闻报道
对比
-
Keywords
topic model, Microblog, news, contrast
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-