-
题名基于中心词和LDA的微博热点话题发现研究
被引量:12
- 1
-
-
作者
刘干
林杰豪
翟雯熠
-
机构
杭州电子科技大学经济学院
澳大利亚国立大学商学院
-
出处
《情报杂志》
CSSCI
北大核心
2021年第5期143-148,164,共7页
-
文摘
[目的/意义]通过引入中心词概念,提出一种改进LDA主题模型,以期在微博热点话题发现中获得更好的话题分布效果。[方法/过程]以微博热点数据为研究对象,进行文本表示学习,将基于Bert和Word2Vec的模型设为实验组,基于TF-IDF和BOW的模型设为对照组,令实验组和对照组分别生成改进LDA模型和传统LDA模型。[结果/结论]通过对比传统LDA模型和改进LDA模型,发现改进方法所生成的LDA模型在高频词分布集中度上更优于传统方法,在下游任务应用中更适合热点话题生成。
-
关键词
中心词
Bert
吉布斯抽样
LDA
微博热点话题
-
Keywords
Bert
gibbs sampling
LDA
weibo hot topics
-
分类号
G353.1
[文化科学—情报学]
-