-
题名CGRMB-LDA:面向隐式微博的主题挖掘
被引量:3
- 1
-
-
作者
李继云
黄昀
陈捷
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第A01期67-71,共5页
-
文摘
由于微博文本短、词量少、语法风格随意的特点,因此微博中包含大量因缺少主题词汇而无法分析话题归属的微博,即隐式微博。提出改进的基于LDA的生成模型考虑评论组和转发微博的CGRMB-LDA模型,利用微博间评论关系、转发关系和上下文关系扩展隐式微博,明确隐式微博的主题归属,采用吉布斯采样的方法来求解模型从而得到主题集和微博所属主题。在真实数据集上的实验表明,CGRMB-LDA模型能有效地对微博特别是隐式微博进行主题挖掘。
-
关键词
微博
主题挖掘
评论组
转发微博
潜在Dirichlet分配
隐式微博
-
Keywords
microblog
topic mining
comment group
retransmission microblog
Latent Dirichlet Allocation(LDA)
implict microblog
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于向量自回归模型的微博隐式话题流行度预测
被引量:1
- 2
-
-
作者
段东圣
李鹏霄
李玉华
李瑞轩
-
机构
国家计算机网络应急技术处理协调中心
华中科技大学计算机科学与技术学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2016年第7期616-624,共9页
-
基金
国家自然科学基金项目(No.61402123
61300222
+4 种基金
61173170)
国家计算机网络应急技术处理协调中心青年基金项目(No.2015QN-006
2014QN01)
北京科技计划项目(No.Z161100000216128)
软件工程国家重点实验室开放基金项目(No.SKLSE2012-09-11)资助~~
-
文摘
现有话题流行度预测方法仅基于话题本身的特征进行流行度预测,未考虑不同话题间的相关性.然而在微博上下文不同的话题之间存在一定的相关性,特别是在同一个事件的不同话题之间.因此,文中利用动态话题模型探测微博中的隐式话题及其流行度时间序列,通过Jensen-Shannon散度和皮尔逊相关系数分别分析话题间的内容和时序相关度,然后在预测模型中引入话题时序相关性,提出基于向量自回归模型的微博隐式话题流行度预测算法.通过在真实微博数据上的实验分析可知,相比未考虑话题相关性的算法,文中算法具有更高的预测准确率和更好的模型拟合效果.
-
关键词
流行度预测
向量自回归(VAR)
微博隐式话题
时序相关度
动态话题模型(DTM)
-
Keywords
Popularity Prediction, Vector Auto-regressive (VAR), Microblog Hidden Topic, Topic Correlation, Dynamic Topic Model (DTM)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-