期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
CGRMB-LDA:面向隐式微博的主题挖掘 被引量:3
1
作者 李继云 黄昀 陈捷 《计算机应用》 CSCD 北大核心 2016年第A01期67-71,共5页
由于微博文本短、词量少、语法风格随意的特点,因此微博中包含大量因缺少主题词汇而无法分析话题归属的微博,即隐式微博。提出改进的基于LDA的生成模型考虑评论组和转发微博的CGRMB-LDA模型,利用微博间评论关系、转发关系和上下文关系... 由于微博文本短、词量少、语法风格随意的特点,因此微博中包含大量因缺少主题词汇而无法分析话题归属的微博,即隐式微博。提出改进的基于LDA的生成模型考虑评论组和转发微博的CGRMB-LDA模型,利用微博间评论关系、转发关系和上下文关系扩展隐式微博,明确隐式微博的主题归属,采用吉布斯采样的方法来求解模型从而得到主题集和微博所属主题。在真实数据集上的实验表明,CGRMB-LDA模型能有效地对微博特别是隐式微博进行主题挖掘。 展开更多
关键词 微博 主题挖掘 评论组 转发微博 潜在Dirichlet分配 隐式微博
下载PDF
基于向量自回归模型的微博隐式话题流行度预测 被引量:1
2
作者 段东圣 李鹏霄 +1 位作者 李玉华 李瑞轩 《模式识别与人工智能》 EI CSCD 北大核心 2016年第7期616-624,共9页
现有话题流行度预测方法仅基于话题本身的特征进行流行度预测,未考虑不同话题间的相关性.然而在微博上下文不同的话题之间存在一定的相关性,特别是在同一个事件的不同话题之间.因此,文中利用动态话题模型探测微博中的隐式话题及其流行... 现有话题流行度预测方法仅基于话题本身的特征进行流行度预测,未考虑不同话题间的相关性.然而在微博上下文不同的话题之间存在一定的相关性,特别是在同一个事件的不同话题之间.因此,文中利用动态话题模型探测微博中的隐式话题及其流行度时间序列,通过Jensen-Shannon散度和皮尔逊相关系数分别分析话题间的内容和时序相关度,然后在预测模型中引入话题时序相关性,提出基于向量自回归模型的微博隐式话题流行度预测算法.通过在真实微博数据上的实验分析可知,相比未考虑话题相关性的算法,文中算法具有更高的预测准确率和更好的模型拟合效果. 展开更多
关键词 流行度预测 向量自回归(VAR) 微博话题 时序相关度 动态话题模型(DTM)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部