期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于MRT-LDA模型的微博文本分类 被引量:2
1
作者 庞雄文 万本帅 王盼 《计算机科学》 CSCD 北大核心 2017年第8期236-241,259,共7页
微博的广泛使用产生了大量微博数据,这些数据中包含有大量有价值的信息。然而由于微博信息的文本内容简短且其本身带有一些结构化的社会网络方面的信息,传统的主题模型建模方法并不能十分有效地处理微博信息。根据微博信息的特点,提出... 微博的广泛使用产生了大量微博数据,这些数据中包含有大量有价值的信息。然而由于微博信息的文本内容简短且其本身带有一些结构化的社会网络方面的信息,传统的主题模型建模方法并不能十分有效地处理微博信息。根据微博信息的特点,提出一个基于Latent Dirichlet Allocation(LDA)的微博生成模型MRT-LDA,利用微博之间的转发、对话、支持(赞)和评论等关系来计算微博之间的相关性,综合考虑微博之间的相关性和同一用户微博信息间的关系,来辅助对微博的主题进行挖掘。采用吉布斯抽样法对模型进行推导,结果表明该模型能有效地对微博数据进行文本挖掘。 展开更多
关键词 微博 主题挖掘 LDA mrt-lda 概率生成模型 社交网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部