期刊文献+

一种分布式中文微博热点话题的发现方法

下载PDF
导出
摘要 针对微博数据文本内容短小、特征词稀疏以及规模庞大的特点,提出了一种基于Map Reduce编程模型的发现微博热点话题的方法。该方法首先利用隐主题分析技术解决了微博内容短小、特征词稀疏的问题,然后利用CURE算法缓解了Kmeans算法对初始点敏感的问题,最后采用基于Map Reduce编程模型Kmeans聚类算法,对海量微博短文本数据进行快速聚类。实验结果表明该方法可以有效提高微博热点话题发现的效率。
作者 张翔 吝睿涛
出处 《无线互联科技》 2014年第12期168-169,共2页 Wireless Internet Technology
  • 相关文献

参考文献3

二级参考文献20

  • 1徐小龙,王汝传,姜波.一种新的基于P2P的电信海量数据分析业务模式[J].南京邮电大学学报(自然科学版),2007,27(3):22-27. 被引量:2
  • 2Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
  • 3Caol J, Li Jintao, Zhang Yongdong, et al. LDA-based Retrieval Framework for Semantic News Video Retrieval[C]//Proc. of Conf. on Semantic Computing. Irvine, California, USA: IEEE Press, 2007.
  • 4Steyvers M, Griffiths T. Probabilistic Topic Models[M]//Landauer T, McNamara D, Dennis S, et al. Latent Semantic Analysis: A Road to Meaning. [S. l.]: MIT Press, 2006.
  • 5Griffiths T, Steyvers M. Finding Scientific Topics[J]. Proceedings of the National Academy of Sciences, 2004, 101 (Suppl. 1 ): 5228-5235.
  • 6Nevada L V. Fast Collapsed Gibbs Sampling for Latent Dirichlet Allocation[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM Press, 2008: 569-577.
  • 7Li Hang, Yamanishi K. Topic Analysis Using a Finite Mixture Model[J]. Information Processing & Management, 2003, 39(4): 521-541.
  • 8Liu Ying, Ciliax B J, Borges K, et al. Comparison of Two Schemes for Automatic Keyword Extraction from MEDLINE for Functional Gene Clustering[C]//Proc. of IEEE Computational Systems Bioinformatics Conference. Stanford, Califomia, USA: IEEE Press, 2004: 394-404.
  • 9Zhang Liangjie, Zhou Qun. CCOA: cloud computing open--architecture[C]//IEEE International Conference on Web Services. Los Angeles, CA: Press IEEE Com- puter Society, 2009: 608-612.
  • 10Dean J, Ghemawat S. MapReduce: simplified data pro- cessing on large elusters[C]//Proe 6th Syrup on Oper- ating System Design and Implementation, New York, ACM Press, 2004 : 137- 150.

共引文献80

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部