期刊文献+

基于LDA模型和社交网络的个人技术博客文本挖掘 被引量:1

下载PDF
导出
摘要 针对个人技术博客缺乏深层次的主题挖掘,较少利用文本挖掘或机器学习算法研究其领域方向和演化态势的问题,提出了一种基于LDA模型和社交网络的个人技术博客文本挖掘算法。首先,通过Python抓取CSDN论坛的博客文本;其次,利用LDA模型和层次聚类算法挖掘技术博客的核心主题,揭示其博客创作的演化历程;最后,通过社交网络分析法构建技术博客的主题关系图谱,从而发现其核心主题社交群体。实验结果表明,提出的方法能有效识别出个人技术博客的热点主题,发现核心主题的关系图谱,挖掘主题演化脉络及构建博客画像,具有一定的学术价值。
作者 杨秀璋 武帅 于小民 项美玉 周既松 赵小明 YANG Xiuzhang;WU Shuai;YU Xiaomin;XIANG Meiyu;ZHOU Jisong;ZHAO Xiaoming
出处 《信息技术与信息化》 2021年第6期7-12,共6页 Information Technology and Informatization
基金 贵州省科技计划项目(No.黔科合基础〔2019〕1041,No.黔科合基础〔2020〕1Y279,No.黔科合基础〔2020〕1Y420) 贵州省教育厅青年科技人才成长项目(No.黔教合KY字〔2016〕175,No.黔教合KY字〔2018〕166,No.黔教合KY字〔2021〕135) 贵州财经大学2019年度校级项目(No.2019XQN01)。
  • 相关文献

参考文献5

二级参考文献82

  • 1杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量:19
  • 2骆卫华,于满泉,许洪波,王斌,程学旗.基于多策略优化的分治多层聚类算法的话题发现研究[J].中文信息学报,2006,20(1):29-36. 被引量:38
  • 3胡代平,雷爱中,王琪,李宗明.政府危机管理的信息需求及获取[J].科学技术与工程,2007,7(9):2177-2181. 被引量:9
  • 4Bollegala D, Matsuo Y, Ishizuka M. Measuring Semantic Similarity between Words Using Web Search Engines//Proc of the 16th Inter- national Conference on World Wide Web. Banff, Canada, 2007: 757 - 766.
  • 5Sahami M, Heilman T D. A Web-Based Kernel Function for Meas- uring the Similarity of Short Text Snippets//Pmc of the 15th Inter- national Conference on World Wide Web. Edinburgh, UK, 2006: 377 - 386.
  • 6Blei D M, Ng A Y, Jordan M I. Latent Diriehlet Allocation. Journal of Machine Learning Research, 2003, 3 : 993 - 1022.
  • 7Heinrich G. Parameter Estimation for Text Analysis [ EB/OL ]. [ 2010 -8-10 ]. http ://www. arbylon, net/publications/text-est, pdf.
  • 8Griffiths T L, Steyvers M. Finding Scientific Topies. Proe of the Na- tional Academy of Sciences of the United States of America, 2004, 101 ( zl ) : 5228 -5235.
  • 9Deerwester S, Dumais S T, Furnas G W, et al. Indexing by Latent Semantic Analysis. Journal of the American Society of Information Science, 1990, 41(6) : 391 -407.
  • 10Hofmann T. Probabilistie Latent Semantic Analysis// Proe of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley, USA, 1999: 289 - 296.

共引文献76

同被引文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部