期刊文献+

基于无监督的热点话题发现研究 被引量:1

下载PDF
导出
摘要 高校“百度贴吧”经常会有用户发表一些讨论帖,这些信息对于学校来说是非常有用的。但是未经处理的信息无法实时给当局者提供帮助。因此,文章提出一种利用自然语言处理方法获取“贴吧”信息,并实时发现热点话题的方法。本文首先获取网络文本信息,对文本进行预处理,包括分词、去除停用词,再计算文本的TF-IDF值,最后利用无监督学习方法(K-means)对文本进行聚类,从而获取热点话题。从实验结果中可以看出,本方法可以有效地发现“贴吧”中的热点话题。
出处 《电脑知识与技术》 2022年第35期16-18,共3页 Computer Knowledge and Technology
  • 相关文献

参考文献1

二级参考文献4

  • 1Lee-Feng Chien,Hsiao-Tieh Pu Important Issues on Chiese Information Retrieval Computational Linguistics and Chinese Language Processing vol.1,no.1,August 1996,pp205-221.
  • 2T.A.Letsche and Michael W.Berry Large-Scale Information Retrieval with Latent Semantic Indexing Information Science Applications,Volume 100,Number 1,August 1997,pp.105-137.
  • 3C.D.Manning H.Schutze Foundations of Statistical Natural Language Processing The MIT Press Cambridge,Massachusetts London,England,1999.
  • 4Ross Wilkinson,Justin Zobel,Ron Sacks-Davis Similarity Measures for Short Queries.SIAM Review,37(4):573-595,1995.

共引文献3

同被引文献7

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部