基于无监督的热点话题发现研究被引量：1

下载PDF

导出

摘要高校“百度贴吧”经常会有用户发表一些讨论帖,这些信息对于学校来说是非常有用的。但是未经处理的信息无法实时给当局者提供帮助。因此,文章提出一种利用自然语言处理方法获取“贴吧”信息,并实时发现热点话题的方法。本文首先获取网络文本信息,对文本进行预处理,包括分词、去除停用词,再计算文本的TF-IDF值,最后利用无监督学习方法(K-means)对文本进行聚类,从而获取热点话题。从实验结果中可以看出,本方法可以有效地发现“贴吧”中的热点话题。

作者闻彬熊飞陈薇

机构地区湖北轻工职业技术学院信息工程学院光谷第十一小学华西证券股份有限公司

出处《电脑知识与技术》 2022年第35期16-18,共3页 Computer Knowledge and Technology

关键词自然语言处理热点话题机器学习 K-MEANS

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1徐云青,徐义峰,李舟军.基于VSM的中文信息检索[J].计算机系统应用,2007,16(4):21-23. 被引量：4

二级参考文献4

1Lee-Feng Chien,Hsiao-Tieh Pu Important Issues on Chiese Information Retrieval Computational Linguistics and Chinese Language Processing vol.1,no.1,August 1996,pp205-221.
2T.A.Letsche and Michael W.Berry Large-Scale Information Retrieval with Latent Semantic Indexing Information Science Applications,Volume 100,Number 1,August 1997,pp.105-137.
3C.D.Manning H.Schutze Foundations of Statistical Natural Language Processing The MIT Press Cambridge,Massachusetts London,England,1999.
4Ross Wilkinson,Justin Zobel,Ron Sacks-Davis Similarity Measures for Short Queries.SIAM Review,37(4):573-595,1995.

共引文献3

1裘江南,王带弟,仲秋雁.多相关主题的主题文本资源相关度算法研究[J].中国图书馆学报,2009,35(4):106-112. 被引量：3
2邢跃,杨进宝,谭爱.文本相似度比较系统设计与实现[J].绵阳师范学院学报,2010,29(11):93-97. 被引量：1
3寸待杰,刘韶涛.采用内容挖掘的缅甸文字相似文档检索[J].华侨大学学报（自然科学版）,2013,34(5):521-524. 被引量：2

同被引文献7

1侯保龙.服务性政府理论及其对我国行政改革的价值[J].新疆社科论坛,2006(1):18-21. 被引量：3
2施雪华.“服务型政府”的基本涵义、理论基础和建构条件[J].社会科学,2010(2):3-11. 被引量：182
3柳林青,余瀚,费宁,陈春玲.一种基于TextRank的单文本关键字提取算法[J].计算机应用研究,2018,35(3):705-710. 被引量：20
4杨雁莹,姜莹.基于TextRank算法的微博个人关键词云提取的设计与实现[J].电脑编程技巧与维护,2019(2):14-16. 被引量：2
5彭晓,梁艳,许立言,李迪华.基于“12345”市民服务热线的城市公共管理问题挖掘与治理优化途径[J].北京大学学报（自然科学版）,2020,56(4):721-731. 被引量：15
6丁正生,马春洁.改进词向量和kNN的中文文本分类算法[J].现代电子技术,2022,45(1):100-103. 被引量：11
7张楠迪扬.“全响应”政府回应机制:基于北京市12345市民服务热线“接诉即办”的经验分析[J].行政论坛,2022,29(1):78-86. 被引量：34

引证文献1

1田俐.基于kmeans的12345问题热点分析[J].电子技术与软件工程,2023(7):244-247. 被引量：1

二级引证文献1

1韩晨.基于K-Means聚类的消费者直播购物偏好研究[J].运筹与模糊学,2023,13(5):5045-5055.

1郭沁.中国粉丝圈层的形成与嬗变[J].浙江大学学报（人文社会科学版）,2022,52(9):85-85.
2戴烽.心理测试准吗?[J].中国机关后勤,2023(1):84-86.
3刘滨,孙中贤,吕梓逸,孟宪达,陈莉,詹世源.智慧交通互联网态势感知平台研究[J].河北科技大学学报,2022,43(6):651-660. 被引量：3
4本刊编辑部.“网课爆破”频现,完整教育亟待重新连接[J].教育家,2022(50):5-5.
5熊金莲,刘丰,郭艺峰,陈艳云,王晓瑞,吴文婷,芮龙.海洋观测数据传输系统的设计与实现[J].计算机应用与软件,2022,39(12):34-38. 被引量：4
6梅元清,郭肇强,周慧聪,李言辉,陈林,卢红敏,周毓明.面向对象软件度量阈值的确定方法:问题、进展与挑战[J].软件学报,2023,34(1):50-102.
7刘达,陈松灿.基于高斯神经元的自组织映射网络研究[J].数据采集与处理,2023,38(1):85-92. 被引量：2
8杨航,董亮,何乐生.基于Simple Thresholding和CUSUM联合算法的L波段太阳射电流量可观测频段分析[J].天文研究与技术,2023,20(1):31-40.
9马婷.基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法[J].电脑知识与技术,2022,18(35):56-59. 被引量：1

电脑知识与技术

2022年第35期

浏览历史

内容加载中请稍等...

基于无监督的热点话题发现研究被引量：1

参考文献1

二级参考文献4

共引文献3

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于无监督的热点话题发现研究 被引量：1

参考文献1

二级参考文献4

共引文献3

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于无监督的热点话题发现研究被引量：1