网络舆情热点话题检测聚类算法研究被引量：4

Research on Clustering Algorithms of Internet Public Opinion Hot Topics Detection

下载PDF

导出

摘要数据聚类是基于某种相似性度量在多维数据中识别自然分组或集群的过程。聚类是许多不同学科的基本过程。因此,来自不同领域的研究人员正在积极研究聚类问题。文章首先对代表性的基于划分的聚类方法进行了一个概述,在此基础之上,针对网络舆情热点话题检测,文章使用这几个聚类算法进行对比试验,进而分析出更适用于热点话题检测方面的算法。最后对文章的研究进行总结,归纳出本研究的局限性,并指出改进的方向。 Data clustering is the process of identifying natural groups or clusters in multidimensional data based on a measure of similarity.Clustering is the basic process in many different disciplines. Therefore, researchers from different fields are actively studying the clustering problem. This article first gives an overview of representative partition-based clustering methods. Based on this, this paper uses these clustering algorithms to conduct comparative experiments based on the hot topic detection of Internet public opinions, and then analyzes algorithms that are more suitable for hot topic detection. Finally, the author summarizes the research of this article, sums up the limitations of this study, and points out the direction of improvement.

作者邓先均杨雅茜罗昭陈旭东沈小平 DENG Xian-jun;YANG Ya-qian;LUO Zhao;CHEN Xu-dong;SHEN Xiao-ping(Chongqing University of Posts and Telecommunications,Chongqing 400065;ISoftStone Information Technology Group Chengdu Technology Co.,Ltd.,Chengdu Sichuan 610097）Abstract：Data clustering is the process of identifying natural groups or clusters in multidimensional data based on a measure of similarity.)

机构地区重庆邮电大学软通动力信息技术集团成都科技有限公司

出处《数字技术与应用》 2018年第5期146-149,共4页 Digital Technology & Application

关键词数据聚类聚类算法网络舆情热点话题检测 data clustering clustering algorithm Internet public opinion hot topic detection

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1徐维林,张晖,殷玉娇,刘金岭.基于微博的热点话题跟踪技术研究[J].电脑知识与技术,2016,0(5):186-188. 被引量：4

二级参考文献16

1姚清耘,刘功申,李翔.基于向量空间模型的文本聚类算法[J].计算机工程,2008,34(18):39-41. 被引量：50
2刘星星,何婷婷,龚海军,陈龙.网络热点事件发现系统的设计[J].中文信息学报,2008,22(6):80-85. 被引量：30
3任晓东,张永奎,薛晓飞.基于K-Modes聚类的自适应话题追踪技术[J].计算机工程,2009,35(9):222-224. 被引量：13
4刘金岭.基于语义的高质量中文短信文本聚类算法[J].计算机工程,2009,35(10):201-202. 被引量：30
5骆卫华,刘群,白硕.面向大规模语料的语言模型研究新进展[J].计算机研究与发展,2009,46(10):1704-1712. 被引量：5
6刘金岭.基于主题的中文短信文本分类研究[J].计算机工程,2010,36(4):30-32. 被引量：14
7刘金岭.基于降维的短信文本语义分类及主题提取[J].计算机工程与应用,2010,46(23):159-161. 被引量：18
8席耀一,林琛,李弼程,周杰,许旭阳.基于语义相似度的论坛话题追踪方法[J].计算机应用,2011,31(1):93-96. 被引量：22
9刘金岭,严云洋.基于上下文的短信文本分类方法[J].计算机工程,2011,37(10):41-43. 被引量：13
10谢耘耕,荣婷.微博舆论生成演变机制和舆论引导策略[J].现代传播（中国传媒大学学报）,2011,33(5):70-74. 被引量：144

共引文献3

1王宗尧,刘金岭.微媒体文本热点事件的发现与跟踪[J].当代传播,2016(6):81-84.
2万勤,杜晓霞.基于演化网络的产业发展网络模型在科技管理中应用研究[J].自动化与仪器仪表,2018,0(6):1-5.
3何跃,朱灿,朱婷婷,郭秋艳.微博热点话题情感趋势研究[J].情报理论与实践,2018,41(7):155-160. 被引量：9

同被引文献63

1李乡儒,吴福朝,胡占义.均值漂移算法的收敛性[J].软件学报,2005,16(3):365-374. 被引量：88
2刘毅.略论网络舆情的概念、特点、表达与传播[J].理论界,2007(1):11-12. 被引量：312
3黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249
4周芳芳,樊晓平,叶榛.均值漂移算法的研究与应用[J].控制与决策,2007,22(8):841-847. 被引量：59
5蒋盛益,李霞.一种改进的BIRCH聚类算法[J].计算机应用,2009,29(1):293-296. 被引量：25
6曹玉华,吴小俊,段先华,王士同.基于背景提取和扩展均值漂移算法的目标跟踪[J].计算机工程与应用,2009,45(13):194-196. 被引量：7
7王伟,许鑫.基于聚类的网络舆情热点发现及分析[J].现代图书情报技术,2009(3):74-79. 被引量：62
8曾润喜.网络舆情管控工作机制研究[J].图书情报工作,2009,53(18):79-82. 被引量：347
9李艳灵,孟庆伟,邬长安.基于相关性比较算法的均值漂移图像分割[J].计算机应用研究,2010,27(1):342-344. 被引量：3
10张霞,王素贞,尹怡欣,赵海龙.基于模糊粒度计算的K-means文本聚类算法研究[J].计算机科学,2010,37(2):209-211. 被引量：12

引证文献4

1徐建国,韩青君,李青.K-means聚类算法及其在网络舆情中的应用[J].软件导刊,2018,17(11):65-67. 被引量：1
2徐建国,蔺珍,张鹏,徐明磊,李恒忠.网络舆情热点获取与分析算法研究[J].软件导刊,2019,18(5):93-97. 被引量：3
3程小刚,谢丹颖,郭韧.应用图谱分析的舆情研究主题发现[J].福建电脑,2020,36(2):8-11.
4张京坤,王怡怡.基于Spark的均值漂移算法在网络舆情聚类中的应用[J].软件导刊,2020,19(9):190-195. 被引量：3

二级引证文献6

1徐建国,韩琮师.改进K-means算法在高校舆情中的应用[J].软件导刊,2019,18(7):142-144. 被引量：4
2张宇豪,王依凡,马雪扬,孙昊琳,佟雨尧.微博情感分析可视化系统[J].现代信息科技,2019,3(11):115-116. 被引量：1
3肖文杰,张艳芳.在线评论大数据下旅游景区网络口碑研究——以张家界国家森林公园为例[J].软件导刊,2019,18(11):121-125. 被引量：2
4高慧.基于大数据的网络舆情多维动态分类研究[J].电脑知识与技术,2021,17(14):15-17.
5张京坤,王怡怡.Spark框架下均值漂移算法对舆情聚类的分析[J].软件导刊,2022,21(6):141-146. 被引量：1
6宗锐,何福根,张帆远.一种具有学习功能的电器识别电路设计[J].电子设计工程,2023,31(19):122-125. 被引量：1

1付淇.社会化短文本及其技术研究[J].景德镇学院学报,2018,33(2):113-117.
2付淇.微博热点话题检测研究综述[J].东南传播,2018(5):82-83.
3潘丽频,柯海生.营林技术改革改进的方向[J].江西农业,2018(16):98-98.
4郭靖,侯苏.K-means算法最佳聚类数评价指标研究[J].软件导刊,2017,16(11):5-8. 被引量：20
5秦俭.基于Ward法的有序数据聚类方法[J].科技经济导刊,2018(20):167-167. 被引量：2
6龚镘霖.基于校园卡消费数据的大学生就餐行为分析[J].信息与电脑,2018,30(11):49-52.
7林日福.数学运算法则教学的三个基本过程[J].中学数学教学参考（中旬）,2018(8):57-60.
8刘艳,朱琪,李鑫强,李绅.基于SPSS的试卷质量研究[J].现代商贸工业,2018,39(29):79-80. 被引量：3
9唐志贤,王彤,金紫蘅.一种基于商空间的非欧时空数据索引模型[J].兵工自动化,2018,37(6):78-82. 被引量：1
10郑胜男,张儒威.马克思恩格斯的生态思想及其当代启示[J].齐齐哈尔大学学报（哲学社会科学版）,2018(6):40-42. 被引量：4

数字技术与应用

2018年第5期

浏览历史

内容加载中请稍等...

网络舆情热点话题检测聚类算法研究被引量：4

参考文献1

二级参考文献16

共引文献3

同被引文献63

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

网络舆情热点话题检测聚类算法研究 被引量：4

参考文献1

二级参考文献16

共引文献3

同被引文献63

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

网络舆情热点话题检测聚类算法研究被引量：4