期刊文献+

基于多元词组和数据流聚类的热点话题动态发现 被引量:1

Discovering of text's hottopic based on the dynamic phrases and stream data mining
下载PDF
导出
摘要 本文主要通过改进的TF-IDF算法和多元词组动态构建来选择特征关键词,并利用Clu Stream数据流聚类方法,实现文本主题的动态发现.实验表明,该方法可以较好地发现海量文本信息中不断变化的主题信息,从而达到推荐关联主题、动态监测舆情等目的. This paper rapidly find text’s hot topic by the improved TF- IDF algorithm and dynamic phrases that can choose the key words for text. The second,we uses clustering evolving datastreams to get hot topic for the candidate text. Discovering of text topic can detect the most important aspects of the vast information,so as to achieve the monitoring of public opinionrapidly.
作者 黄贵懿
机构地区 重庆文理学院
出处 《重庆文理学院学报(社会科学版)》 2016年第2期126-129,144,共5页 Journal of Chongqing University of Arts and Sciences(Social Sciences Edition)
基金 全国教育信息技术研究"十二五"规划2014年度青年课题(146242121) 重庆市永川区自然科学基金项目(YCSTC 2014NC2001)
关键词 多元词组 数据流聚类 TF-IDF CluStream 热点话题 dynamic phrases data stream clustering TF-IDF Clustream hot topic
  • 相关文献

参考文献4

二级参考文献15

  • 1袁里驰,钟义信.基于相似度的词聚类算法[J].微电子学与计算机,2005,22(8):93-95. 被引量:4
  • 2刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量:65
  • 3薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2009:330.
  • 4Gennari J H, Langley P, Fisher D H. Models of incremental concept formation[J]. Artificial Intelligence, 1989,40:11-61.
  • 5ZHANG T, RAGHU R,LIVNY M.BIRCH:an efficient data clustering method for very large databases [C] //Proceedings of ACM SIGMOD Int Conf.Montreal,Canada:[s.n.], 1996: 103-114.
  • 6Slonim N,Tishby N.Document clustering using word clusters via the information bottleneck method [C] //Proceedings of the 21st ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2000:208-215.
  • 7Hua-Ping Zhang,Qun Liu,etal.Chinese name entity recogni- tion using role model.Special issue Word Formation and Chi- nese Language processing of the International Journal of Com- putational[J]. Linguistics and Chinese Language Processing, 2003,8 (2):29-60.
  • 8Steinbach M. , Karypis G. , and Kumar V. A comparison of document clustering techniques [J].KDD Workshop on Text Mining,2000,(3):53-65.
  • 9孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量:1073
  • 10曾依灵,许洪波,白硕.网络文本主题词的提取与组织研究[J].中文信息学报,2008,22(3):64-70. 被引量:14

共引文献42

同被引文献9

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部