摘要
本文主要通过改进的TF-IDF算法和多元词组动态构建来选择特征关键词,并利用Clu Stream数据流聚类方法,实现文本主题的动态发现.实验表明,该方法可以较好地发现海量文本信息中不断变化的主题信息,从而达到推荐关联主题、动态监测舆情等目的.
This paper rapidly find text’s hot topic by the improved TF- IDF algorithm and dynamic phrases that can choose the key words for text. The second,we uses clustering evolving datastreams to get hot topic for the candidate text. Discovering of text topic can detect the most important aspects of the vast information,so as to achieve the monitoring of public opinionrapidly.
出处
《重庆文理学院学报(社会科学版)》
2016年第2期126-129,144,共5页
Journal of Chongqing University of Arts and Sciences(Social Sciences Edition)
基金
全国教育信息技术研究"十二五"规划2014年度青年课题(146242121)
重庆市永川区自然科学基金项目(YCSTC
2014NC2001)