期刊文献+

微博文本挖掘研究综述 被引量:5

Review of Microblog Text Mining
下载PDF
导出
摘要 [目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。 [Purpose/significance]The paper is to comb research status quo of microblog text mining at home and abroad, and prospect the future research directions. [Method/process]The paper introduces the background and significances of microblog text mining, and from aspects of data acquisition of microblog, mining methods of text semantics and application research, compares different ways of microblog data acquisition, analyze several methods of text preprocessing and text processing, and summarize current applications of microblog data. [Result/conclusion]Technologies for microblog data acquisition include three main ways basing on API, web crawler and network traffic; text mining of microblog involves methods such as text classification and clustering, topic detection, sentiment analysis; microblog data has been widely used in public opinion analysis, commercial marketing and social service.
出处 《情报探索》 2017年第5期97-103,共7页 Information Research
基金 长沙市科技计划项目"面向城市公共安全的网络众源信息分析系统开发"(项目编号:K1508028-11)研究成果之一
关键词 文本挖掘 分类和聚类 话题检测 情感分析 text mining classification and clustering topic detection sentiment analysis
  • 相关文献

参考文献18

二级参考文献307

共引文献787

同被引文献67

引证文献5

二级引证文献51

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部