摘要
分析了微博短文本的专有特征,介绍了微博短文本的预处理流程。以新浪微博为网络舆情数据获取平台,简述了微博文本分类处理实现过程,基于Hadoop进行了网络舆情微博分类设计,为网络舆情监控任务的完成做数据依据。
The paper analyzes the characteristics of the microblog text, conducts an introduction to pre-processing, expounds the classification processing implementation of microblog text with Sina Weibo as the data acquisition platform of net-mediated public sentiment, carries on the classification design based on the Hadoop and provides data basis for the completion of net-mediated public sentiment monitoring.
出处
《图书情报导刊》
2016年第12期129-133,共5页
Journal of Library and Information Science
基金
秦皇岛市社科联课题"秦皇岛高校网络舆情研判体系与对策研究"(项目编号:201605096)
河北省高等教育学会课题"新媒体时代高校网络舆情预警机制研究"(项目编号:GJXH 2015-188)
关键词
网络舆情
微博文本
预处理
net-mediated public sentiment
microblog text
pre-processing