-
题名广告型微博的识别方法
被引量:3
- 1
-
-
作者
郭跇秀
吕学强
李卓
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第12期2702-2707,共6页
-
基金
国家自然科学基金项目(61171159
61271304)资助
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助
-
文摘
微博空间内充斥着大量广告信息,这些广告信息对舆情分析造成了极不利的影响.分析广告型微博特点,提出了一种广告型微博识别方法:在传统文本特征的基础上,引入"非活跃期微博数"、"微博重复度"、"特征词对权重"三类特征,并结合支持向量机模型对微博文本进行分类,识别广告微博发布者;分析广告微博发布者与普通用户的差异,提取广告微博发布者的"主题"特征,并面向用户对微博文本进行过滤,实现对广告型微博的识别.实验结果正确率为87.6%,召回率为97.2%,F值为91.6%,证明该方法能高效准确地识别广告型微博.
-
关键词
广告型微博
支持向量机
文本过滤
主题
-
Keywords
advertising microblog
advertiser
SVM
topic
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-