-
题名基于领域文法的微博舆情分析方法及其应用
被引量:1
- 1
-
-
作者
张露晨
张良
孙昊良
方芳
曹阳
曹存根
-
机构
国家计算机网络应急技术处理协调中心
中国科学院计算技术研究所智能信息处理重点实验室
广西师范大学计算机科学与信息工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第8期43-49,共7页
-
基金
国家自然科学基金项目(91224006
61035004
+2 种基金
61173063
61203284)
科技部项目(201303107)
-
文摘
传统的舆情分析方法存在两个缺陷:由于缺少对舆情文本必要的语义处理,传统的基于关键词或热词的网络舆情分析方法往往分析结果不准确,即漏判率和假阳性比较高;在舆情发展初期,由于数据稀疏,一般不能及时发现舆情"苗头"。针对这些问题,提出一种基于领域文法的分析方法对微博文法进行分析,并给出一套通用的领域文法的设计原则以及分析方法。基于领域文法的方法与统计方法相比主要的优点和创新点包括:领域文法可以在数据稀疏的情况下依然可以很好的工作;领域文法的方式不需要对信息进行统计,不会受到距离的影响;领域文法的方法可以很好地提取真正有用的信息而不会像统计方法易受到词搭配的影响。为论证该方法,选择贪腐类舆情作为一个验证应用。实验表明,贪腐舆情文法很好地对贪腐类微博舆情文本内容进行识别和提取,从而达到贪腐舆情监控的目的。
-
关键词
微博舆情分析
领域文法
文法设计
反贪腐领域
-
Keywords
Microblogging public opinion analysis Domain-specific grammar Grammar design Anti-corruption domain
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-