-
题名中文微博的立场判别研究
被引量:3
- 1
-
-
作者
刘勘
田宁梦
王宏宇
林荣蓉
王德民
-
机构
中南财经政法大学信息与安全工程学院信息系
-
出处
《知识管理论坛》
2017年第3期175-185,共11页
-
基金
国家社会科学基金项目"基于文本挖掘的网络谣言预判研究"(项目编号:14BXW033)研究成果之一
-
文摘
[目的/意义]提出一种以情感加权算法和朴素贝叶斯算法为基础的组合分类模型(SWNB模型),旨在对中文微博话题的立场进行判别。[方法/过程]该模型首先通过给定的复杂句模型对微博进行简化,然后依据情感规则得到情感权值,提取微博中与话题相关的实体并进行优化,进而将微博分为包含立场和未表明立场(NONE)两类;再对包含立场的微博提取特征词,利用朴素贝叶斯算法将其立场判别为支持(FAVOR)或反对(AGAINST)。[结果/结论 ]实验结果表明,本模型有较好的立场判别精度,并能同时有效地处理中文复杂句式、话题相关评价对象以及上下文语境等复杂情形。
-
关键词
中文微博
立场判别
情感加权算法
朴素贝叶斯
-
Keywords
Chinese microblogs
stance detection
sentiment weighted algorithm
Naive Bayes
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名网络谣言敏感词库的构建研究——以新浪微博谣言为例
被引量:6
- 2
-
-
作者
夏松
林荣蓉
刘勘
-
机构
中南财经政法大学信息与安全工程学院
-
出处
《知识管理论坛》
2019年第5期267-275,共9页
-
基金
国家社会科学基金资助项目“基于文本挖掘的网络谣言预判研究”(项目编号:14BXW033)研究成果之一.
-
文摘
[目的/意义]网络谣言严重影响网络正常信息的传播,对网络谣言进行识别有着重要的现实意义。笔者构建一个基于微博的网络谣言敏感词库,以提高网络谣言的识别精度。[方法/过程]针对微博类社交平台短文本的特点,首先舍弃传统的分词算法,设计LBCP抽词算法,并结合位置信息和改进的TF-IDF权重来提取敏感词库的种子词集,然后通过聚类算法将种子词的近义词补充到词库中,再将常用的替代词也加入到词库中,从而得到最终的敏感词库。[结果/结论]利用敏感词特征对谣言进行判断,在提取微博的内容特征、用户特征、传播特征以及情感分析特征的基础上,新增敏感词特征以后谣言识别率有明显提升,得到较好的识别效果。
-
关键词
敏感词库
词向量
特征空间
网络谣言
-
Keywords
sensitive thesaurus
word embedding
feature space
network rumors
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
G206
[文化科学—传播学]
-