-
题名基于标签传播的情感词典构建方法
被引量:9
- 1
-
-
作者
张璞
王俊霞
王英豪
-
机构
重庆邮电大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第5期168-173,共6页
-
基金
教育部人文社会科学研究青年基金(17YJCZH247)
重庆市教委人文社会科学研究"社会媒体背景下的产品评论挖掘及应用研究"项目(17SKG055)
重庆市教委科技项目(KJ1600440)
-
文摘
传统情感词典构建方法存在依赖语义知识库、覆盖率有限、领域适应性差等问题。为此,提出一种利用语料库来构建情感词典的方法。该方法选取情感种子词,在语料上训练Word2Vec词向量来选取与种子词相似度高的词语作为候选情感词,并在语料上分析与种子词具有连词关系的词语作为候选情感词。通过种子词和候选情感词之间的相似度构建语义关联图,使用标签传播算法计算情感词的极性,从而构建情感词典。实验结果表明,与基线方法相比,该方法能获得较高的准确率和较好的鲁棒性。
-
关键词
情感分析
情感词典构建
词向量
连词关系
标签传播
-
Keywords
sentiment analysis
sentiment lexicon construction
word vector
conjunction relationship
label propagation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征选择技术的情感词权重计算
被引量:13
- 2
-
-
作者
吴金源
冀俊忠
赵学武
吴晨生
杜芳华
-
机构
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
南阳师范学院软件学院
北京市科学技术情报研究所
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2016年第1期142-151,共10页
-
基金
国家自然科学基金资助项目(61375059)
-
文摘
在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难.针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法.首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益(information gain,IG)和卡方统计量(chi-square,CHI),将特征选择技术应用于情感词权重计算.实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度.
-
关键词
文本情感分类
情感词典构建
特征选择
权重计算
-
Keywords
text sentiment classification
construction of emotion dictionary
feature selection
weight calculation
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-