-
题名面向短文本的情感折射模型
被引量:9
- 1
-
-
作者
张乐
闫强
吕学强
-
机构
北京邮电大学经济管理学院
北京信息科技大学网络文化与数字传播北京市重点实验室
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2017年第2期180-189,共10页
-
基金
国家自然科学基金项目(61271304)
教育部人文社会科学研究规划基金(16YJA630063)
-
文摘
移动互联网时代产生海量的简短网络信息,快速、准确地获取这些数据中用户表达的情感信息具有广泛的应用场景。本文考虑人类按顺序阅读文本以获取情感信息的习惯,利用光的折射对此进行模拟,提出一种面向短文本分类的情感折射模型(Sentiment Refraction Model,SRM)。首先,从若干种子情感词出发,利用word2vector及k最近邻分类算法启发式地构建包含喜、怒、哀、乐、惧、恶六类情感的情感词典,认定每类情感词具有同等强度的情感,且这些情感词在不同的上下文中具有一定的情感折射率。其次,针对一条短文本,情感光线以给定的初始入射角向包含若干情感词的文本中传播,经过不同情感词介质的连续折射,情感光线传播方向产生相应的变化,通过情感光线出射角与初始入射角的差值即可判定文本的情感极性。最后,用NLP&CC,COAE等公布的标准数据集对本文方法进行评测,分别与基于情感极性加权求和、朴素贝叶斯以及支持向量机分类方法进行对比。实验结果表明,情感折射模型在不同类型的短文本数据集上均有较好的表现,此外,针对简单词典与扩展词典的情感分类结果对比也证实了情感词典扩展方法的有效性。
-
关键词
情感分析
折射
情感折射率
情感词介质
情感极性
-
Keywords
sentiment analysis
refraction
emotional refractive index
emotional words medium
emotional polarity
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-