情感分析已经成为当今自然语言处理领域的热点问题。对于文本的自动化、半监督式的情感分析研究具有广泛的理论和实用价值。基于情感词典的情感倾向分析方法是文本情感分析的一种重要手段。然而,中文词汇在不同领域中的情感倾向不尽相同...情感分析已经成为当今自然语言处理领域的热点问题。对于文本的自动化、半监督式的情感分析研究具有广泛的理论和实用价值。基于情感词典的情感倾向分析方法是文本情感分析的一种重要手段。然而,中文词汇在不同领域中的情感倾向不尽相同,一词多义现象明显。同时,不同领域中的情感词也具有专业性、领域性的特点。针对这些问题,本文提出一种基于词向量相似度的半监督情感极性判断算法(Sentiment orientation from word vector,SO-WV),并依据该算法设计出一种跨领域的中文情感词典构建方法。实验证明,本文所设计的情感词典构建方法能有效地对情感词情感倾向进行判断。算法不仅在不同领域的情感词典建立上具有良好的可移植性,同时还具有专业性、领域性的特点。展开更多
通用情感词典(GPEL)对情感词语所在上下文的背景建模方面表现较差。针对此问题,提出一种领域特定情感词典(Domain Specific Emotion Dictionary,DSED)生成方法的扩展方法。所提方法在特征提取中使用了DSED提供的知识,而非简单的词语计...通用情感词典(GPEL)对情感词语所在上下文的背景建模方面表现较差。针对此问题,提出一种领域特定情感词典(Domain Specific Emotion Dictionary,DSED)生成方法的扩展方法。所提方法在特征提取中使用了DSED提供的知识,而非简单的词语计数。利用在训练文档上学习到的DSED知识,提取出基于词典的特征。词性标注、情绪词典和GPEL作为提取情感分类相关特征的外部资源。实验在SemEval-2007、微博数据集和博客数据集三个公开数据集上进行,实验结果表明,所提方法提取出的特征显著优于从GPEL提取出的特征,与逐点互信息(PMI)、n元语法等方法相比,所提方法的性能更优。展开更多
文摘情感分析已经成为当今自然语言处理领域的热点问题。对于文本的自动化、半监督式的情感分析研究具有广泛的理论和实用价值。基于情感词典的情感倾向分析方法是文本情感分析的一种重要手段。然而,中文词汇在不同领域中的情感倾向不尽相同,一词多义现象明显。同时,不同领域中的情感词也具有专业性、领域性的特点。针对这些问题,本文提出一种基于词向量相似度的半监督情感极性判断算法(Sentiment orientation from word vector,SO-WV),并依据该算法设计出一种跨领域的中文情感词典构建方法。实验证明,本文所设计的情感词典构建方法能有效地对情感词情感倾向进行判断。算法不仅在不同领域的情感词典建立上具有良好的可移植性,同时还具有专业性、领域性的特点。
文摘通用情感词典(GPEL)对情感词语所在上下文的背景建模方面表现较差。针对此问题,提出一种领域特定情感词典(Domain Specific Emotion Dictionary,DSED)生成方法的扩展方法。所提方法在特征提取中使用了DSED提供的知识,而非简单的词语计数。利用在训练文档上学习到的DSED知识,提取出基于词典的特征。词性标注、情绪词典和GPEL作为提取情感分类相关特征的外部资源。实验在SemEval-2007、微博数据集和博客数据集三个公开数据集上进行,实验结果表明,所提方法提取出的特征显著优于从GPEL提取出的特征,与逐点互信息(PMI)、n元语法等方法相比,所提方法的性能更优。