期刊文献+

大规模中文实体情感知识的自动获取 被引量:2

Automatically Building a Large Scale Dictionary of Chinese Entity Sentiment Expressions
下载PDF
导出
摘要 目前中文情感分析的主要资源以情感词典为主,缺乏针对实体或属性的情感知识资源。该文主要研究如何从大规模文本语料中自动获取实体情感知识。在该文方法中,用情感表达组合来表示实体情感知识。首先,基于二部图排序算法对情感表达组合候选集合进行排序。然后,提出了一种基于语义相似的提炼算法对于排序靠后的表达组合进行选择。在提炼选择过程中,充分考虑实体之间和情感词之间的约束。最后,该文在三种大规模不同领域的语料上进行实验,并进行人工评价。评价结果表明,从三个领域数据集上获取的实体情感表达组合正确率均高于90%。最终我们获得了一个大规模情感知识词典,包括约30万对的情感表达组合。 Except for some sentiment dictionaries.There are not sentiment expressions for entities which are very important for analysis.This paper proposes a method of automatically building a dictionary of entity sentiment expressions from large-scale raw text.In our method,we use a sorting algorithm based on a bipartite graph to rank the candidates of sentiment expressions.Then,we present a refining algorithm according to semantic similarity to extract some expressions from the low-rank set.Finally,we conduct the experiments on three datasets from different domains.The experimental results show that the accuracy of the extracted expressions is better than 90%.Totally we obtain a large scale dictionary including about 300 Ksentiment expressions.
作者 卢奇 陈文亮 LU Qi;CHEN Wenliang(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China;Collaborative Innovation Center of Novel Software Technology and Industrialization,Suzhou,Jiangsu 215006,China)
出处 《中文信息学报》 CSCD 北大核心 2018年第8期32-41,共10页 Journal of Chinese Information Processing
基金 国家自然科学基金(61572338) 江苏省高校自然科学研究重大项目(16KJA520001)
关键词 情感分析 情感词典 情感挖掘 信息抽取 sentiment analysis sentiment dictionary sentiment mining information extraction
  • 相关文献

参考文献3

二级参考文献52

  • 1姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.
  • 2李素建,刘群.汉语组块的定义和获取[C]//孙茂松,陈群秀.语言计算与基于内容的文本处理:全国计算语言学联合学术会议(SWCL2003)论文集.北京:清华大学出版社,2003:110-115.
  • 3Hong Yu, Vasileios Hatzivassiloglou. Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences [C]//Proceedings of EMNLP 2003,2003: 129-136.
  • 4Ellen Riloff, Janyce Wiebe, William Phillips. Exploiting subjectivity classification to improve information extraction [ C ]//Proceedings of AAAI-2005, 2005: 1106-1111.
  • 5Minqing Hu,Bing Liu. Mining opinion features in customer reviews[C]//Proceedings of AAAI-2004,2004: 755-760.
  • 6倪茂树,林鸿飞.基于关联规则和极性分析的商品评论挖掘[C]//第三届全国信息检索与内容安全学术会议,2007:635-642.
  • 7Soo-Min Kim,Eduard Hovy. Automatic detection of opinion bearing words and sentences[C]//Proceedings of IJCNLP-2005,2005 : 61-66.
  • 8Jun Zhao,Kang Liu,GenWang. Adding redundant features for crfs based sentence sentiment classification [C]//Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing, 2008: 117-126.
  • 9Minqing Hu, Bing Liu. Mining and summarizing customer reviews [C]//Proceedings of KDD-2004, 2004 : 168-177.
  • 10许洪波,孙乐,姚天昉.第三届中文倾向性分析评测总结报告[R].第三届中文倾向性分析评测(COAE2011).2011,1-24.

共引文献112

同被引文献19

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部