期刊文献+

中文文本情感词典构建方法 被引量:37

Method on Building Chinese Text Sentiment Lexicon
下载PDF
导出
摘要 互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。 Massive Internet text sentiment analysis is currently a hot research topic. This paper describes a method on Chinese text sentiment lexicon construction. This method improves the pointwise mutual information (PMI) algo- rithm for computing the weights of general sentiment lexicon, by selecting several sentiment seed words and drawing upon the total result numbers from search engine. In order to examine the validity of this method, this paper uses the established sentiment lexicon for text sentiment, and compares the classification effects of the method based on sentiment lexicon with those of na'~ee Bayesian classifier. The experimental results indicate that the high-quality sentiment lexicon can effectively choose and classify the sentiment characteristics, and has a stable classification function.
出处 《计算机科学与探索》 CSCD 2013年第11期1033-1039,共7页 Journal of Frontiers of Computer Science and Technology
基金 国家社会科学基金项目 教育部新世纪优秀人才支持计划 教育部人文社会科学研究青年基金项目 广东省科技计划项目 广东省社科规划项目 广东外语外贸大学校级项目 广东外语外贸大学研究生科研创新项目~~
关键词 情感词典 情感分类 PMI算法 朴素贝叶斯 sentiment lexicon sentiment classification pointwise mutual information (PMI) nalWe Bayes
  • 相关文献

参考文献5

二级参考文献88

  • 1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量:326
  • 2黄永光,刘挺,车万翔,胡晓光.面向变异短文本的快速聚类算法[J].中文信息学报,2007,21(2):63-68. 被引量:17
  • 3KU L-W, LO Y-S, CHEN H-H. Using polarity scores of words for sentence-level opinion extraction [ C]// Proceedings of the 6th NTCIR-6 Workshop Meeting. Toyko, Japan: [ s. n. ], 2007:316 - 322.
  • 4王秉卿,张姝,张奇.中文情感词识别[C]//NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京:[出版社不详],2008:63-69.
  • 5刘群 李素建.基于《知网》的词汇语义相似度的计算.中文计算语言学,2002,17(2):59-76.
  • 6王克,张春良,朱慕华,等.基于情感词词典的中文文本主客观分析[C].NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京,2008.56-62.
  • 7知网[EB/OL].[2009-03-12].http://www.keenage.com.
  • 8TURNEY P D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews [ C]// Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics. Morristown, N J, USA: Association for Computational Linguistics, 2002:417-424.
  • 9谭松波.中文情感挖掘语料-ChenSentiCorp[EB/OL].(2008-12-19)[2009-03-12].http://www.searchforum.org.cn/tansongbo/corpus-senti.htm.
  • 10KAJI N, KITSUREGAWA M. Building lexicon for sentiment analysis from massive collection of HTML documents [ C/OL]//EMNLPCoNLL 2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. 2007:1075 - 1083 [2009 -03 -08]. http://www. aclweb. org/anthology/D/D07/D07-1115. pdf.

共引文献181

同被引文献487

引证文献37

二级引证文献318

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部