在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点...在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点互信息的中文影评情感词库构建方法。该方法首先结合影评语料和基础词典利用K-means++聚类选择出情感倾向明显的正负面种子词集;再利用词间距和点互信息(Distance of Word Point-wise Mutual Information,DW-PMI)算法计算出影评领域词与种子词的语义相似度,得到影评领域情感词表;最后将影评领域情感词表加入基础情感词典构建出中文影评情感词库。实验结果证明所构建的词库可显著提高中文影评情感分析的准确度。展开更多
文摘在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点互信息的中文影评情感词库构建方法。该方法首先结合影评语料和基础词典利用K-means++聚类选择出情感倾向明显的正负面种子词集;再利用词间距和点互信息(Distance of Word Point-wise Mutual Information,DW-PMI)算法计算出影评领域词与种子词的语义相似度,得到影评领域情感词表;最后将影评领域情感词表加入基础情感词典构建出中文影评情感词库。实验结果证明所构建的词库可显著提高中文影评情感分析的准确度。