在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点...在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点互信息的中文影评情感词库构建方法。该方法首先结合影评语料和基础词典利用K-means++聚类选择出情感倾向明显的正负面种子词集;再利用词间距和点互信息(Distance of Word Point-wise Mutual Information,DW-PMI)算法计算出影评领域词与种子词的语义相似度,得到影评领域情感词表;最后将影评领域情感词表加入基础情感词典构建出中文影评情感词库。实验结果证明所构建的词库可显著提高中文影评情感分析的准确度。展开更多
Web 2.0时代的到来,增强了互联网络的人际交互性与即时性,使互联网逐渐成为大众普遍交流观点、抒发情感的平台,同时也积累下关于人类心理和行为的海量文本信息,可供社会科学研究之用。心理学的情绪结构理论中有关类型分类取向和维度取...Web 2.0时代的到来,增强了互联网络的人际交互性与即时性,使互联网逐渐成为大众普遍交流观点、抒发情感的平台,同时也积累下关于人类心理和行为的海量文本信息,可供社会科学研究之用。心理学的情绪结构理论中有关类型分类取向和维度取向的理论成果,为信息科学研究中的情感词库、情感分析工具的开发和发展,提供了心理科学基础。利用在线文本情感分析技术研究大众社会心理,拓宽了包括心理学在内的社会科学研究范畴;同时社会科学也为在线文本情感分析研究提供了新的研究命题和理论框架。二者相辅相成,共同推动计算社会科学的发轫与发展。展开更多
当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,...当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到45.5%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为26.6%的情况下,正确率可以达到45.7%,证明了算法的有效性。展开更多
文摘在线影评的情感词能够直观的表达观众的电影观后感,已成为情感分析研究的热点之一。如何针对海量纷繁的影评数据建立领域特有的情感词库来提高影评情感分析准确性是当前影评情感分析亟待解决的问题。本文提出了一种新的基于词间距和点互信息的中文影评情感词库构建方法。该方法首先结合影评语料和基础词典利用K-means++聚类选择出情感倾向明显的正负面种子词集;再利用词间距和点互信息(Distance of Word Point-wise Mutual Information,DW-PMI)算法计算出影评领域词与种子词的语义相似度,得到影评领域情感词表;最后将影评领域情感词表加入基础情感词典构建出中文影评情感词库。实验结果证明所构建的词库可显著提高中文影评情感分析的准确度。
文摘当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到45.5%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为26.6%的情况下,正确率可以达到45.7%,证明了算法的有效性。