摘要
情感倾向明显的表情符,容易通过人工进行标注。但是对于情感倾向不明显的表情符,多人手工的标注结果往往难以达成一致。因此,提出一种利用种子词自动判定表情符情感倾向的方法。该方法利用少量种子表情符自动标注情感倾向比较明显的表情符,生成表情符标注集;对于情感倾向不明显的表情符,利用种子情感词和已得到的表情符标注集构建模型,实现其情感倾向的自动判定。实验结果表明,本文方法在微博表情符情感倾向的自动判定上有很好的效果。
The smileys with obvious sentiment orientation are easily annotated manually.But the annotations of the smileys with unobvious sentiment orientation are difficult to reach a consensus.A method of automatically determining the sentiment orientation of the microblog smileys with the seed words is proposed.The method automatically annotates the corpus smileys with obvious sentiment orientation using a few seed emotions.Then these smileys are used to generate the labeled smiley set(LSS).Moreover,a model is built based on the seed emotional words and LSS to determine the smileys with unobvious sentiment orientation.Experimental results show that the presented method is effective.
出处
《数据采集与处理》
CSCD
北大核心
2017年第1期198-204,共7页
Journal of Data Acquisition and Processing
基金
国家社会科学基金(12BYY045)资助项目
教育部新世纪优秀人才支持计划(NCET-12-0939)资助项目
广东省教育厅科技创新项目(2013KJCX0067)资助项目
广州市社会科学规划项目(15Q16)资助项目
广东外语外贸大学研究生科研创新项目(14GWCXXM-36)资助项目
广东外语外贸大学校级项目(14Q3)资助项目
广东省普通高校青年创新人才类项目(299-X5122106)资助项目
关键词
情感分类
机器学习
微博表情符
种子词
自动标注
sentiment classification
machine learning
microblog smileys
seed words
automatic labeling