摘要
针对中日论坛的情感分类问题,研究了特定领域(中日关系论坛)语料的特点,考察了不同特征维数、不同特征权重计算、不同特征选取方法以及限定词类词语对情感分类结果的影响。最后通过对2006年1月份到5月份的中日论坛语料的自动情感分类,推断出该阶段中日关系走势。
Aiming at sentiment classification problem about Sino-Japanese relations forum,lhis paper studies the corpus charac teristic of the specific areasion Sino-Japanese Relations forum),the influence of different characteristh, dimension.weight computation, selection method as well as different word classes to the sentiment classification result.By automatically classifying sentiments on the corpus of Sino-Japanese Relations Forum during Jan.,2006-May,2006.,the situation of Sino-Japanese relations are concluded.
出处
《计算机工程与应用》
CSCD
北大核心
2007年第32期174-177,共4页
Computer Engineering and Applications
基金
国家自然科学基金(No.60573074)
山西省自然科学基金(No.2007011042)
山西省科技攻关项目(No.051129)
山西高校科技研究开发项目(No.200611002)。~~
关键词
论坛
情感分类
支持向量机
特征选择
forum
sentiment classification
support vector machine
characteristic selection