摘要
对网上获取的用户评论进行标注,并提取出与用户评论内容相关的特征,使用χ2统计提取不同类型评论进行特征选择,使用支持向量机分类方法进行学习,获得分类器,以此对网上时时更新的用户评论进行分类,挖掘出优秀的评论。实验结果显示该方法具有很高的召回率和准确率。
In this article,the authors labeled the consumer reviews got from the Web,and extracted the features of customer reviews content,selected the features of different reviews with CHI approach.Support Vector Machine(SVM) was used to get the classification,then to classify the updated consumer reviews and mine the useful reviews.The experiment shows that this way has high recall and precision.
出处
《计算机应用》
CSCD
北大核心
2009年第3期846-848,857,共4页
journal of Computer Applications
基金
重庆市自然科学基金资助项目(2007BB2134)
重庆市高等教育教学改革研究项目(0635207)
关键词
评论挖掘
χ~2统计
支持向量机
短文本分类
reviews mining
chi-square statistics
Support Vector Machine(SVM)
short document classification