摘要
研究了在文本分类中,各种特征提取方法对分类效果的影响,比较了特征提取方法交叉熵(CE)、信息增益(IG)、互信息(MI)、及χ2对文本分类器性能的影响,分析了这几种特征提取方法对SVM和KNN分类器性能的影响。
Studies feature extraction in text categorization, compares cross entropy (CE), information gain(IG), mutual information(MI), X^2-test(CHI) and class selection these four method, analyzes the influence of performance of these feature extraction methods on SVM and KNN these two classifiers.
出处
《现代计算机》
2007年第4期10-13,共4页
Modern Computer