摘要
在介绍常用的文本分类中特征词提取方法的基础上,提出了一种全新的,适用于中文文本分类的特征提取方法———基于词性的特征提取方法,实验结果显示,这种基于词性的特征提取方法在提高特征提取效率和降低特征向量维数方面都有显著改善。
The feature selection based on part of speech, a novel method adapting better to Chinese document classification, is proposed in this paper. This method can improve the efficiency of feature selection and reduce the dimensions of the feature vector.
出处
《武汉理工大学学报》
CAS
CSCD
北大核心
2007年第4期132-135,共4页
Journal of Wuhan University of Technology
关键词
中文文本分类
向量空间模型
特征提取
Chinese document classification
vector space model
feature selection