摘要
在传统的特征提取算法的基础上,对CHI公式做了两点改进,并结合KNN算法进行了分类测试比较,通过实验证明本文所采用的特征词提取方式,在一定程度上,能够得到较高的分类准确率,存在一定的合理性.
The document, on the basis of traditional feature extraction algorithm, makes two improvements on CHI formula and makes classification testing comparison combined with KNN algorithm. It proves via experiment that the feature extraction method adopted in the document can acquire higher classification accuracy rate and certain nationality on certain degree.
出处
《山东师范大学学报(自然科学版)》
CAS
2008年第3期35-37,53,共4页
Journal of Shandong Normal University(Natural Science)
基金
泰山学者建设工程专项经费资助项目
山东省自然科学基金重大项目(Z2004G02)
关键词
特征提取
χ^2
文本分类
feature extraction
χ^2
web classification