期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
局部文本特征选取算法的比较和改进研究 被引量:6
1
作者 李纲 夏晨曦 郑重 《情报学报》 CSSCI 北大核心 2008年第4期506-511,共6页
本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的... 本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的性能。同时,我们发现在应用于局部文本特征选取时,优势率算法的性能不如互信息和X^2统计算法。另外,对于K最近邻分类算法,随着足值的增大,文本分类的查准率在增加,而查全率在降低。最后,本文详细分析了造成这三种算法性能差异的原因,并提出了一种改进算法,来提高优势率算法应用于局部文本特征选取时的性能。 展开更多
关键词 文本分类 局部特征选择 互信息算法 x^2统计算法 优势率算法 K最近邻分类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部