期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于PCA的组合特征提取文本分类方法 被引量:24
1
作者 李建林 《计算机应用研究》 CSCD 北大核心 2013年第8期2398-2401,共4页
为了获得更好的文本分类准确率和更快的执行效率,研究了多种Web文本的特征提取方法,通过对互信息(MI)、文档频率(DF)、信息增益(IG)和χ2统计(CHI)算法的研究,利用其各自的优势互补,提出一种基于主成分分析(PCA)的多重组合特征提取算法(... 为了获得更好的文本分类准确率和更快的执行效率,研究了多种Web文本的特征提取方法,通过对互信息(MI)、文档频率(DF)、信息增益(IG)和χ2统计(CHI)算法的研究,利用其各自的优势互补,提出一种基于主成分分析(PCA)的多重组合特征提取算法(PCA-CFEA)。通过PCA算法的正交变换快速地将文本特征空间降维,再通过多重组合特征提取算法在降维后的特征空间中快速提取出更具代表性的特征项,过滤掉一些代表性较弱的特征项,最后使用SVM分类器对文本进行分类。实验结果表明,PCA-CFEA能有效地提高文本分类的正确率和执行效率。 展开更多
关键词 基于pca的组合特征提取算法(pca-cfea) 主成分分析 特征提取 文本分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部