-
题名一种基于PCA的组合特征提取文本分类方法
被引量:24
- 1
-
-
作者
李建林
-
机构
南京信息职业技术学院计算机与软件学院
里贾纳大学计算机科学系
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第8期2398-2401,共4页
-
基金
江苏省2010年度青蓝工程骨干教师资助项目(苏教2010-16)
-
文摘
为了获得更好的文本分类准确率和更快的执行效率,研究了多种Web文本的特征提取方法,通过对互信息(MI)、文档频率(DF)、信息增益(IG)和χ2统计(CHI)算法的研究,利用其各自的优势互补,提出一种基于主成分分析(PCA)的多重组合特征提取算法(PCA-CFEA)。通过PCA算法的正交变换快速地将文本特征空间降维,再通过多重组合特征提取算法在降维后的特征空间中快速提取出更具代表性的特征项,过滤掉一些代表性较弱的特征项,最后使用SVM分类器对文本进行分类。实验结果表明,PCA-CFEA能有效地提高文本分类的正确率和执行效率。
-
关键词
基于pca的组合特征提取算法(pca-CFEA)
主成分分析
特征提取
文本分类
-
Keywords
combined feature extraction algorithm based on pca(pca-CFEA)
principal component analysis(pca)
feature extraction
text classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Matlab平台人脸识别仿真过程的探究
- 2
-
-
作者
陈伟
张金华
李蔡媛
廖壬
-
机构
武汉大学电子信息学院
-
出处
《信息通信》
2013年第5期30-31,共2页
-
文摘
Matlab是一种科学与工程计算的高级语言,广泛地运用在包括信号与图像处理、控制系统设计等方面,我们使用Matlab作为平台,设计GUI,探究人脸识别的过程。在特征提取方面,运用主成分分析法(PCA)算法,对高维特征进行降维,保证了高位数据不失真,在分类器算法上采用支持向量机(SVM)和自适应提升(Adaboost)算法进行对比实验,SVM通过求解由全部训练样本对检测样本最佳线性表示的稀疏向量来进行分类,Adaboost算法针对不同的训练集训练同一个基本分类器(弱分类器)进行多次迭代,每次迭代增加错样本的权重,构成一个更强的最终的分类器(强分类器),实验结果表明,仿真能够达到较高的识别率和缩短识别的时间。
-
关键词
人脸识别
pca特征提取算法
SVM分类器算法
Adaboost分类器算法
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-