-
题名基于CCIPCA-LSSVM的文本自动分类算法
- 1
-
-
作者
张鸿彦
-
机构
河南工程学院软件学院
-
出处
《科学技术与工程》
北大核心
2013年第10期2704-2709,共6页
-
文摘
特征具有高维、稀疏性。为提高了文本自动分类准确率,针对PCA提取特征需要对大规模文本进行批处理,影响文本的准确率等,提出一种基于增量主元分析方法(CCIPCA)和最二小乘向量机(LSSVM)相结合的文本自动分类算法(CCIPCA-LSSVM)。首先通过互信法选择文本特征,然后采用CCIPCA高维文本特征进行提取,降低特征维数,消除冗余特征,最后采用LSSVM对提取特征进行学习,并通过粒子群算法对分类器优化,建立最优文本自动分类模型。仿真结果表明,相对于其它文本分类算法,CCIPCA-LSSVM提高了文本分类准确率和召回率,解决了文本特征提取过程存在的难题。
-
关键词
文本分类
特征提取
最小二乘支持向量机
增量主元分析方法
粒子群优化算法
-
Keywords
text categorization features abstract least squares support vector machines candid in- cremental principal component analysis particle swarm optimization algorithm
-
分类号
TP311.56
[自动化与计算机技术—计算机软件与理论]
-