期刊文献+

基于潜在语义索引和遗传算法的文本特征提取方法 被引量:16

The Method of Text Feature Selection Based on LSI and GA
下载PDF
导出
摘要 本文采用潜在语义索引(LSI)和遗传算法(GA)进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM(Vector Space Model)中,通过奇异值分解(SVD,Singular Value De-composition)可以有效地降低向量空间的维数,但通过维数约简后的文本特征仍要保持在数百维左右,因此本文采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大的降低文本向量空间的维数,并能提高分类准确率。 This paper selects the features of text by using LSI and GA (Genetic Algorithm). This paper uses LSI to reflect the relation of words in VSM (Vector Space Model). The dimension of VSM can be reduced greatly by Singular Value Decomposition. However, after that the text features have still several hundreds dimensions, so this paper continues to reduce the dimension by using GA in this base. The results of exexperiment indicate that combining these two methods can greatly reduce the dimension of VSM and advance precision of text classifying.
出处 《情报科学》 CSSCI 北大核心 2006年第1期104-107,共4页 Information Science
基金 国家自然科学基金资助项目(60275020)
关键词 特征提取 潜在语义索引 遗传算法 KOHONEN网络 feature selection latent semantic index genetic algorithm kohonen network
  • 相关文献

参考文献5

二级参考文献9

共引文献117

同被引文献218

引证文献16

二级引证文献138

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部