期刊文献+

文本分类中基于概念映射的二次特征降维方法 被引量:1

Mixed method of feature reduction based on concept mapping in text classification
下载PDF
导出
摘要 对高维特征集的降维是文本分类的一个主要问题。在分析现有特征降维方法的基础上,借助《知网》提出一种新的二次降维方法:采用传统的特征选择方法提取一个候选特征集合;利用《知网》对候选集合中的特征项进行概念映射,把大量底层分散的原始特征项替换成少量的高层概念进行第二次特征降维。实验表明,这种方法可以在减少文本语义信息丢失的前提下,有效地降低特征空间维数,提升文本分类的准确度。 Reducing the high dimension of feature vectors is an important issue in text classification. After studying current technique of feature reduction, a new method based on concept mapping is proposed. A subset of features is selected by traditional method of feature selection. Every feature in subset is mapped into the semantic dictionary and then selected again. The approach can not only get rid of redundant features but also preserve the semantic information of text. The results of experiments show that this method has improved effectively the precision of the text classification.
出处 《计算机工程与应用》 CSCD 2012年第1期166-169,共4页 Computer Engineering and Applications
基金 重庆市科委基金资助(CSTC No.2008BB2191)
关键词 文本分类 特征降维 特征选择 概念映射 《知网》 text classification feature reduction feature selection concept mapping HowNet
  • 相关文献

参考文献9

二级参考文献97

共引文献514

同被引文献11

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部