-
题名基于特征辨别能力和二进制可辨矩阵的特征选择
- 1
-
-
作者
朱颢东
周姝
钟勇
-
机构
中国科学院成都计算机应用研究所
中国科学院研究生院
-
出处
《计算机应用与软件》
CSCD
2010年第10期94-97,102,共5页
-
基金
四川省科技计划项目(2008GZ0003)
四川省科技厅科技攻关项目(07GG006-014)
-
文摘
为了提高分类算法的运行速度,降低占用的内存空间,必须使用特征选择算法。首先分析了几种经典特征选择方法并总结了它们的不足,然后提出了特征辨别能力的概念,紧接着把粗糙集引进来并给出了一个基于二进制可辨矩阵的属性约筒算法,最后把该属性约简算法同所提特征辨别能力结合起来,给出了一个综合的特征选择方法。该方法首先利用所提特征辨别能力进行特征初选以过滤掉一些词条,然后利用所提属性约简算法消除冗余。实验结果表明此种特征选择方法效果良好。
-
关键词
文本分类
特征选择
特征辨别能力
二进制可辨矩阵
-
Keywords
Text categorization
Feature selection
Feature distinguishability
Binary discernibility matrix
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于特征辨别能力和分形维数的特征选择方法
被引量:2
- 2
-
-
作者
夏晶晶
朱颢东
-
机构
郑州牧业工程高等专科学校信息工程系
中国科学院成都计算机应用研究所
-
出处
《微型机与应用》
2010年第7期68-71,共4页
-
基金
四川省科技计划项目(2008GZ0003)
-
文摘
基于分形维数的属性约简算法与特征辨别能力相结合,提出了一个综合的特征选择方法。该方法利用特征辨别能力进行特征初选,过滤掉一些词条来降低特征空间的稀疏性,以利用所提约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明,此种特征选择方法效果良好。
-
关键词
文本分类
特征选择
特征辨别能力
分形维数
-
Keywords
text categorization
feature selection
feature distinguishability
fractal dimension
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-