-
题名结合差别对象对集的综合性特征选择方法
- 1
-
-
作者
朱颢东
周姝
钟勇
-
机构
中国科学院成都计算机应用研究所
中国科学院研究生院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第3期622-625,共4页
-
基金
四川省科技计划基金项目(2008GZ0003)
-
文摘
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。分析了词频法和文档频法并总结了其缺陷,给出了一个改进的文档频方法;引进粗糙集理论,提出了一个属性约简算法;最后提出了一个新的特征选择方法。该特征选择方法使用改进的文档频初选特征并用所提属性约简算法消除冗余。仿真结果表明该特征选择方法性能较好。
-
关键词
特征选择
文本分类
文档频
差别对象对集
属性约简
-
Keywords
feature selection
text categorization
document frequency
discernibility object pair set
attribute reduction
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名使用特征分辨率和差别对象对集的特征选择
- 2
-
-
作者
吴洪丽
朱颢东
周瑞琼
-
机构
海南师范大学信息科学技术学院
中国科学院成都计算机应用研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第16期160-162,177,共4页
-
基金
海南省自然科学基金(No.807050)
四川省科技计划项目(No.2008GZ0003)~~
-
文摘
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征分辨率的概念,并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征分辨率结合起来,提出了一个新的特征选择方法。该方法首先利用特征分辨率进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
-
关键词
特征选择
文本分类
特征分辨率
差别对象对集
属性约简
-
Keywords
feature selection
text categorization
feature distinguishability
discernibility object pair set
attribute reduction
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-