-
题名一种结合随机森林和邻域粗糙集的特征选择方法
被引量:10
- 1
-
-
作者
吴辰文
王伟
李长生
梁靖涵
闫光辉
-
机构
兰州交通大学电子与信息工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第6期1358-1362,共5页
-
基金
国家自然科学基金项目(61163010)资助
甘肃省自然科学基金项目(1308RJZA111)资助
兰州市科技计划项目(2015-2-99)资助
-
文摘
针对肿瘤基因数据具有高维小样本的特性,为了提高传统基因分类方法的正确率,提出一种结合随机森林和邻域粗糙集的特征基因选择方法(Random Forest and Neighborhood Rough Set,RFNRS).该方法首先利用Relief算法,对原始的肿瘤基因数据进行权重选择,去除权重较低的特征子集;接着引入基于随机森林的封装式特征选择算法(Random Forest Wrapper Feature Select,RFWFS),以模型准确率作为评判准则,筛选特征子集;然后引入邻域粗糙集针对连续性的特征子集进行寻优处理;最后利用多个经典分类算法处理特征子集.经实验结果表明,该方法不仅在肿瘤基因特征子集的选择上具有良好的性能,同时在算法的分类性能上也有所提高.
-
关键词
肿瘤基因数据
随机森林特征封装
RELIEF算法
邻域粗糙集
特征选择
-
Keywords
tumor gene dataset
RFWFS
Relief algorithm
neighborhood rough set
feature selection
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-