-
题名基于样本重叠与近似马尔可夫毯的特征选择算法
- 1
-
-
作者
王大志
季焱晶
陈彦桦
王洪峰
黄敏
-
机构
东北大学信息科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第3期725-730,共6页
-
基金
国家重点研发计划资助项目(2020YFB1708202)。
-
文摘
随着信息技术的快速发展,数据中的高维特征极大地增加了产生冗余特征的可能性,冗余特征不仅导致搜索空间增大,而且影响了分类的准确率。针对现有的特征选择算法难以解决高维特征选择问题,提出了基于样本重叠与近似马尔可夫毯的特征选择算法(samples overlapping based modified Markov blanket, SOMMB)。该算法首先融合最大信息系数与改进强近似马尔可夫毯去除冗余特征;其次采用样本重叠策略指导前向搜索的过程,选取相关特征。该算法在10个公开数据集上与目前流行的PGVNS、FCBF-MIC、CFS、mRMR、RF、CBFS、ReliefF以及FFSG算法进行对比实验,SOMMB算法的平均准确率为82.519%,对比FFSG获得的最高准确率提升了4.214%,表明SOMMB算法可以提高分类精度。
-
关键词
特征选择
最大信息系数
改进强近似马尔可夫毯
样本重叠
前向搜索
-
Keywords
feature selection
maximal information coefficient
modified strong approximate Markov blanket
samples overlapping
forward search
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-