-
题名基于模糊邻域判别指数的在线流组特征选择
- 1
-
-
作者
徐久成
孙元豪
韩子钦
-
机构
河南师范大学计算机与信息工程学院
河南师范大学智慧商务与物联网技术河南省工程实验室
-
出处
《计算机工程与设计》
北大核心
2024年第3期806-813,共8页
-
基金
国家自然科学基金项目(61976082、62076089、62002103)。
-
文摘
在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数,用于描述模糊邻域粒的判别信息,扩展相关的不确定性度量方法。在此基础上,用组内特征选择和组间特征选择两种策略选择具有强近似能力且非冗余的特征。在8个公共数据集上进行对比实验,验证了该算法具有更优且稳定的分类性能。
-
关键词
特征选择
流特征选择
流组
模糊粗糙集
模糊邻域熵
邻域判别指数
不确定性度量
-
Keywords
feature selection
streaming feature selection
streaming groups
fuzzy rough set
fuzzy neighborhood entropy
neighborhood discrimination index
uncertainty measures
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融合邻域判别指数的混合式特征选择算法
被引量:3
- 2
-
-
作者
李校林
吴腾
郭有庆
-
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第11期2285-2290,共6页
-
文摘
特征选择是机器学习领域的重要课题,基于互信息的特征选择算法在多个领域得到了广泛应用.但是该类方法忽略了属性之间的相互作用对决策结果的影响,无法满足高维特征数据集的分类要求.针对这类问题,提出一种引入邻域判别指数的混合式特征选择算法NDI RF.首先在特征过滤阶段,利用邻域判别指数作为判决指标,通过图论聚类思想去除冗余特征,获得相关联的代表特征集;然后通过改进随机森林封装器的特征分配机制,结合序列后项搜索策略评估各个特征子集的分类效果;最终通过逐次迭代选择最高分类准确率所对应的特征子集作为最优特征子集.在UCI数据集上的实验结果表明,NDI RF算法相较于其他特征选择算法,能够有效地减少最优特征子集的大小,同时保证较高的分类准确率.
-
关键词
邻域判别指数
随机森林
图论聚类
混合式特征选择
-
Keywords
neighborhood discriminant index
random forest
graph theory clustering
hybrid feature selection
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-