-
题名基于邻域互信息与K-means特征聚类的特征选择
- 1
-
-
作者
孙林
梁娜
徐久成
-
机构
天津科技大学人工智能学院
-
出处
《智能系统学报》
2024年第4期983-996,共14页
-
基金
国家自然科学基金项目(62076089,61772176,61976082)
河南省科技攻关计划项目(2121-02210136).
-
文摘
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。
-
关键词
特征选择
邻域互信息
k-means
特征聚类
自适应k近邻
特征权重
加权k近邻密度
-
Keywords
feature selection
neighborhood mutual information
k-means
feature clustering
adaptive k-nearest neighbor
feature weight
weighted k-nearest neighbor density
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-