基于自适应邻域互信息与谱聚类的特征选择被引量：4

Feature selection using adaptive neighborhood mutual information and spectral clustering

导出

摘要借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。 In order to deal with the problem that traditional spectral clustering algorithms need set parameters manually, this paper proposes a feature selection algorithm based on adaptive neighborhood mutual information and spectral clustering, which takes the advantage of neighborhood rough sets to deal with continuous data. First, the standard deviation set and adaptive neighborhood set of each object on attribute are defined. Some uncertainty measures such as adaptive neighborhood entropy, average neighborhood entropy, joint entropy, neighborhood conditional entropy and neighborhood mutual information are given, and then the adaptive neighborhood mutual information is used to sort the correlation between features and labels. Second, the shared nearest neighbor spectral clustering algorithm is combined to cluster the strongly relevant features into the same feature cluster, so that the features in the different feature clusters are strongly diverse. Finally, the feature selection algorithm is designed by employing the minimum redundancy and maximum correlation technology. The experimental results of selecting the number of features and classification accuracy on ten datasets verify the effectiveness of the proposed algorithm.

作者孙林梁娜徐久成 SUN Lin;LIANG Na;XU Jiu-cheng(College of Computer and Information Engineering,Henan Normal University,Xinxiang 453007,Henan,China;Henan Engineering Laboratory of Smart Business and Internet of Things Technology,Xinxiang 453007,Henan,China)

机构地区河南师范大学计算机与信息工程学院智慧商务与物联网技术河南省工程实验室

出处《山东大学学报（理学版）》 CAS CSCD 北大核心 2022年第12期13-24,共12页 Journal of Shandong University(Natural Science)

基金国家自然科学基金资助项目(62076089,61976082) 河南省科技攻关资助项目(212102210136)。

关键词特征选择邻域粗糙集邻域互信息谱聚类最小冗余最大相关 feature selection neighborhood rough set adaptive neighborhood mutual information spectral clustering minimum redundancy and maximum correlation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1景运革,景罗希,王宝丽,程妮.属性值和属性变化的增量属性约简算法[J].山东大学学报（理学版）,2020,55(1):62-68. 被引量：6
2刘艳,程璐,孙林.基于K-S检验和邻域粗糙集的特征选择方法[J].河南师范大学学报（自然科学版）,2019,47(2):21-28. 被引量：33
3刘琨,封硕.加强局部搜索能力的人工蜂群算法[J].河南师范大学学报（自然科学版）,2021,49(2):15-24. 被引量：15
4邓威,郭钇秀,李勇,朱亮,刘定国.基于特征选择和Stacking集成学习的配电网网损预测[J].电力系统保护与控制,2020,48(15):108-115. 被引量：40
5薛占熬,庞文莉,姚守倩,范黎林.基于前景理论的直觉模糊三支决策模型[J].河南师范大学学报（自然科学版）,2020,48(5):31-36. 被引量：12
6姚晟,徐风,赵鹏,纪霞.基于自适应邻域空间粗糙集模型的直觉模糊熵特征选择[J].计算机研究与发展,2018,55(4):802-814. 被引量：14
7王睿,高欣,李军良,徐建航,艾冠群,井潇.基于聚类分析的电动汽车充电负荷预测方法[J].电力系统保护与控制,2020,48(16):37-44. 被引量：48
8李福东,曾旭华,魏梅芳,丁敏.基于聚类分析和混合自适应进化算法的短期风电功率预测[J].电力系统保护与控制,2020,48(22):151-158. 被引量：24
9赵晓晓,周治平.结合稀疏表示与约束传递的半监督谱聚类算法[J].智能系统学报,2018,13(5):855-862. 被引量：6
10胡敏杰,郑荔平,唐莉,林耀进.联合谱聚类与邻域互信息的特征选择算法[J].模式识别与人工智能,2017,30(12):1121-1129. 被引量：12

二级参考文献98

1李文娟,乜春颖,张琦,张元.永磁同步电机的扩展电压矢量模型预测控制[J].实验技术与管理,2020,37(2):117-120. 被引量：5
2唐定勇,景运革.一种决策表属性值细化的正域约简算法[J].微电子学与计算机,2015,32(3):23-27. 被引量：4
3张丽新,王家廞,赵雁南,杨泽红.基于Relief的组合式特征选择[J].复旦学报（自然科学版）,2004,43(5):893-898. 被引量：44
4余健明,蔡利敏,杨文宇.基于提高系统可靠性降低网损的配电网络重构[J].电工技术学报,2004,19(10):70-73. 被引量：27
5牛东晓,谷志红,邢棉,王会青.基于数据挖掘的SVM短期负荷预测方法研究[J].中国电机工程学报,2006,26(18):6-12. 被引量：120
6刘洋,冯博琴,周江卫.基于差别矩阵的增量式属性约简完备算法[J].西安交通大学学报,2007,41(2):158-161. 被引量：13
7王毅,雷英杰.一种直觉模糊熵的构造方法[J].控制与决策,2007,22(12):1390-1394. 被引量：63
8胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：290
9范高锋,王伟胜,刘纯.基于人工神经网络的风电功率短期预测系统[J].电网技术,2008,32(22):72-76. 被引量：122
10胡清华,赵辉,于达仁.基于邻域粗糙集的符号与数值属性快速约简算法[J].模式识别与人工智能,2008,21(6):732-738. 被引量：82

共引文献189

1郭强强,皮昊书,陈云辉.光储充一体化电站优化配置方法[J].电力与能源,2022,43(1):61-64. 被引量：9
2龚芝,陈志伟,马凌.不完备信息系统中一种新的不确定性度量方法[J].测控技术,2018,37(11):116-119. 被引量：1
3任晓霞,薛凡.基于模糊邻域粗糙集的启发式属性约简算法[J].计算机工程与应用,2018,54(9):47-53. 被引量：5
4高磊,花胜强,陈意,郑健兵.基于互信息的大坝安全分析因子提取方法[J].山西水利,2018,34(10):34-35.
5张艳芹,杨习贝,陈向坚.基于kd-树的快速邻域分类方法[J].江苏科技大学学报（自然科学版）,2018,32(6):823-831. 被引量：6
6姚晟,陈菊,徐风,汪杰,吴照玉.量化容差关系的程度多粒度粗糙集模型[J].测控技术,2019,38(3):16-20.
7申华磊,邱鹏.CF患者肺组织分类——基于相关反馈的监督核哈希方法[J].河南师范大学学报（自然科学版）,2019,47(4):24-30.
8卢光跃,张宏建,闫真光,吴洋.基于特征选择和SVM的电信客户离网预测[J].西安邮电大学学报,2019,24(2):21-25. 被引量：6
9段海玲,王光琼.一种高效的复杂信息系统增量式属性约简[J].华南理工大学学报（自然科学版）,2019,47(6):18-30. 被引量：9
10储德润,周治平.公理化模糊共享近邻自适应谱聚类算法[J].智能系统学报,2019,14(5):897-904. 被引量：10

同被引文献53

1王国胤,张清华,胡军.粒计算研究综述[J].智能系统学报,2007,2(6):8-26. 被引量：111
2陈健美,陆虎,宋余庆,宋顺林,徐景,谢从华,倪巍伟.一种隶属关系不确定的可能性模糊聚类方法[J].计算机研究与发展,2008,45(9):1486-1492. 被引量：23
3苗夺谦,王珏.粗糙集理论中知识粗糙性与信息熵关系的讨论[J].模式识别与人工智能,1998,11(1):34-40. 被引量：138
4苗夺谦,王珏.粗糙集理论中概念与运算的信息表示[J].软件学报,1999,10(2):113-116. 被引量：250
5傅文渊,凌朝东.自适应折叠混沌优化方法[J].西安交通大学学报,2013,47(2):33-38. 被引量：30
6曹永春,蔡正琦,邵亚斌.基于K-means的改进人工蜂群聚类算法[J].计算机应用,2014,34(1):204-207. 被引量：41
7梁吉业,冯晨娇,宋鹏.大数据相关分析综述[J].计算机学报,2016,39(1):1-18. 被引量：240
8刘川川,丁海军.一种基于改进人工蜂群的K-means聚类算法[J].微处理机,2016,37(2):47-50. 被引量：3
9张清华,薛玉斌,胡峰,于洪.粗糙集近似集不确定性研究[J].电子学报,2016,44(7):1574-1580. 被引量：12
10石文峰,商琳.一种基于决策粗糙集的模糊C均值聚类数的确定方法[J].计算机科学,2017,44(9):45-48. 被引量：8

引证文献4

1王茜,张贤勇.不完备邻域加权多粒度决策理论粗糙集及三支决策[J].山东大学学报（理学版）,2023,58(9):94-104. 被引量：1
2孙林,刘梦含,薛占熬.结合人工蜂群与K-means聚类的特征选择[J].计算机科学与探索,2024,18(1):93-110. 被引量：1
3郑晨颖,陈颖悦,侯贤宇,江连吉,廖亮.一种邻域粒的模糊C均值聚类算法[J].山东大学学报（理学版）,2024,59(5):35-44.
4孙林,梁娜,徐久成.基于邻域互信息与K-means特征聚类的特征选择[J].智能系统学报,2024,19(4):983-996. 被引量：1

二级引证文献3

1徐伟华,丁一,邓彪,张晓燕.基于区间值犹豫模糊多粒度粗糙集的三支决策模型[J].陕西师范大学学报（自然科学版）,2024,52(3):37-46.
2李梦晴,孙林,徐久成.自适应图嵌入和非凸正则特征自表达的无监督特征选择[J].计算机工程与应用,2024,60(16):177-185.
3贾艳红,何利文.基于GGSAGCformer的多区域短期电荷负载预测[J].软件工程与应用,2024,13(4):579-592.

1卓永泰,董又铭,高灿.基于邻域互信息的三支特征选择[J].计算机工程与应用,2022,58(22):159-164. 被引量：2
2薛恩,李健,刘金燕.基于随机森林的发动机振动问题分析[J].质量与可靠性,2022(5):28-31.
3赵云莱,车文刚,金日泽.基于样本间变异系数改进的自适应谱聚类算法[J].兰州大学学报（自然科学版）,2022,58(6):812-818.
4康兆庭,杨田,柴军,张晓琴,李俊林.基于临床和放射特征的列线图非侵入性预测低级别胶质瘤患者的1p/19q染色体共缺失突变[J].中国CT和MRI杂志,2023,21(1):18-21. 被引量：1
5徐瑞卿,张志旺,孙宏亮.电子商务水军检测的新方法:自适应邻域精准化采样的多关系图神经网络[J].图书情报知识,2022,39(6):35-44. 被引量：1
6王茜,张贤勇,吕智颖.不完备决策信息系统的混合条件熵与多属性决策[J].系统工程理论与实践,2022,42(12):3401-3411. 被引量：2
7孙爽爽,黄德才,陆亿红.犹豫模糊数据对象集的谱聚类算法[J].小型微型计算机系统,2023,44(2):225-231. 被引量：1
8叶丹,胡二琴.基于嵌入式特征选择算法下的抗乳腺癌药物分子活性预测[J].电脑知识与技术,2022,18(34):8-10. 被引量：1
9林云,郭瑜,刘珍.鲁棒性幅值指数自适应谱幅值调制法[J].机械科学与技术,2023,42(1):53-58. 被引量：2
10徐夏,张晖,杨春明,李波,赵旭剑.公平谱聚类方法用于提高簇的公平性[J].计算机科学,2023,50(2):158-165.

山东大学学报（理学版）

2022年第12期

浏览历史

内容加载中请稍等...

基于自适应邻域互信息与谱聚类的特征选择被引量：4

参考文献14

二级参考文献98

共引文献189

同被引文献53

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于自适应邻域互信息与谱聚类的特征选择 被引量：4

参考文献14

二级参考文献98

共引文献189

同被引文献53

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于自适应邻域互信息与谱聚类的特征选择被引量：4