基于最大近邻粗糙逼近的特征选择算法被引量：3

Feature Selection Algorithm Based on Maximal Nearest-neighbor Rough Approximation

下载PDF

导出

摘要基于邻域粗糙集的特征选择模型受到邻域参数值的制约.为此,引入最大近邻确定样本的邻域,构造了基于最大近邻粗糙集模型.在此基础上,提出了基于最大近邻粗糙逼近的特征选择方法.首先计算样本到与它最近同类和最近异类样本的距离来确定近邻类的大小,其次分析最大近邻类的性质提出快速求解样本正域的方法,最后采用前向贪心搜索策略构造特征选择算法.该算法不仅避免了邻域参数值的不确定选择,而且降低了对样本正域的判断次数.在3个不同分类器和8个UCI数据集上的实验结果表明:该模型不仅能够选择较少的特征,而且有效地提高了分类性能. Feature selection algorithm based on neighborhood rough sets is restricted by the neighborhood size. In this paper, a maximal nearest-neighbor is presented to estimate sample＇s neighborhood, and the maximal nearest-neighbor rough approximation model is constructed. Based on this model, a feature selection algorithm based on maximal nearest-neighbor rough approximation is proposed. The proposed algorithm first calculate the distance between the nearest missing and the nearest hit of a given sample to determine the size of nearest neighbor, and present a new fast method to calculate the positive region of the maximal nearest-neighbor model, then a forward greedy feature selection algorithm is constructed. This algorithm not only avoids the uncertainty of neighborhood size, but also reduces the number of judgment for positive region of sample. The experiment is conducted on three different classifiers and eight different datasets. Experimental results show that the proposed model selects a few features and effectively improve classification performance.

作者刘景华林梦雷王晨曦林耀进

机构地区闽南师范大学计算机学院漳州职业技术学院计算机工程系

出处《小型微型计算机系统》 CSCD 北大核心 2015年第8期1832-1836,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61303131 61379021)资助福建省自然科学基金项目(2013J01028)资助福建省教育厅科技项目(JA14192)资助漳州市科技项目(ZZ2013J04)资助闽南师范大学研究生科研创新基金项目(YJS201433)资助

关键词特征选择最大近邻邻域粗糙集 feature selection maximum nearest-neighbor neighborhood rough sets

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Nina Zhou Lipo Wang.A Modified T-test Feature Selection Method and Its Application on the HapMap Genotype Data[J].Genomics, Proteomics & Bioinformatics,2007,5(3):242-249. 被引量：6
2苗夺谦,胡桂荣.知识约简的一种启发式算法[J].计算机研究与发展,1999,36(6):681-684. 被引量：507
3胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：290
4杨波,徐章艳,舒文豪.一种快速的Rough集属性约简遗传算法[J].小型微型计算机系统,2012,33(1):140-144. 被引量：6

二级参考文献50

1于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程学报,2004,24(6):205-210. 被引量：70
2朱永利,吴立增,李雪玉.贝叶斯分类器与粗糙集相结合的变压器综合故障诊断[J].中国电机工程学报,2005,25(10):159-165. 被引量：82
3谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量：134
4李订芳,章文,李贵斌,牛艳庆.基于可行域的遗传约简算法[J].小型微型计算机系统,2006,27(2):312-315. 被引量：18
5徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
6任永功,王杨,闫德勤.基于遗传算法的粗糙集属性约简算法[J].小型微型计算机系统,2006,27(5):862-865. 被引量：32
7王永强,律方成,李和明.基于粗糙集理论和贝叶斯网络的电力变压器故障诊断方法[J].中国电机工程学报,2006,26(8):137-141. 被引量：99
8孙秋野,张化光.基于粗糙集的配电系统连续信号故障诊断方法[J].中国电机工程学报,2006,26(11):156-161. 被引量：12
9王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264
10徐章艳,杨炳儒,宋威.基于区分对象对集的高效属性约简算法[J].模式识别与人工智能,2006,19(5):572-577. 被引量：10

共引文献787

1林耀进,白盛兴,赵红,李绍滋,胡清华.基于标签关联性的分层分类共有与固有特征选择[J].软件学报,2022,33(7):2667-2682. 被引量：5
2侯贤宇,陈玉明,吴克寿.多采样近似粒集成学习[J].南京大学学报（自然科学版）,2024,60(1):118-129.
3程凤伟,王文剑,张珍珍.面向高维小样本数据的层次子空间ReliefF特征选择算法[J].南京大学学报（自然科学版）,2023,59(6):928-936.
4孙泽金,赵荣珍.基于EEMD能量矩与邻域粗糙集的转子故障数据集分类方法[J].计算机应用研究,2020,37(2):460-464. 被引量：5
5刘城霞,朱敏玲,刘玮琪.基于互信息的属性约简算法研究与实现[J].北京信息科技大学学报（自然科学版）,2020,35(1):38-42. 被引量：7
6ZHAO Rong-zhen,LIAN Jin.基于邻域粗糙集概念的一种滚动轴承特征提取方法[J].兰州理工大学学报,2019,45(6):34-39. 被引量：2
7唐洪浪.基于决策强度的一种属性约简算法[J].湛江师范学院学报,2007,28(6):65-69.
8庞发虎,庞振凌,杜瑞卿.粗糙集理论对湖泊生态系统健康评定指数法的评价[J].生物数学学报,2008,23(2):337-344. 被引量：4
9林秋月,陈昭炯.基于二进制可辨矩阵的属性约简启发式算法[J].福州大学学报（自然科学版）,2004,32(z1):32-35. 被引量：1
10杨善林,刘业政,马溪骏.基于β-δ0粗糙集模型的属性约简算法[J].中国管理科学,2003,11(z1):41-45.

同被引文献32

1李霞,蒋盛益,郭艾侠.基于聚类和信息熵的特征选择算法[J].郑州大学学报（理学版）,2009,41(1):77-80. 被引量：4
2LIANG J Y , WANG F , DANG C Y, et al. An efficient rough feature selection algorithm with a multi-granulation view[ J]. Int J Approx Reason, 2012, 53(6) : 912 -926.
3GUYON I, ELISSEEFF A. An introduction to variable and feature selection[J]. J Mach Learn Res, 2003, 3(6) : 1157 -1182.
4TANG J, ALELYANI S, LIU H. Data classification: algorithms and applications [ M ]. Florida: Chemical Rubber Company Press, 2014.
5LI Y, GAO S Y, CHEN S. Ensemble feature weighting based on local learning and diversity [ C ]//Proceedings of the 26th AAAI conference on artificial intelligence. Edmonton, 2012.
6LIANG J, WANG F, DANG C, et al. An efficient rough feature selection algorithm with a multi-granulation view[ J]. Int J Ap- prox Reason, 2012, 53(6): 912-926.
7ZFIU W, SI G, ZHANG Y, et al. Neighborhood effective information ratio for hybrid feature subset evaluation and selection [ J]. Neurocomputing, 2013, 99(1 ) : 25 - 37.
8LIN Y J, LI J J, LIN P R , et al. Feature selection via neighborhood multi-granulation fusion[J]. Knowl-based Syst, 2014, 67 (1): 162-168.
9LIN Y J, HU X G, WU X D, Quality of information-based source assessment and selection[J]. Neurocomputing, 2014, 133 (1) : 95 - 102.
10HU Q H, CHE X, ZHANG L, et al. Feature evaluation and selection based on neighborhood soft margin[ J]. Neurocomputing, 2010, 73(10): 2114-2124.

引证文献3

1陈辉皇,林耀进,王晨曦,童先群,胡敏杰.基于层次粒化的特征选择算法[J].郑州大学学报（理学版）,2016,48(3):69-74. 被引量：1
2郑文彬,胡敏杰,何秋红.基于鲁棒近邻粗糙逼近的属性约简算法[J].闽南师范大学学报（自然科学版）,2018,31(4):22-31. 被引量：1
3承轶青,陈咏秋,徐明生.面向云服务器信息化管理的混合聚类算法研究[J].自动化技术与应用,2020,39(8):74-79. 被引量：2

二级引证文献4

1王红霞,王波,陈红坤,刘畅,马富齐,罗鹏,杨艳.电力数据融合:基本概念、抽象化结构、关键技术和应用场景[J].供用电,2020,37(4):24-32. 被引量：18
2解艳.基于大数据挖掘处理的多维数据去重聚类算法分析模型仿真[J].自动化技术与应用,2021,40(12):112-115. 被引量：10
3周传华,鲁勇,于猜.基于数据分区的OPTICS聚类算法[J].传感器与微系统,2022,41(10):103-107. 被引量：5
4王一宾,缪佳李,程玉胜.信息适应性分层粒化的多标签特征选择[J].安庆师范大学学报（自然科学版）,2022,28(4):37-43.

1汝佳,陈莉,房鼎益.一种LDA和聚类融合的SVM多类分类方法[J].西北大学学报（自然科学版）,2014,44(4):559-562. 被引量：9
2张彩虹,王春才,颜雁.医保决策支持系统中的聚类算法[J].长春理工大学学报（自然科学版）,2004,27(4):41-43. 被引量：2
3王行甫,俞璐.混合核函数中权重求解方法[J].计算机系统应用,2015,24(4):129-133. 被引量：8
4仝奇,胡双演,叶霞,张仲敏,李俊山.多分类SVDD混叠域识别的模拟电路故障诊断[J].计算机测量与控制,2016,24(1):50-53.
5赵炜,陈俊杰,李海芳.融合LDA的多类SVM方法研究[J].计算机工程与设计,2009,30(19):4497-4499. 被引量：2
6辜小花,龚卫国,杨利平.有监督图优化保局投影[J].光学精密工程,2011,19(3):672-680. 被引量：8
7陈雪芳,杨继臣.交叉验证KNN支持向量预选取算法在说话人识别上的应用[J].科学技术与工程,2013,21(20):5839-5842. 被引量：1
8车生兵,傅明.包含奇异类样本的感知机学习规则的单位圆算法[J].贵州工业大学学报（自然科学版）,2004,33(1):58-60.
9王兵,黄钰林,杨建宇,武俊杰.基于最大异类距离特征提取的SAR目标识别方法[J].中国科学：技术科学,2011,41(10):1388-1392. 被引量：3
10李振华,郑琳川.全局和局部特征相融合的人脸识别算法[J].计算机工程与应用,2015,51(14):131-135. 被引量：3

小型微型计算机系统

2015年第8期

浏览历史

内容加载中请稍等...

基于最大近邻粗糙逼近的特征选择算法被引量：3

参考文献4

二级参考文献50

共引文献787

同被引文献32

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于最大近邻粗糙逼近的特征选择算法 被引量：3

参考文献4

二级参考文献50

共引文献787

同被引文献32

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于最大近邻粗糙逼近的特征选择算法被引量：3