基于邻域信息熵度量数值属性快速约简算法被引量：7

An effective continuous attributes reduction algorithm based on neighborhood entropy-based measurement

下载PDF

导出

摘要阐述邻域粗糙集和邻域信息熵的基本定义及性质,为避免数值属性信息系统属性约简过程中,属性离散化造成特征信息的丢失,提出一种新的基于邻域信息熵度量数值属性约简算法。扩展邻域信息系统核属性集生成约简属性集,邻域信息熵度量不仅关注约简属性集正域变化,而且考察负域样本空间约简属性邻域等价类在决策属性划分的分布,具备更好的邻域关系度量细粒度。实验表明,对比邻域粗糙集近似度量、邻域有效信息率度量、邻域软间隔度量的属性约简方法,该算法能有效进行邻域信息系统属性约简的同时,也保持了约简属性集更好的分类精度。 The paper elaborates the basic definitions and properties of neighborhood rough sets and neighborhood entropy. To avoid losing feature information caused by diseretization of continuous attri- butions while reducing attributions, we present a new algorithm of continuous attributions reduction based on neighborhood entropy-based measurement. In the process of expending from core attribute sets to the reduction of attribute sets in neighborhood information system （NIS）, neighborhood entropybased measurement is not only concerned with the positive field change of the reduction of attribute sets, but examines the distribution characteristics of the neighborhood equivalence classes of sample space in negative field in the decision attribute partition, which possess the finer granularity in the measurement of neighborhood relationship. Experimental results with UCI standard datasets show that compared with those attributions reduction algorithms based on neighborhood approximation measurement, neighborhood effective information ratio measurement, and neighborhood soft margin measurement, the proposed algorithm can effectively reduce continuous attributions in NIS, and at the same time, it maintains better classification accuracy of the reduction of attribute sets.

作者李少年吴良刚

机构地区中南大学商学院

出处《计算机工程与科学》 CSCD 北大核心 2016年第2期350-355,共6页 Computer Engineering & Science

基金国家自然科学基金委创新群体项目(70921001) 中国移动通信集团业务支撑重点联合研发项目(2014_LH_21)

关键词属性约简邻域信息熵度量核属性邻域信息系统负域样本空间分类精度 attribute reduction neighborhood entropy-based measurement core attribute neighborhood information system sample space in negative field classification accuracy

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1胡清华,赵辉,于达仁.基于邻域粗糙集的符号与数值属性快速约简算法[J].模式识别与人工智能,2008,21(6):732-738. 被引量：82
2诸文智,司刚全,张彦斌.采用邻域决策分辨率的特征选择算法[J].西安交通大学学报,2013,47(2):20-27. 被引量：2

二级参考文献28

1徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
2Wilson D R, Martinez T R. Improved Heterogeneous Distance Functions. Journal of Artificial Intelligence Research, 1997, 6( 1 ) : 1 - 34
3Hu Qinghua, Yu Daren, Xie Zongxia. Neighborhood Classifiers. Expert Systems with Applications: An International Journal, 2008, 34 (2) : 866 - 876
4LIU H,YU L. Toward integrating feature selection algorithms for classification and clustering[J].IEEE Transactions on Knowledge and Data Engineering,2005,(04):491-502.doi:10.1109/TKDE.2005.66.
5GUYON I,ELISSEEFF A. An introduction to variable and feature selection[J].The Journal of Machine Learning Research,2003,(7/8):1157-1182.
6MITRA P,MURTHY C,PAL S. Unsupervised feature selection using feature similarity[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,(03):301-312.
7DASH M,LIU H. Consistency-based search in feature selection[J].Artificial Intelligence,2003,(1/2):155-176.
8DASH M,CHOI K,SCHEUERMANN P. Feature selection for clustering:a filter solution[A].Piscataway,NJ,USA:IEEE,2002.115-122.
9HO T,BASU M. Complexity measures of supervised classification problems[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,(03):289-300.
10CHING J,WONG A,CHAN K. Class-dependent discretization for inductive learning from continuous and mixed-mode data[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,(07):641-651.

共引文献82

1鄢凡松,崔灿,刘伟祺,杨田.基于覆盖度的银行客户分类模型[J].模糊系统与数学,2023,37(1):152-164.
2储文强,陈功,胡鸿昊.结合粗糙集属性约简和夜间用水量分析的漏损识别研究[J].科技通报,2021,37(9):94-98. 被引量：2
3孙泽金,赵荣珍.基于EEMD能量矩与邻域粗糙集的转子故障数据集分类方法[J].计算机应用研究,2020,37(2):460-464. 被引量：5
4ZHAO Rong-zhen,LIAN Jin.基于邻域粗糙集概念的一种滚动轴承特征提取方法[J].兰州理工大学学报,2019,45(6):34-39. 被引量：2
5汤建国,祝峰,佘堃,陈文.粗糙集与其他软计算理论结合情况研究综述[J].计算机应用研究,2010,27(7):2404-2410. 被引量：15
6杜殿发,李冬冬,石达友,王青.基于粗糙集理论的超稠油油藏水平井吞吐效果评价及其影响因素分析[J].数学的实践与认识,2010,40(17):72-79. 被引量：1
7黄恒秋,曾玲.混合值不完备信息系统中一种拓展粗糙集模型[J].计算机工程与应用,2010,46(30):30-32. 被引量：3
8汤建国,佘堃,祝峰,李凯.集值映射下的覆盖粗糙集模型[J].计算机工程与应用,2011,47(10):30-34. 被引量：1
9于华.基于邻域粒化的数值信息系统的知识约简[J].办公自动化（综合月刊）,2011(5):17-19.
10宋艳佩,李一喆,李超,吴万涛.基于单调邻域粗糙集的特征基因提取[J].电脑知识与技术,2011,7(7):4658-4660.

同被引文献81

1马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：11
2杨明,孙志挥.改进的差别矩阵及其求核方法[J].复旦学报（自然科学版）,2004,43(5):865-868. 被引量：71
3曹付元,梁吉业,钱宇华.基于信息熵的决策表约简[J].计算机应用,2005,25(11):2630-2631. 被引量：6
4印勇,孙如英.基于模糊粗糙集的一种知识获取方法[J].重庆大学学报（自然科学版）,2006,29(5):108-111. 被引量：4
5胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：290
6费胜巍,孙宇.融合粗糙集与灰色理论的电力变压器故障预测[J].中国电机工程学报,2008,28(16):154-160. 被引量：47
7徐菲菲,苗夺谦,魏莱,冯琴荣,毕玉升.基于互信息的模糊粗糙集属性约简[J].电子与信息学报,2008,30(6):1372-1375. 被引量：35
8胡清华,赵辉,于达仁.基于邻域粗糙集的符号与数值属性快速约简算法[J].模式识别与人工智能,2008,21(6):732-738. 被引量：82
9吴尚智.基于粗糙集的一种属性值约简算法及其应用[J].计算机应用与软件,2009,26(2):263-265. 被引量：12
10赵亚娣,魏立力.基于变精度粗糙集的不完备信息系统知识约简[J].计算机工程与应用,2009,45(13):65-67. 被引量：13

引证文献7

1张立杰,鄂东辰,刘小平.一种翻车机液压系统故障诊断规则提取[J].机床与液压,2017,45(17):185-188. 被引量：2
2喻瑛,杨峥,王伟杰.基于分布式计算模式的两种属性约简算法[J].计算机技术与发展,2018,28(1):28-32. 被引量：2
3王光琼.基于邻域组合熵的属性约简算法[J].计算机应用与软件,2018,35(12):269-273. 被引量：12
4杨涛,张贤勇,冯山.基于差别矩阵的属性集求核算法[J].郑州大学学报（理学版）,2018,50(1):27-32. 被引量：6
5向伟.邻域系统中对象变化的动态属性约简算法[J].计算机应用与软件,2018,35(11):278-282. 被引量：4
6邬阳阳,郭文强,汤建国,任艳.几类拓展粗糙集模型属性约简研究综述[J].宜宾学院学报,2019,19(12):29-38. 被引量：3
7王君宇,杨亚锋,赵佳亮,代琪,李丽红.基于粒化可拓决策的属性约简算法研究[J].郑州大学学报（理学版）,2022,54(5):72-81. 被引量：3

二级引证文献30

1王志强,郑婷婷,孙鑫,李清.基于一种新的q-rung orthopair模糊交叉熵的属性约简算法[J].计算机科学,2022,49(S02):324-329. 被引量：1
2坚持全心全意为人民服务的宗旨[J].理论学习（浙江）,2000(3):28-27.
3左芝翠,张贤勇,莫智文,冯林.基于决策分类的分块差别矩阵及其求核算法[J].山东大学学报（理学版）,2018,53(8):25-33. 被引量：3
4支天云,陈晓冬.成人高校毕业生学位评审预测模型及其应用[J].山西大学学报（自然科学版）,2018,41(4):718-726. 被引量：2
5任凤娟.多传感器信息融合技术在液压系统故障诊断中的应用[J].液压气动与密封,2019,39(7):52-55. 被引量：17
6樊伟,刘红,匡亚茹.基于粗糙集改进Apriori算法在高校贫困生认定中的应用[J].电脑知识与技术,2019,15(7X):3-6. 被引量：2
7邬阳阳,郭文强,汤建国,任艳.几类拓展粗糙集模型属性约简研究综述[J].宜宾学院学报,2019,19(12):29-38. 被引量：3
8盛魁,卞显福,董辉,马健.基于邻域粗糙集组合度量的混合数据属性约简算法[J].计算机应用与软件,2020,37(2):234-239. 被引量：12
9林荣德,李进金,陈东晓,黄建新,施晗娟.基于可辨识集消解策略的覆盖决策系统约简算法[J].郑州大学学报（理学版）,2020,52(1):8-15.
10张少谱,孙品,冯涛.Pythagorean模糊信息系统属性约简的图论方法[J].郑州大学学报（理学版）,2020,52(1):79-86. 被引量：7

1汪小燕.基于分辨矩阵的论域划分方法[J].电脑学习,2007(4):5-6. 被引量：1
2陈颖悦,陈玉明.基于信息熵与蚁群优化的属性约简算法[J].小型微型计算机系统,2015,36(3):586-590. 被引量：11
3张志飞,苗夺谦.基于粗糙集的文本分类特征选择算法[J].智能系统学报,2009,4(5):453-457. 被引量：8
4黎敏,冯圣中,樊建平,刘清.基于粗集边界域的快速约简算法[J].计算机科学,2012,39(1):223-227. 被引量：7
5申锦标.一个基于基本集的快速约简算法[J].微计算机信息,2010,26(18):178-179.
6黄国顺,刘云生.一种改进的决策表属性重要性及其快速约简算法[J].计算机工程与应用,2007,43(28):173-176. 被引量：5
7姚远,包革军,李连锋.关于SISO系统间隔度量的应用问题[J].哈尔滨工业大学学报,1999,31(6):19-21.
8赵思雨,魏玲.基于决策表的保边界域不变及保负域不变约简[J].数码设计,2016,0(1):27-30. 被引量：1
9包革军,王广雄,何雨奋.间隔度量与反馈系统的鲁棒性[J].黑龙江自动化技术与应用,1995,14(1):1-3.
10徐勇,周森鑫.一种改进的关联规则挖掘方法研究[J].计算机技术与发展,2006,16(3):77-79. 被引量：13

计算机工程与科学

2016年第2期

浏览历史

内容加载中请稍等...

基于邻域信息熵度量数值属性快速约简算法被引量：7

参考文献2

二级参考文献28

共引文献82

同被引文献81

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于邻域信息熵度量数值属性快速约简算法 被引量：7

参考文献2

二级参考文献28

共引文献82

同被引文献81

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于邻域信息熵度量数值属性快速约简算法被引量：7