期刊文献+

基于超立方体与信息熵的离散化方法 被引量:4

Discretization algorithm based on super-cube and information entropy
下载PDF
导出
摘要 针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的. Discretizing continuous attributes in a rough set were researched. Based on the concept of super-cube, all attributes of the information table in data space were globally discretized. By the consistent correlation of condition attributes and decision attributes, important condition attributes were selected depending on their classifying ability in the rough set boundary zone, and furthermore, important breaking points were selected to discretize the information table on a single attribute locally with the iterative constraints of information entropy. Illustration and experimental results indicate that the algorithm combining the global and local discretization is effective and efficient.
出处 《北京科技大学学报》 EI CAS CSCD 北大核心 2005年第6期760-763,共4页 Journal of University of Science and Technology Beijing
基金 国家自然科学基金(No.70271068)辽宁省教育厅重点科技基金(No.202163345)
关键词 粗糙集 离散化 超立方体 信息熵 rough set discretization super-cube information entropy
  • 相关文献

参考文献7

  • 1Pawlak Z.Rough Set.Int J Comput Inf Sci,1982 (1):341.
  • 2鄂旭,高学东,武森,张秋月.信息表中不完备数据的填补方法[J].北京科技大学学报,2005,27(3):364-366. 被引量:9
  • 3王国胤.Rough集理论与知识获取[M].西安交通大学出版社,2003,3..
  • 4苗夺谦.Rough Set理论中连续属性的离散化方法[J].自动化学报,2001,27(3):296-302. 被引量:139
  • 5Nguyen H S,Skowron A.Boolean reasoning for feature extraction problems.In:10th International Symposium on Foundations of Intelligent Systems.New York:Springer-Verlag,1997.116.
  • 6Nguyen S H,Skowron A.Quantization of real value attributesrough set and boolean reasoning approach.Bull Int Rough Set Soe,1996(1):347.
  • 7盂庆生.信息论[M].西安:西安交通大学出版社,1986..

二级参考文献10

  • 1苗夺谦.Rough Set理论及其在机器学习中的应用研究(博士学位论文)[M].北京:中国科学院自动化研究所,1997..
  • 2Wang Jue,J Comput Sci Technol,1998年,13卷,2期,189页
  • 3苗夺谦,博士论文,1997年
  • 4Hu X H,Int J Computational Intelligence,1995年,11卷,2期,323页
  • 5王国胤.Rough集理论与知识获取[M].西安交通大学出版社,2003,3..
  • 6Pawlak Z, Rough set. Int J Comput Inf Sci, 1982 (1): 341
  • 7武森 高学东.一种高位稀疏数据聚类的类特征表示法[J].北京科技大学学报,2003,25(2):131-131.
  • 8Krysikiewicz M. Rough set approach to incomplete information system. Inf Sci, 1998, 112:399
  • 9Kohavi R, Frasca B. Useful feature subsets and rough set reducts.In: 3th International Workshop on Rough Sets and Soft Computing. New York, 1994
  • 10尹阿东,宫雨,吴胜利,武森,高学东,李拥军.增量决策树算法及复杂度分析[J].北京科技大学学报,2004,26(2):202-205. 被引量:9

共引文献149

同被引文献23

  • 1李仁璞,黄道.基于RS理论的不完备信息系统处理方法[J].华东理工大学学报(自然科学版),2005,31(2):227-231. 被引量:4
  • 2鄂旭,高学东,武森,张秋月.信息表中不完备数据的填补方法[J].北京科技大学学报,2005,27(3):364-366. 被引量:9
  • 3张葛祥,金炜东,胡来招.基于粗集理论的雷达辐射源信号识别[J].西安交通大学学报,2005,39(8):871-875. 被引量:14
  • 4鄂旭,高学东,喻斌.基于扫描向量的属性约简方法[J].北京科技大学学报,2006,28(6):604-608. 被引量:12
  • 5MOORE R,LODWICK W. Interval analysis and fuzzy set theory[J]. Fuzzy Sets and Systems,2003,135 : 5-9.
  • 6Pawlak Z.Rough sets[J].International Journal of Information and Computer Sciences,1982,11:341-356.
  • 7Chmielewski M R,Grzymala-Busse J W.Global discretization of continuous attributes as preprocessing for machine learning[J].In-ternational Journal of Approximate Reasoning,1996,15(4):319-331.
  • 8Moore R,Lodwick W.Interval analysis and fuzzy set theory[J].Fuzzy Sets and Systems,2003,135:5-9.
  • 9Nguyen H S,Skowron A.Quantization of real values attributes,rough set and boolean reasoning approaches[C]//Proc of the2nd Joint Annual Conf on Information Sci,Wrightsville Beach,NC,USA,1995:34-37.
  • 10王国胤.Rough集理论与知识获取[M].西安交通大学出版社,2003,3..

引证文献4

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部