期刊文献+

基于信息熵的决策属性分类挖掘算法及应用 被引量:18

Algorithm and Application of the Decision Attribute Classification Based on Information Entropy
下载PDF
导出
摘要 在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最佳分类决策属性引出分枝形成判定树。该文对属性的最优分类理论及算法进行了描述,并讨论了选择最佳决策属性构造判定树的算法,结合具体应用实例进行了验证并构造了判定树。 In order to class if y a sample by decision tree,it is necessary to know the classification of attri bute in advance.To the unspecific or unknown attribute classification,you may utilize“High kind gathers,Low coupling”principle to carry on the optimum clas sification to attribute.On the basis of what attribute is classified,based on entropy of the information you can utilize attribute expected information and co rresponding information gain theory to choose the best classified decision attri bute,and according to the best classification decision attribute draw branch,a decision tree is constructed.In this paper,optimum classification theory and algorithm to attribute are described,and the algorithm on how to choose best de cision attribute to construct a decision tree is discussed.At the end,combini ng a concrete example,a decision tree is verified and constructed.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第1期186-189,共4页 Computer Engineering and Applications
关键词 属性 分类 数据挖掘 信息熵 判定树 a ttribute,classification,data mining,information entropy,decision tree
  • 相关文献

参考文献4

二级参考文献16

  • 1王珏,袁小红,石纯一,郝继刚.关于知识表示的讨论[J].计算机学报,1995,18(3):212-224. 被引量:54
  • 2王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量:264
  • 3苗夺谦.Rough Set理论及其在机器学习中的应用研究(博士学位论文)[M].北京:中国科学院自动化研究所,1997..
  • 4陈挺.决策分析[M].北京:科学出版社,1988..
  • 5M.阿佛里耳.非线性规划-分析与方法(上册)[M].上海:上海科学技术出版社,1979..
  • 6王国胤.Rough集理论和知识获取[M].西安:西安交通大学出版社,2001..
  • 7苗夺谦,博士学位论文,1997年
  • 8钱敏平,随机过程引论,1990年
  • 9陈珽,决策分析,1988年
  • 10阿佛里耳 M,非线性规划.分析与方法.上,1979年

共引文献838

同被引文献86

引证文献18

二级引证文献54

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部