-
题名基于属性间交互信息的预剪枝ID3算法
被引量:1
- 1
-
-
作者
韩义亭
王力
刘小军
张成宇
-
机构
贵州大学电子科学与信息技术学院
中国矿业大学(北京)资源与安全工程学院
-
出处
《贵州大学学报(自然科学版)》
2008年第5期494-497,共4页
-
文摘
ID3算法是决策树归纳中普遍而有效的启发式算法。本文针对ID3算法的不足,给出了一个改进版本,它在选择测试属性时不仅要求该属性和类的交互信息较大,而且要求和祖先结点使用过的属性之间的交互性息尽可能小,从而避免了对冗余属性的选择,实现信息熵的真正减少。在生成树的过程中,设定分类阈值,对树进行剪枝,以避免数据子集过小,使进一步划分失去统计意义。实验结果表明,该算法能构造出比ID3算法更优的决策树。
-
关键词
id3交互信息
预剪枝
-
Keywords
id3 mutual
information
pre-pruning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-