摘要
决策树是数据挖掘中的一个重要算法。文中首先介绍了决策树的生成思想,和生成过程中关于多值属性的分离问题。基尼指数是多值属性分离的一种方法,文中详细介绍了基尼指数作为一种不纯度分裂方法的原理,并通过一个分别用两种方式进行基尼分裂的实例。最后参阅国内外文献将基尼指数与其他一些算法如信息增益、χ2统计作了比较来说明其在多值属性分裂时的一些优点和缺点。
Decision Tree plays an important role in data mining.Firstly,introduce how the Decision Tree grows,then present how to use the Gini-Index for multi-attribute selection in Decision Tree,and introduce some other attribute selection methods.And give a test though the two different ways of Gini-Index.Compare the Gini-Index with Information Gain and χ2 statistic at home and abroad.
出处
《微机发展》
2004年第5期66-68,共3页
Microcomputer Development