摘要
该文对传统的C4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C4.5决策树算法可解释性差、易产生碎片等问题。
出处
《科技创新导报》
2014年第12期40-40,45,共2页
Science and Technology Innovation Herald