-
题名基于赤池信息准则的分类回归决策树剪枝算法
被引量:10
- 1
-
-
作者
杨贵军
孟杰
王双喜
-
机构
天津财经大学中国经济统计研究中心
中国农业银行股份有限公司郑州二七支行
-
出处
《计算机应用》
CSCD
北大核心
2014年第A02期147-150,共4页
-
基金
国家社科基金资助重大项目(09&ZD040)
国家自然科学基金资助面上项目(11471239)
天津财经大学研究生科研基金资助项目(2014TCB02)
-
文摘
决策树剪枝可以提高决策树的分类准确度。代价复杂度剪枝(CCP)等常用的剪枝算法,都以降低决策树的误判率作为剪枝依据。引入赤池信息准则(AIC)评价决策树的优良性,并提出了基于AIC的决策树剪枝算法,将分类正确概率和复杂度的综合评价作为剪枝依据。通过实例分析,基于AIC的剪枝算法能够得到高分类准确度的决策树,并没有出现过拟合或剪枝不充足等问题。
-
关键词
赤池信息准则
代价复杂度剪枝
LOGISTIC回归
决策树剪枝
-
Keywords
Akaike Information Criterion (AIC)
cost-complexity pruning (ccp)
Logistic regression
decision tree pruning
-
分类号
TP311.11
[自动化与计算机技术—计算机软件与理论]
-
-
题名决策树C4.5算法改进与应用
被引量:10
- 2
-
-
作者
陈杰
邬春学
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《软件导刊》
2018年第10期88-92,共5页
-
基金
上海市科学计划项目(16111107502
17511107203)
-
文摘
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。
-
关键词
C4.5
TM
-C4.5算法
ccp
贝叶斯分类器
剪枝策略
评价标准
-
Keywords
C4.5
TM -C4.5 algorithm
ccp
Bayesian classifier
pruning strategy
evaluation standard
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-