期刊文献+

基于Boosting算法的C5.0决策树不平衡数据分类算法 被引量:1

Boosting-based C5.0 Decision Tree Algorithm for Imbalanced Data Classification Problem
下载PDF
导出
摘要 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. To improve the impact of imbalanced data on classification performance,an ensemble C5.0 decision tree algorithm which can automatically determine the value of the iterative parameter trail is proposed.Firstly,the boosting ensemble framework is introduced into the C5.0 decision tree algorithm to generate a new ensemble algorithm B-C5.0.Secondly,the grid search algorithm is used to search the optimal trail parameter.The experimental results show that the algorithm has advantages in the classification performance index G-mean and MCC on imbalanced data.
作者 王植 张珏 WANG Zhi;ZHANG Jue(Xi’an Aeronautical Polytechnic Institute,Xi’an 710089,China;College of Information Engineering,Yulin University,Yulin 719000,Shaanxi China)
出处 《河南科学》 2023年第1期7-12,共6页 Henan Science
基金 陕西省科技计划一般项目(2020NY-163) 榆林市高新区科技计划项目(CXY-2021-30,CXY-2021-44) 榆林市科技计划项目(CXY-2022-66)。
关键词 类不平衡问题 集成算法 C5.0决策树算法 网格搜索算法 class imbalance problem ensemble algorithm C5.0 decision tree grid search algorithm
  • 相关文献

参考文献9

二级参考文献58

共引文献277

同被引文献14

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部