期刊文献+

基于先验信息的决策树算法研究

下载PDF
导出
摘要 分类是机器学习中最常见的决策问题,但实际应用中,分类过程却面临着数据类别信息量不均衡的问题,即不平衡问题。决策树作为分类问题中应用最广泛的算法,对不平衡数据中少数类的识别率较低。为提高决策树在不平衡数据上的分类效果,论文在香农熵的基础上提出了一种基于先验信息的比例先验熵,修正了传统香农熵在类别均等分布时取最大熵值,从而导致处理不平衡问题时会出现分类效果差的问题。进一步地,基于CART算法框架构建了一种使用比例先验熵作为不纯性度量的决策树算法。试验结果表明,基于比例先验熵的决策树比基于香农熵的决策树在不平衡数据上有更好的分类效果。除了分类效果的优势,基于比例先验熵的决策树在模型算法效率方面也优于基于香农熵的决策树。
作者 焦纾然
出处 《信息系统工程》 2021年第3期90-91,94,共3页
  • 相关文献

参考文献2

二级参考文献3

  • 1谢纪刚,裘正定.非平衡数据集Fisher线性判别模型[J].北京交通大学学报,2006,30(5):15-18. 被引量:15
  • 2Foster Provost,Tom Fawcett. Robust Classification for Imprecise Environments[J] 2001,Machine Learning(3):203~231
  • 3Miroslav Kubat,Robert C. Holte,Stan Matwin. Machine Learning for the Detection of Oil Spills in Satellite Radar Images[J] 1998,Machine Learning(2-3):195~215

共引文献73

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部