摘要
随机森林为集合算法中最为经典的模型之一,利用多棵并行独立的决策树投票分类。随机森林使用有放回采样方法,随机采样若干个样本集合,针对这些样本集合构造若干个决策树。由于采样过程和决策树属性选择具有随机性,随机森林较好地解决了决策树的过拟合问题。不过随机森林算法中每颗决策树都是一样的权重,这显然不合理。包外误差作为衡量模型泛化误差的指标,利用包外误差赋予每颗决策树不一样的权重解决信用卡欺诈问题。经实验证明,提出的算法精确度提高,是更为有效的算法。
出处
《电脑编程技巧与维护》
2021年第4期111-112,117,共3页
Computer Programming Skills & Maintenance