为解决随机森林RF(Random Forest)算法预测精度低的问题,提出一种综合改进随机森林算法CIRF(Comprehensive Improvement of Random Forest)。改进算法的核心思想是:在原始样本数据集中进行分区采样;根据因子分析方法计算各个属性在不同...为解决随机森林RF(Random Forest)算法预测精度低的问题,提出一种综合改进随机森林算法CIRF(Comprehensive Improvement of Random Forest)。改进算法的核心思想是:在原始样本数据集中进行分区采样;根据因子分析方法计算各个属性在不同类别上的因子得分;根据因子得分对特征属性进行有权重的选择,构造特征子集;根据信息增益率(GainRatio)最大准则从特征子集种选择节点分裂属性,进行节点分裂;根据加权投票法输出最后的分类结果。改进算法可降低各决策树之间的相关性,提高算法的抗噪能力。将其在Iris、Blood、Yeast等数据集上进行仿真实验,结果表明CIRF算法较原始RF算法有更好的精确度。将其用于预警中国财政风险,结果显示该算法在财政风险中的预警性能很好。展开更多
文摘为解决随机森林RF(Random Forest)算法预测精度低的问题,提出一种综合改进随机森林算法CIRF(Comprehensive Improvement of Random Forest)。改进算法的核心思想是:在原始样本数据集中进行分区采样;根据因子分析方法计算各个属性在不同类别上的因子得分;根据因子得分对特征属性进行有权重的选择,构造特征子集;根据信息增益率(GainRatio)最大准则从特征子集种选择节点分裂属性,进行节点分裂;根据加权投票法输出最后的分类结果。改进算法可降低各决策树之间的相关性,提高算法的抗噪能力。将其在Iris、Blood、Yeast等数据集上进行仿真实验,结果表明CIRF算法较原始RF算法有更好的精确度。将其用于预警中国财政风险,结果显示该算法在财政风险中的预警性能很好。