为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法。将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分...为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法。将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分裂准则变为倾斜的超平面,有效提高算法对数据空间结构的适应能力。自适应权重改进叶子结点类标号计算方法,有效提高算法对不平衡数据的分类能力。实验结果表明,该算法与随机森林算法相比具有更高的分类准确率与较好的不平衡数据分类能力。展开更多
文摘为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法。将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分裂准则变为倾斜的超平面,有效提高算法对数据空间结构的适应能力。自适应权重改进叶子结点类标号计算方法,有效提高算法对不平衡数据的分类能力。实验结果表明,该算法与随机森林算法相比具有更高的分类准确率与较好的不平衡数据分类能力。