-
题名基于随机森林的多源小样本数据快速集成方法
- 1
-
-
作者
何昀
张川
张继夫
陈伟
-
机构
空军航空大学
-
出处
《信息与电脑》
2024年第1期52-54,共3页
-
文摘
受多源小样本数据属性复杂性的影响,对其进行集成处理时,过拟合和欠拟合情况较为明显。为此,文章提出基于随机森林的多源小样本数据快速集成方法。考虑多源小样本数据自身的属性特征,在构建随机森林模型阶段,充分利用粒向量与多源小样本数据特征的贴合性,将其作为随机森林的基础结构,利用粒化层归一化多源小样本数据,并将输出的粒化结果作为决策层的节点。在集成阶段,根据多源小样本数据与决策层节点之间的距离,集成数据。在测试结果中,数据集成的过拟合情况占比仅为0.29%,欠拟合情况占比也仅为0.27%,具有良好的集成效果。
-
关键词
随机森林
多源小样本数据
快速集成
属性特征
随机森林模型
-
Keywords
random forest
multi-source small sample data
fast integration
attribute characteristics
random forest model
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-