期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于随机森林的变量重要性研究 被引量:31
1
作者 曹桃云 《统计与决策》 CSSCI 北大核心 2022年第4期60-63,共4页
对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述... 对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述,并采用数值模拟研究了各种重要性度量的性能,为新方法的设计提供了基础。 展开更多
关键词 随机森林 最小深度 分裂频次 节点纯度 置换重要性
下载PDF
融合光谱和空间特征的土壤重金属含量极端随机树估算 被引量:8
2
作者 于海洋 谢赛飞 +2 位作者 郭灵辉 刘鹏 张平 《农业机械学报》 EI CAS CSCD 北大核心 2022年第8期231-239,共9页
针对高光谱遥感土壤重金属含量估算研究中光谱特征信息弱、模型反演鲁棒性差的问题,提出构建污染源-汇空间特征量化污染物扩散与汇聚空间影响因子,融合光谱特征建立基于极端随机树(Extremely randomized trees,ERT)的土壤重金属含量估... 针对高光谱遥感土壤重金属含量估算研究中光谱特征信息弱、模型反演鲁棒性差的问题,提出构建污染源-汇空间特征量化污染物扩散与汇聚空间影响因子,融合光谱特征建立基于极端随机树(Extremely randomized trees,ERT)的土壤重金属含量估算模型。以济源市耕地土壤为研究区,布设采集土壤样本249个,分析了光谱特征、地形特征和污染源空间特征在土壤重金属铅(Pb)、铬(Cd)含量反演中的有效性及影响机理,采用置换重要性指数优选多源特征,通过与多种回归模型对比,评价ERT模型的预测精度。研究表明,变换后的土壤光谱特征构建ERT模型引入地形特征和污染源空间特征后精度提升显著,尤其是污染源空间特征优势更为明显,Pb的ERT模型均方根误差由43.185 mg/kg下降到22.301 mg/kg,下降了48.36%。Cd的ERT模型均方根误差由0.738 mg/kg下降到0.371 mg/kg,下降了49.73%,充分说明引入污染扩散空间特征的有效性。与其他回归模型对比,ERT估算模型在各项指标评价中优势明显,其中Pb的ERT模型的测试集R^(2)达0.964,Cd的ERT模型R^(2)为0.923。 展开更多
关键词 土壤 重金属 高光谱遥感 空间特征 极端随机树 置换重要性
下载PDF
基于变量筛选的NBA和CBA球员得分研究
3
作者 陈庆 吴玖静 《黄冈师范学院学报》 2024年第5期51-56,共6页
为了提高CBA球员的竞技水平,本文采用线性模型中的LASSO方法以及非线性模型中的随机森林、支撑向量回归、多层感知机,对CBA和NBA球员的得分数据构建了回归模型,其中球员得分为响应变量,解释变量包括出场次数、年龄、两分球命中次数、两... 为了提高CBA球员的竞技水平,本文采用线性模型中的LASSO方法以及非线性模型中的随机森林、支撑向量回归、多层感知机,对CBA和NBA球员的得分数据构建了回归模型,其中球员得分为响应变量,解释变量包括出场次数、年龄、两分球命中次数、两分球命中率、两分球出手次数、三分球命中次数等在内的18个变量。同时利用置换特征重要性指标对各个模型的特征重要性进行排序,筛选出对球员得分具有重要影响的变量为两分球命中次数、罚球出手次数、三分球命中次数、助攻、总篮板、出场次数、失误。此外,文章选取Wilcoxon-Mann-Whitney秩和检验来比较筛选的变量在CBA和NBA中存在显著性差异。并且,通过年龄对比我们发现国内球员的巅峰期短于NBA的球员。 展开更多
关键词 得分 变量筛选 线性模型 非线性模型 置换特征重要性
下载PDF
融合分数阶微分与PIMP-RF算法的集成学习模型预测成熟期苹果可溶性固形物含量
4
作者 黄华 刘亚 +5 位作者 库尔班古丽·都力昆 曾繁琳 玛依热·麦麦提 阿瓦古丽·麦麦提 买地努尔汗·艾则孜 郭俊先 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第10期3059-3066,共8页
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC... 可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC,共552个样本。然后融合分数阶微分(FD)及置换重要性-随机森林(PIMP-RF)算法,构建成熟期苹果SSC预测的集成学习模型。结果表明,基于PLS模型优选的分数阶微分阶次为0阶、0.4阶、1.1阶和1.6阶,且通过PIMP-RF算法进行特征重要性和可解释性分析结果显示,利用可见/近红外光谱预测成熟期苹果SSC的关键波长主要为可见光波段,这为今后研发新疆冰糖心红富士苹果的快速无损检测设备提供参考;基于分数阶微分技术和PIMP-RF算法构建的成熟期苹果SSC集成学习模型具有很好的预测能力,其训练集的相关系数r等于0.9892,平均绝对误差MAE等于0.2412,均方根误差RMSE等于0.3091,平均绝对百分误差等于0.0183;测试集的相关系数r等于0.9038,平均绝对误差MAE等于0.5499,均方根误差RMSE等于0.7408,平均绝对百分误差等于0.0434,相比于FD0-PIMP-RF、FD0.4-PIMP-RF、FD1.1-PIMP-RF和FD1.6-PIMP-RF模型,集成学习模型为最优。故而,集成分数阶微分技术与PIMP-RF算法,结合可见近红外光谱技术可有效地实现成熟期苹果的可溶性固形物含量预测。 展开更多
关键词 可见/近红外光谱 分数阶微分 置换重要性-随机森林 K近邻(KNN)回归 可溶性固形物含量
下载PDF
基于学生化极差分布的随机森林变量选择研究 被引量:4
5
作者 曹桃云 陈敏琼 《统计与信息论坛》 CSSCI 北大核心 2021年第8期15-22,共8页
变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差... 变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差分布进行变量重要性得分差异是否显著的检验。根据检验的结果将变量分组,对分组变量采用逐步回归方法挑选。运用新方法在模拟设计的线性模型、二次函数模型和复杂模型上,都能够选出真正变量,验证了新方法的有效性和可行性。经典的波士顿房价数据上的运用分析给出了新方法的实用性。 展开更多
关键词 学生化极差分布 随机森林 变量选择 最小深度重要性 置换重要性
下载PDF
基于AdaBoost模型的大渡河流域中长期径流预报应用研究 被引量:3
6
作者 李佳 曲田 +2 位作者 朱艳军 陶思铭 胡义明 《水电能源科学》 北大核心 2022年第10期10-13,共4页
以集成学习算法中的AdaBoost模型为基础,开展大渡河流域猴子岩断面未来12个月预见期(最长预见期为12个月)的中长期径流预报研究。先采用置换准确度重要性度量方法筛选各预报月份影响因子,在此基础上采用交叉验证-随机搜索方法进行模型优... 以集成学习算法中的AdaBoost模型为基础,开展大渡河流域猴子岩断面未来12个月预见期(最长预见期为12个月)的中长期径流预报研究。先采用置换准确度重要性度量方法筛选各预报月份影响因子,在此基础上采用交叉验证-随机搜索方法进行模型优化,构建了各预报月份的中长期径流预报模型。通过逐月滚动建模及滚动预报的方式评估模型在不同预见期及不同月份的真实预报效果。结果表明,不同预见期(1~12月)条件下,模型预报系列与实测系列的相关系数均大于0.9,模型具有较高的预报精度。就不同预见期预报精度的综合结果来看,1~6、8~10、12月的预报精度均大于80%;7、11月的预报精度在75%左右。2018年1~12月和2020年10月至2021年9月共12个不同预见期的平均预报精度分别为85.7%、85.1%。从中长期精度预报角度而言,模型具有较好的实用精度要求,可为流域水资源精准调配和发电效益的提高提供支撑。 展开更多
关键词 ADABOOST 置换准确度重要性度量 随机搜索方法 中长期径流预报 大渡河流域
下载PDF
基于隔离森林-MLP的输变电工程量智能评估方法 被引量:3
7
作者 张波 杨轶涵 +1 位作者 胡锡燎 姜霓裳 《浙江电力》 2023年第8期60-67,共8页
为了进行输变电工程中目标工程量的评估,提出基于隔离森林-MLP(多层感知机)的工程量智能评估方法。运用皮尔逊相关系数和置换特征重要性算法,对各工程量与相关技术类特征的关系进行了探究和特征筛选。在此基础上,提出一种基于隔离森林... 为了进行输变电工程中目标工程量的评估,提出基于隔离森林-MLP(多层感知机)的工程量智能评估方法。运用皮尔逊相关系数和置换特征重要性算法,对各工程量与相关技术类特征的关系进行了探究和特征筛选。在此基础上,提出一种基于隔离森林的数据合理性筛选方法,利用5年的历史数据训练基于MLP的神经网络预测模型,并在测试集上验证了利用所提方法进行工程量评估的准确性。算例仿真表明,所提特征筛选方法可以提升神经网络的评估精度,同时所提方法可以给出工程量合理性的粗估计与智能评估。该评估方法可用于自动化评估工程量合理性,促进电网基建数字化转型。 展开更多
关键词 输变电工程量 合理性阈值 隔离森林 多层感知机网络 皮尔逊相关性 岭回归 置换特征重要性 自动化评估
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部