期刊文献+
共找到102篇文章
< 1 2 6 >
每页显示 20 50 100
哪些因素对流动人口落户意愿的影响更大?——基于随机森林的变量重要性排序
1
作者 黄造玉 徐晓新 李升 《中国软科学》 CSCD 北大核心 2023年第4期76-85,共10页
准确理解流动人口落户意愿的影响因素,对于科学制定我国人口和城镇化政策具有重要意义。基于2017年全国流动人口动态监测数据,以随机森林模型和平均不纯净度降低方法系统评估了影响流动人口落户意愿的多维因素。研究发现:对落户意愿影... 准确理解流动人口落户意愿的影响因素,对于科学制定我国人口和城镇化政策具有重要意义。基于2017年全国流动人口动态监测数据,以随机森林模型和平均不纯净度降低方法系统评估了影响流动人口落户意愿的多维因素。研究发现:对落户意愿影响最大的是流动人口想融入流入地的希望和可以在流入地生活下去的能力。具体而言,按重要性排序,第一梯队是社会心理融合因素;第二梯队是经济、住房和户籍因素;第三梯队则是流动特征、个体、地区、工作、制度融合和社会关系融合因素。总体而言,所有单一变量的影响都是非常有限的。这表明,流动人口落户意愿的影响因素是高度多元的。因此,推动流动人口落户和市民化需要系统综合的政策设计。 展开更多
关键词 落户意愿 流动人口 随机森林 变量重要性 主体功能区
下载PDF
变量重要性-反向传播人工神经网络辅助激光诱导击穿光谱测定铁矿石中硅、铝、钙和镁含量
2
作者 刘曙 金悦 +3 位作者 苏飘 闵红 安雅睿 吴晓红 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第10期3132-3142,共11页
快速准确测定铁矿石中的硅、铝、钙、镁含量对铁矿石质量评价具有重要作用。受制于多变量分析方法过拟合现象以及不同种类样品基体效应,使用激光诱导击穿光谱(LIBS)准确测定铁矿石中硅、铝、钙、镁含量仍然是当前存在的挑战。采用变量... 快速准确测定铁矿石中的硅、铝、钙、镁含量对铁矿石质量评价具有重要作用。受制于多变量分析方法过拟合现象以及不同种类样品基体效应,使用激光诱导击穿光谱(LIBS)准确测定铁矿石中硅、铝、钙、镁含量仍然是当前存在的挑战。采用变量重要性-反向传播人工神经网络(VI-BP-ANN)辅助LIBS定量分析铁矿石中硅(以SiO_(2)计)、铝(以Al_(2)O_(3)计)、钙(以CaO计)和镁(以MgO计)的含量。在这项研究中,收集了12种244批铁矿石代表性样品的LIBS光谱,优化了光谱预处理方法,使用随机森林(RF)对LIBS光谱特征的重要性进行了测量,使用袋外(OOB)误差优化RF模型参数,变量重要性阈值用于优化BP-ANN校准模型的输入变量。变量重要性阈值和神经元数量通过五折交叉验证(5-CV)的测定系数(R^(2))和均方根误差(RMSE)进行优化。结果显示测试样本SiO_(2)、Al_(2)O_(3)、CaO和MgO含量预测均方根误差(RMSEP)分别为0.3772 wt%、0.1339 wt%、0.0592 wt%和0.1411 wt%,R^(2)分别为0.9701、0.9554、0.9871、0.9975。相比于使用相同的预处理方法作为PLS、SVM、RF和BP-ANN四种模型的输入,VI-BP-ANN在校准集和预测集都显示出出色的预测能力。结果表明LIBS与VI-BP-ANN的结合有潜力在实际应用中实现铁矿石硅、铝、钙、镁含量的快速准确预测。 展开更多
关键词 铁矿石 反向传播人工神经网络 变量重要性 定量分析 激光诱导击穿光谱
下载PDF
基于变量重要性评分-随机森林的溶解氧预测模型——以深圳湾为例 被引量:6
3
作者 杨明悦 毛献忠 《中国环境科学》 EI CAS CSCD 北大核心 2022年第8期3876-3881,共6页
运用Pearson相关性分析,变量重要性评分和随机森林方法构建了溶解氧(DO)实时预测模型,并以深圳湾为例采用浮标资料预测1,3,6和12h的溶解氧.模型预测结果表明,模型最优的输入条件为pH值,水温,叶绿素a,氧化还原电位和蓝绿藻5个水质指标,1... 运用Pearson相关性分析,变量重要性评分和随机森林方法构建了溶解氧(DO)实时预测模型,并以深圳湾为例采用浮标资料预测1,3,6和12h的溶解氧.模型预测结果表明,模型最优的输入条件为pH值,水温,叶绿素a,氧化还原电位和蓝绿藻5个水质指标,1h预报的相关系数在0.9以上,6h预报结果一定程度上可以满足工程要求,但对低溶解氧事件的预报必须在3h以内. 展开更多
关键词 溶解氧 预测模型 变量重要性评分 随机森林
下载PDF
基于变量重要性和偏最小二乘的近红外特征筛选方法研究 被引量:2
4
作者 黄新 刘伟平 《湖南城市学院学报(自然科学版)》 CAS 2021年第6期50-54,共5页
近红外光谱数据高度线性相关且含有大量的冗余信息.通过选择重要的特征变量代替全谱变量,能够有效提高近红外模型的预测精度.本文将变量重要性融入到偏最小二乘回归中,提出了一种新的基于变量重要性的偏最小二乘特征变量筛选方法(VISPL... 近红外光谱数据高度线性相关且含有大量的冗余信息.通过选择重要的特征变量代替全谱变量,能够有效提高近红外模型的预测精度.本文将变量重要性融入到偏最小二乘回归中,提出了一种新的基于变量重要性的偏最小二乘特征变量筛选方法(VISPLS),它是基于变量重要性的前向迭代算法.通过选择斯皮尔曼(Spearman)相关系数、肯德尔(Kendall)相关系数、选择性比(selectivity ratio,SR)和投影变量重要性(variable importance in projection,VIP)4个指标来度量近红外光谱变量的重要性,并用2个真实的近红外光谱数据集来评估VISPLS的性能.研究结果表明,与SpearmanPLS,KendallPLS和SRPLS这3种算法比较,VIPPLS算法有更好的预测性能. 展开更多
关键词 近红外 偏最小二乘 变量重要性 特征筛选
下载PDF
老年人幸福感影响因素的重要性评估与城乡差异分析
5
作者 王珺 孙国晓 +1 位作者 王奕文 陈述凤 《人口与发展》 北大核心 2024年第3期144-160,共17页
人口老龄化已经成为我国长期应对的社会问题,保障好、实现好老年人美好生活水平,提升老年人幸福感是我国民生领域的重要工作之一。基于我国城乡二元结构,采用2021年中国综合社会调查(CGSS2021)数据库,融合随机森林模型与夏普利值分解方... 人口老龄化已经成为我国长期应对的社会问题,保障好、实现好老年人美好生活水平,提升老年人幸福感是我国民生领域的重要工作之一。基于我国城乡二元结构,采用2021年中国综合社会调查(CGSS2021)数据库,融合随机森林模型与夏普利值分解方法,并结合有序Logistic回归,分析中国老年人幸福感影响因素的重要性程度与城乡差异。研究发现:中国老年人的幸福感整体较高,年龄、婚姻状态、自评健康、家庭社会经济地位、社会公平感、普遍信任是影响老年人幸福感的普适性重要因素;居住地区、家用汽车、子女数量、听音乐是影响乡村老年人幸福感的特殊性重要因素,政治面貌、普通话水平、体育锻炼是影响城市老年人幸福感的特殊性重要因素。研究结论为提升老年人福祉的政策优先级提供数据支撑,为老年人幸福感的差异化、针对性干预与促进策略提供理论指导,有助于促进城乡精神健康公平、全面落实积极老龄化战略。 展开更多
关键词 老年人 幸福感 变量重要性评估 城乡差异
下载PDF
利用变量投影重要性准则筛选郁闭度估测参数 被引量:18
6
作者 曾涛 琚存勇 +2 位作者 蔡体久 刘文彬 姚月锋 《北京林业大学学报》 CAS CSCD 北大核心 2010年第6期37-41,共5页
基于森林一类调查数据和相应的遥感影像数据,比较了基于变量投影重要性(VIP)准则与Bootstrap准则所选变量对模型预报精度的影响;利用基于VIP准则所选变量构建偏最小二乘回归模型,并估测了黑龙江省北部塔河地区森林郁闭度情况。结果表明... 基于森林一类调查数据和相应的遥感影像数据,比较了基于变量投影重要性(VIP)准则与Bootstrap准则所选变量对模型预报精度的影响;利用基于VIP准则所选变量构建偏最小二乘回归模型,并估测了黑龙江省北部塔河地区森林郁闭度情况。结果表明:利用VIP准则所选变量都能通过Bootstrap非参数检验(α=0.05);利用这些最优变量建立的偏最小二乘回归模型取得了不低于全模型和Bootstrap模型的精度,前者的相对均方误差分别是后两者的99.2%和99.6%,并且提高了样地或像素水平的估测精度和效率。 展开更多
关键词 变量投影重要性 偏最小二乘回归模型 遥感影像 Bootstrap检验
下载PDF
分类预测中变量相对重要性的度量 被引量:2
7
作者 高峰 姚新武 《统计与决策》 CSSCI 北大核心 2018年第7期80-84,共5页
进行分类预测时,研究人员往往也想要知道预测变量对模型构建的相对重要性。此时,常见的动因分析方法(譬如多元回归)要么不适用,要么因复杂而难以应用,因为预测变量经常是混杂了名义、次序、连续型尺度被测量的。文章运用起源于合作博... 进行分类预测时,研究人员往往也想要知道预测变量对模型构建的相对重要性。此时,常见的动因分析方法(譬如多元回归)要么不适用,要么因复杂而难以应用,因为预测变量经常是混杂了名义、次序、连续型尺度被测量的。文章运用起源于合作博弈论的Shapley值法,开创性地通过分解与每一个预测变量相关的预测准确度(即正判率)来度量它们的相对重要性,从而避免额外引入某种动因分析方法。原理陈述和实例验证都表明,该方法本身易于理解,其结果具有解释性和有效性。 展开更多
关键词 预测准确度 变量重要性 Shapley值分解 净效应
下载PDF
智能配电网指标的精确预测模型及工具
8
作者 王哲 杨馨淼 +3 位作者 迟福建 张雪菲 张媛 吴倩 《电器工业》 2024年第3期30-35,44,共7页
针对智能配电网指标预测精确性不高的问题,提出智能配电网指标精确预测模型工具。在确定智能配电网指标评价的基础上,先采用专家法和鱼骨图模型对其内外部多个维度进行数据挖掘;再使用偏最小二乘法-变量投影重要性分析法计算各影响因素... 针对智能配电网指标预测精确性不高的问题,提出智能配电网指标精确预测模型工具。在确定智能配电网指标评价的基础上,先采用专家法和鱼骨图模型对其内外部多个维度进行数据挖掘;再使用偏最小二乘法-变量投影重要性分析法计算各影响因素的VIP值以准确衡量其对指标影响程度,实现影响因素的降维;接着建立基于系统动力学模型的仿真模型,设置边界条件、进行变量分析,计算指标的预测值并使用历史大数据对预测结果的正确性和精确性进行验证;模型得到验证后,便可对指标进行未来年份的预测。最后通过案例证明所提方法的有效性。 展开更多
关键词 指标精确预测 鱼骨图 偏最小二乘法-变量投影重要性分析法 系统动力学模型
下载PDF
一种顺序响应的随机森林:变量预测和选择 被引量:6
9
作者 吴辰文 梁靖涵 +1 位作者 王伟 李长生 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1762-1766,共5页
利用随机森林法(RF)进行分类和回归,在过去被广泛地研究,然而在基于顺序响应的情况下并没有标准的方法.在随机森林(RF)的基础上通过广泛的研究,对条件推理树进行探索,以探讨结合顺序信息是否改善预测性能或提高变量选择的效果.本文提出... 利用随机森林法(RF)进行分类和回归,在过去被广泛地研究,然而在基于顺序响应的情况下并没有标准的方法.在随机森林(RF)的基础上通过广泛的研究,对条件推理树进行探索,以探讨结合顺序信息是否改善预测性能或提高变量选择的效果.本文提出的两种置换变量的重要性预测方法 RPS-VIM和MAE-VIM经过实验验证是优化的方法,它替代目前存在的内置变量重要性测量方法 ER-VIM和MSE-VIM.基于真实数据的结果表明在某些设置中,有序回归树中使用RPS-VIM和MAEVIM顺序响应的组合,预测的排名可以得到改善,并且预测精度优于原始的基于分类树的随机森林. 展开更多
关键词 随机森林(RF) 有序回归树 顺序响应 特征选择 变量重要性
下载PDF
一种基于Adaboost和变量筛选的LSSVM工程造价估计方法 被引量:4
10
作者 黄文涛 周萍 程锦翔 《重庆交通大学学报(自然科学版)》 CAS 北大核心 2016年第3期54-57,104,共5页
为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用... 为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。 展开更多
关键词 道路工程 工程造价 自适应提升法 变量投影重要性指标 最小二乘支持向量机
下载PDF
不同贮藏时间即食燕窝特征风味成分分析
11
作者 林园 张小江 +3 位作者 柳训才 黄玉容 熊雅婷 王健 《中国食品学报》 EI CAS CSCD 北大核心 2024年第4期398-410,共13页
为探究不同贮藏时间即食燕窝的风味特征,采用气相色谱-离子迁移谱(GC-IMS)对5个贮藏时间市售即食燕窝的挥发性有机物进行差异分析。结果表明,不同贮藏时间即食燕窝的挥发性成分存在显著差异(P<0.05),共鉴定出44个挥发性有机物(包含... 为探究不同贮藏时间即食燕窝的风味特征,采用气相色谱-离子迁移谱(GC-IMS)对5个贮藏时间市售即食燕窝的挥发性有机物进行差异分析。结果表明,不同贮藏时间即食燕窝的挥发性成分存在显著差异(P<0.05),共鉴定出44个挥发性有机物(包含单聚体和二聚体),主要为醛和酯类。主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)能有效判别5个贮藏时间的即食燕窝。依据PLS-DA模型的变量投影重要性分析值(VIP)和指纹图谱结合层次聚类分析,最终筛选出12个(VIP>1)特征挥发性物质,分别为乙酸(单聚体和二聚体)、(Z)-4-庚烯醛、2-丁酮(单聚体)、3-甲基-3-丁烯-1-醇、庚醛、乙酸乙酯(二聚体)、乙酸丙酯(单聚体)、戊醛、丁醛、丙酸乙酯(单聚体和二聚体)。通过这些特征化合物可以较好地判别不同贮藏时间的即食燕窝样品。 展开更多
关键词 气相色谱-离子迁移谱 即食燕窝 主成分分析 偏最小二乘-判别分析 变量投影重要性分析值
下载PDF
基于改进遗传算法的区间光谱特征波长变量选择方法 被引量:9
12
作者 刘鑫 冒智康 +2 位作者 张小鸣 李绍稳 金秀 《江苏大学学报(自然科学版)》 EI CAS 北大核心 2020年第3期321-327,共7页
为提高土壤养分近红外光谱预测模型的鲁棒性和预测精度,提出一种基于改进遗传算法的近红外区间光谱特征波长变量选择方法.利用土壤速效磷近红外光谱全光谱波长变量纯度梯度的正负变化次数将全光谱划分为多个波长间隔,以偏最小二乘回归模... 为提高土壤养分近红外光谱预测模型的鲁棒性和预测精度,提出一种基于改进遗传算法的近红外区间光谱特征波长变量选择方法.利用土壤速效磷近红外光谱全光谱波长变量纯度梯度的正负变化次数将全光谱划分为多个波长间隔,以偏最小二乘回归模型(PLS-R)输出的变量投影重要性系数(VVIP)大于1作为提取准则,提取对土壤养分预测目标量解释性较强的波长间隔,并合并成一个区间光谱.建立区间光谱特征波长变量(FWV)PLS-R模型,利用改进遗传算法选择PLS-R的均方根误差为最小对应的FWV为最优FWV.试验结果表明:该方法在区间光谱选择最优FWV,能提高回归模型的鲁棒性和预测精度,简化模型结构;改进遗传算法采用一种改进的实数编码差分变异算子,扩大了全局最优解搜索空间,提高了收敛速度. 展开更多
关键词 近红外光谱 区间光谱 特征波长变量 变量投影重要性系数 偏最小二乘回归模型
下载PDF
基于变量筛选的烟气流量软测量研究 被引量:2
13
作者 佟纯涛 金秀章 郝兆平 《电力科学与工程》 2016年第5期49-54,共6页
为了解决烟气流量主要依靠硬件传感器测量,高温腐蚀使得传感器损坏,烟气湍流、紊流现象的存在,使得测量不准确等问题,提出一种基于投影重要性分析和前向搜索筛选辅助变量,使用支持向量机建模的软测量方法,测量SCR反应器入口烟气流量。... 为了解决烟气流量主要依靠硬件传感器测量,高温腐蚀使得传感器损坏,烟气湍流、紊流现象的存在,使得测量不准确等问题,提出一种基于投影重要性分析和前向搜索筛选辅助变量,使用支持向量机建模的软测量方法,测量SCR反应器入口烟气流量。以电厂阵列式传感器测量出的烟气流量作标准,使用最小二乘支持向量机方法建立模型预测输出,对比投影重要性分析筛选辅助变量和不筛选变量结果表明,投影重要性分析和前向搜索筛选辅助变量的方法对建模有较好优势,能够减小系统结构,增加软测量建模的泛化能力。 展开更多
关键词 烟气流量 最小二乘支持向量机 软测量 变量投影重要性分析 前向搜索
下载PDF
集成学习方法的应用与比较 被引量:1
14
作者 成佩 孟勇 《统计与决策》 北大核心 2023年第23期28-33,共6页
文章基于决策树及装袋法、随机森林和梯度提升树三种集成学习方法,分别对商业车险和交强险的累积索赔额建立预测模型,通过综合平均误差和稳定性评价指标对比不同模型的预测效果。结果表明,在所有数据集上,梯度提升树模型均有较强的预测... 文章基于决策树及装袋法、随机森林和梯度提升树三种集成学习方法,分别对商业车险和交强险的累积索赔额建立预测模型,通过综合平均误差和稳定性评价指标对比不同模型的预测效果。结果表明,在所有数据集上,梯度提升树模型均有较强的预测能力和较高的稳定性,进一步利用该最优预测模型有效证明了影响不同险种的重要风险变量排序不同,同一风险变量对不同险种的影响效应也不同。 展开更多
关键词 集成学习 梯度提升树 汽车保险 风险变量重要性
下载PDF
C语言中变量的理解
15
作者 潘莉 《福建电脑》 2011年第3期59-59,72,共2页
在很多高级语言的基础语法中都有变量这一概念。对于计算机语言初学者,这是一个看似简单实则很难理解的概念。本文从变量概念的定义、理解、分类等做了介绍。
关键词 C语言 变量 变量重要性
下载PDF
基于MC-UVE-VIP两步波长筛选实现近红外光谱模型的无标样传递
16
作者 张站鸽 倪力军 +1 位作者 张立国 栾绍嵘 《分析测试学报》 CAS CSCD 北大核心 2023年第2期204-209,共6页
该文将蒙特卡洛-无变量信息消除(MC-UVE)算法和变量重要性投影(VIP)算法结合,挑选出重要、有信息的波长变量,建立了MC-UVE-VIP两步波长筛选方法。该法首先采用MC-UVE筛选出稳定性参数大于某一阈值(Mthreshold)的有信息波长集合U_(UVE),... 该文将蒙特卡洛-无变量信息消除(MC-UVE)算法和变量重要性投影(VIP)算法结合,挑选出重要、有信息的波长变量,建立了MC-UVE-VIP两步波长筛选方法。该法首先采用MC-UVE筛选出稳定性参数大于某一阈值(Mthreshold)的有信息波长集合U_(UVE),然后采用VIP算法从U_(UVE)中筛选出VIP参数大于U_(UVE)中所有波长VIP均值的波长,作为重要、有信息的波长集合U_(UVE)-VIP。基于U_(UVE)-VIP建立玉米中蛋白质含量的偏最小二乘回归(PLSR)近红外光谱预测模型,模型的潜变量个数根据累计贡献率大于99.9%确定。该模型变量少、稳健、可解释性强、运算速度快,其预测两台从机样品蛋白质的平均相对误差(MARE)分别为1.64%与1.88%,均小于MC-UVE模型的从机MARE(5.40%与5.19%)和VIP模型的从机MARE(6.23%与7.16%)。因此,基于MC-UVE-VIP两步波长筛选法所建立的玉米蛋白质含量近红外光谱模型可直接传递到从机,无需进行模型或从机光谱校正。该模型传递性能优于单纯基于MC-UVE或VIP算法筛选波长所建模型及全波长模型。 展开更多
关键词 两步波长筛选 蒙特卡洛-无变量信息消除(MC-UVE) 变量重要性投影(VIP) 无标样模型转移 玉米蛋白质含量预测
下载PDF
基于气相色谱-离子迁移谱结合多元统计方法分析辣椒品种对辣椒油理化性质和风味物质的影响 被引量:4
17
作者 杨芳 袁海彬 +2 位作者 贾洪锋 邓凤琳 王珍妮 《食品与发酵工业》 CAS CSCD 北大核心 2023年第19期319-328,共10页
该研究对5种不同品种辣椒(子弹头、龙脊椒、涮涮辣、七星椒、干线椒)制成的辣椒油(分别编号为PZ1、PZ2、PZ3、PZ4、PZ5)中辣椒素类物质含量、色差、过氧化值、挥发性有机化合物(volatile organic compounds,VOCs)的影响,并结合多元统计... 该研究对5种不同品种辣椒(子弹头、龙脊椒、涮涮辣、七星椒、干线椒)制成的辣椒油(分别编号为PZ1、PZ2、PZ3、PZ4、PZ5)中辣椒素类物质含量、色差、过氧化值、挥发性有机化合物(volatile organic compounds,VOCs)的影响,并结合多元统计方法分析5种辣椒油之间的关键差异标志物。结果表明,PZ3的辣椒素含量、辣度、亮度、黄度均最高,过氧化值最低且与其余样品间有显著性差异(P<0.05);经气相色谱-离子迁移谱(gas chromatography-ion mobility spectrometry,GC-IMS)共分离鉴定出73种VOCs,包括醛类、酯类、酮类、醇类、杂环类、羧酸类、硫醚类,分别有19、18、12、12、6、4、2种;GC-IMS二维差异图、指纹图谱及主成分分析结果一致,PZ3风味最为独特,PZ5和PZ4次之,PZ1和PZ2风味接近;通过偏最小二乘-判别分析发现,PZ3的特征香气物质主要为酯类,包括异戊酸己酯-D、异丁酸己酯、己酸异戊酯、丁酸己酯-D等;通过变量重要性投影分析,筛选出5种辣椒油的26种差异标志物,包括乙酸乙酯、异戊酸己酯、二乙醇缩乙醛、乙酸-D、己醛-D、二甲基硫醚、3-甲基丁醛、二氢-2(3 H)-呋喃酮、1-羟基-2-丙酮-D、丙酮、丁酸-M等,其中异戊酸己酯、丁酸己酯-M、糠醇-M、己酸异戊酯-M、乙酸-D、3-甲基丁醛、戊醛-D等物质在第1主成分的载荷值较大;丙酸乙酯、3-甲基-1-丁醇、乙酸乙酯、丁醛、二乙醇缩乙醛等在第2主成分上的载荷较大。 展开更多
关键词 辣椒油 气相色谱-离子迁移谱 辣椒素 挥发性风味物质 偏最小二乘-判别分析 变量重要性投影
下载PDF
利用CARS算法联合协变量估算盐碱农田土壤水分和有机质含量
18
作者 丁启东 王怡婧 +2 位作者 张俊华 贾科利 黄华雨 《应用生态学报》 CAS CSCD 北大核心 2024年第5期1321-1330,共10页
快速获取土壤含水率(SMC)和土壤有机质(SOM)含量对于盐碱农田土壤的改良利用至关重要。本研究基于河套平原农田土壤野外高光谱反射率和土壤属性实测数据,对原始光谱反射率(Ref)进行标准正态变量(SNV)转换后,采用竞争性自适应重加权采样... 快速获取土壤含水率(SMC)和土壤有机质(SOM)含量对于盐碱农田土壤的改良利用至关重要。本研究基于河套平原农田土壤野外高光谱反射率和土壤属性实测数据,对原始光谱反射率(Ref)进行标准正态变量(SNV)转换后,采用竞争性自适应重加权采样算法(CARS)筛选敏感波段,然后分别以Ref、Ref-SNV和Ref-SNV+土壤协变量(SC)及数字高程模型(DEM)作为建模输入变量的策略Ⅰ、Ⅱ和Ⅲ,基于随机森林(RF)和轻梯度提升机(LightGBM)建立SMC和SOM估算模型,并对模型精度进行验证和对比。结果表明:经CARS筛选后,SMC和SOM敏感波段压缩至全波段的3.3%以下,有效优化波段选择,减少了冗余光谱信息。与LightGBM模型相比,RF模型在SMC和SOM估算中精度更高,输入变量策略Ⅲ优于Ⅱ和Ⅰ,辅助变量的引入有效提升了模型的估算能力。综合分析,基于策略Ⅲ-RF的SMC估算模型验证决定系数(R_(p)~2)、均方根误差(RMSE)和相对分析误差(RPD)分别为0.63、3.16和2.01,基于策略Ⅲ-RF的SOM估算模型R_(p)~2、RMSE和RPD分别为0.93、1.15和3.52,策略Ⅲ-RF模型是估算土壤水分和土壤有机质的有效方法。研究结论可为盐碱农田土壤水分和有机质含量快速估算提供新方法。 展开更多
关键词 高光谱 遥感 土壤协变量 变量重要性投影 随机森林 轻梯度提升机 反距离权重法
原文传递
基于随机森林回归算法的回采工作面瓦斯涌出量预测
19
作者 张增辉 马文伟 《工矿自动化》 CSCD 北大核心 2023年第12期33-39,共7页
回采工作面是矿井瓦斯涌出的主要场所,精准预测回采工作面的瓦斯涌出量,进而有针对性地提出防治措施,对保证矿井安全生产具有重要意义。提出了基于随机森林回归算法的回采工作面瓦斯涌出量预测方法。以工作面实测瓦斯涌出量数据为原始样... 回采工作面是矿井瓦斯涌出的主要场所,精准预测回采工作面的瓦斯涌出量,进而有针对性地提出防治措施,对保证矿井安全生产具有重要意义。提出了基于随机森林回归算法的回采工作面瓦斯涌出量预测方法。以工作面实测瓦斯涌出量数据为原始样本,利用Bootstrap抽样方法进行随机抽样,以袋外数据(OOB)评估分数oob_score作为随机森林回归模型调参、特征变量重要性的评判指标,计算得出模型的最佳参数、特征变量重要性占比。对各特征变量的重要性占比进行排序,并按排序进行随机森林回归模型性能分析,结果表明:随着特征变量数的增加,模型性能不会呈现规律性的变化;当特征变量数较少时,可能存在过拟合的情况。测试结果表明,所创建的随机森林回归模型预测值与实测值的平均绝对误差、平均相对误差随着特征变量数的增加呈下降趋势,特征变量数的增加可在一定程度上提高模型的预测效果。针对同一组数据,与主成分回归分析法相比,随机森林回归模型平均相对误差降低了14.29%,预测效果更好,且原理更简单、调参更容易、计算速度更快,能够为矿井回采工作面瓦斯涌出量预测提供有力的理论支撑。 展开更多
关键词 回采工作面 瓦斯涌出量预测 随机森林回归 袋外数据评估分数 特征变量重要性 特征变量
下载PDF
SRF-LDA:基于堆叠集成学习的LncRNA与疾病关联预测方法
20
作者 孙捷 谭者斌 《计算生物学》 CAS 2023年第4期35-44,共10页
长链非编码RNA (lncRNA)是一类长度大于200 nt的非编码RNA,是非编码基因组的重要组成部分。大量实验证实,lncRNA与人类疾病的发生发展密不可分,但除了一小部分的lncRNA与人类疾病关系已知之外,大多数的lncRNA与人类疾病的关系仍然有待研... 长链非编码RNA (lncRNA)是一类长度大于200 nt的非编码RNA,是非编码基因组的重要组成部分。大量实验证实,lncRNA与人类疾病的发生发展密不可分,但除了一小部分的lncRNA与人类疾病关系已知之外,大多数的lncRNA与人类疾病的关系仍然有待研究,因此准确识别与疾病有关的lncRNA有助于研究lncRNA在疾病中的作用机制,探索治疗疾病的新方法。在本研究中,为了提高对LDA的预测能力,我们实现了一种基于堆叠集成学习的LDA预测模型(简称SRFLDA)。在SRFLAD中,第一部分通过整合lncRNA的K-mer、疾病的高斯相互作用谱核相似性及已知lncRNA-疾病关联(LDA)三种类型的特征作为融合特征输入模型。第二部分使用堆叠集成学习策略通过组合多个不同参数的随机森林分类器作为基模型进行特征分类,并使用支持向量机作为元模型对随机森林的分类结果进行组合优化,从而得到更准确、鲁棒的LDA预测结果。第三部分通过十倍交叉验证对模型进行训练评价。结果表明该方法在预测LDA方面具有较好的性能,平均AUC的值为0.9246,平均AUPR值为0.9166,预测效果优于其他几种现有的LDA预测模型。 展开更多
关键词 lncRNA 疾病 lncRNA-疾病关联 随机森林 变量重要性 特征选择 支持向量机
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部