期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于随机森林方法的滑坡灾害危险性区划 被引量:45
1
作者 李亭 田原 +1 位作者 邬伦 刘亮 《地理与地理信息科学》 CSCD 北大核心 2014年第6期25-30,F0002,共7页
滑坡灾害危险性区划在滑坡灾害管理工作中具有重要意义。该文以深圳市为研究区,将随机森林方法应用于滑坡灾害危险性区划和因子评价工作。研究中采用随机森林方法进行建模,结合ROC曲线和AUC值对模型性能进行评价;通过预报效率曲线对全... 滑坡灾害危险性区划在滑坡灾害管理工作中具有重要意义。该文以深圳市为研究区,将随机森林方法应用于滑坡灾害危险性区划和因子评价工作。研究中采用随机森林方法进行建模,结合ROC曲线和AUC值对模型性能进行评价;通过预报效率曲线对全区的滑坡危险性区划总体效果进行评价;根据错误率变化和节点不纯度变化,对不同因子的重要性进行分析,结合作用曲线,探讨不同因子对滑坡的影响规律。实例研究说明随机森林方法适用于滑坡危险性区划工作,具有良好的建模效果。 展开更多
关键词 随机森林方法 滑坡灾害危险性区划 集成学习方法 模型评价 因子评价
下载PDF
流式大数据下随机森林方法及应用 被引量:5
2
作者 刘迎春 陈梅玲 《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第6期1055-1061,共7页
流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这... 流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实流式大数据场景中有着更高的分类准确度,最后分析讨论了随机森林方法如何进一步研究改进的主题。 展开更多
关键词 决策树 随机森林方法 大数据 流式计算 社交网站 搜索引擎 分类器 剪枝 客户评分 分布式系统
下载PDF
模型集群分析-随机森林方法在烟叶分类中的应用 被引量:3
3
作者 谭观萍 宾俊 +4 位作者 范伟 张发明 李海平 王承伟 周冀衡 《江西农业学报》 CAS 2017年第1期69-74,共6页
为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收... 为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收成熟度烟叶样本(数据集A)和不同等级烟叶样本(数据集B)的训练集分类精度分别为96.67%、99.02%,预测模型分类精度分别为100%、96.15%;MPA-RF模型对烟叶的分类准确率明显高于常用的PCA、SVM和RF分类方法。 展开更多
关键词 近红外光谱 烟叶分类 模型集群分析-随机森林方法
下载PDF
拉曼光谱结合随机森林方法应用于全棉纺织品真伪鉴别的研究 被引量:4
4
作者 谢剑飞 罗峻 +4 位作者 许敏 孙琪 吴淑焕 范伟 梁逸曾 《中国纤检》 2014年第22期76-78,共3页
在本文的研究中,建立了基于拉曼光谱的全棉纺织品真伪鉴别分析方法。首先,使用1064nm激发波长的便携式拉曼光谱仪扫描100个全棉和棉涤纺织样品的拉曼光谱并对谱图的特征峰进行归属分析。选取1120cm-1~1180 cm-1、1320cm-1~1400cm-1和156... 在本文的研究中,建立了基于拉曼光谱的全棉纺织品真伪鉴别分析方法。首先,使用1064nm激发波长的便携式拉曼光谱仪扫描100个全棉和棉涤纺织样品的拉曼光谱并对谱图的特征峰进行归属分析。选取1120cm-1~1180 cm-1、1320cm-1~1400cm-1和1560cm-1~1600cm-1三个波段进行分析并运用随机森林法对100个样品进行了判定。结果表明,利用拉曼光谱结合随机森林法可以将全棉纺织品和棉涤纺织品区分开来,该方法操作简单,快速环保,是全棉纺织品真伪鉴别的新型方法。 展开更多
关键词 拉曼光谱 随机森林方法 纺织品 全棉 棉涤
下载PDF
基于随机森林方法的碳足迹及其影响因素研究 被引量:10
5
作者 唐建荣 陈实 《统计与信息论坛》 CSSCI 2013年第10期70-74,共5页
研究碳足迹持续增长动因对碳足迹的抑制及其碳减排政策的制定具有深远意义。基于随机森林方法并利用1997—2011年的相关数据构建了碳足迹影响因素分析模型。模型对碳足迹影响因素进行了有效识别和系统归集,并为碳足迹的控制提供了理论... 研究碳足迹持续增长动因对碳足迹的抑制及其碳减排政策的制定具有深远意义。基于随机森林方法并利用1997—2011年的相关数据构建了碳足迹影响因素分析模型。模型对碳足迹影响因素进行了有效识别和系统归集,并为碳足迹的控制提供了理论依据和数据支撑。研究表明:产业结构、固定资产投资、发展规模、人口规模、住宅建筑、技术水平和城市化水平等因素是形成碳足迹的稳定力量;能源结构、经济速度和碳汇效应的影响并不显著。 展开更多
关键词 能源碳足迹 随机森林方法 偏最小二乘法
下载PDF
随机森林方法在机场温度预测中的应用 被引量:4
6
作者 朱国栋 孙建杰 +1 位作者 陈阳权 王照刚 《气象科技进展》 2021年第4期34-36,共3页
利用2015—2017年欧洲中心细网格数值预报产品,使用随机森林方法,结合不同数量的决策树进行模型训练,研究建立基于随机森林方法的乌鲁木齐机场逐时温度回归预报模型。通过对模型预测结果的检验可以看到,模型预测乌鲁木齐机场温度平均绝... 利用2015—2017年欧洲中心细网格数值预报产品,使用随机森林方法,结合不同数量的决策树进行模型训练,研究建立基于随机森林方法的乌鲁木齐机场逐时温度回归预报模型。通过对模型预测结果的检验可以看到,模型预测乌鲁木齐机场温度平均绝对误差≤2℃的占样本总数的94%,机场温度−10~30℃,平均绝对误差为1.2℃,该方法预测效果较好,因此可以尝试使用本方法制作民航机场客观要素指导产品。 展开更多
关键词 随机森林方法 机场温度 预报
下载PDF
结合多重假设检验的随机森林长期降水预测方法及应用
7
作者 李梦杰 刘琨 +4 位作者 牟海磊 殷兆凯 刘志武 吴迪 梁犁丽 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第5期920-926,共7页
为解决随机森林方法经验性选取预测因子时存在的错误发现率问题,引入多重假设检验领域控制错误发现率的方法对预测因子的筛选进行质量控制,将因子筛选由经验依赖转化为数据依赖,从而提出一种基于多重假设检验的随机森林方法长期降水预... 为解决随机森林方法经验性选取预测因子时存在的错误发现率问题,引入多重假设检验领域控制错误发现率的方法对预测因子的筛选进行质量控制,将因子筛选由经验依赖转化为数据依赖,从而提出一种基于多重假设检验的随机森林方法长期降水预测方法。以巴西巴拉那河上游流域为研究区,利用逐月气候系统指数,应用提出的方法对研究区2018-2020年54个雨量站点的逐月降水量进行模拟预测、检验和交叉验证。结果表明:与传统的随机森林方法相比,该方法预报精度更高,对不同站点1-12月的预测平均合格率达到64%,其中6月预测合格率达到84%,表明该方法可以作为流域长期降水预测的有效工具之一。 展开更多
关键词 随机森林方法 长期降水预测 预测因子筛选 质量控制 多重假设检验
下载PDF
公司财务特征与企业ESG评分的内在关联——基于随机森林方法的识别预测探究
8
作者 钟玮 董淼 《会计研究》 北大核心 2024年第7期175-192,共18页
ESG已成为衡量企业价值的重要理念,相对于企业自身披露的信息,外部机构的ESG评分是经过信息筛选形成关键事项议题并专业分析后形成的,旨在帮助投资者做出更明智的决策。本文实证分析了企业财务特征与机构ESG评分的内在关联,研究发现:我... ESG已成为衡量企业价值的重要理念,相对于企业自身披露的信息,外部机构的ESG评分是经过信息筛选形成关键事项议题并专业分析后形成的,旨在帮助投资者做出更明智的决策。本文实证分析了企业财务特征与机构ESG评分的内在关联,研究发现:我国上市公司财务指标特别是异常指标能在较大程度上预测ESG评分,即当前企业ESG评判仍以财务信息为主导,但预测能力逐年减弱,即ESG评分正趋于独立。在环境维度和社会维度下,财务特征对评分的预测能力显著低于综合得分,企业履行环境保护、产品责任等更多的是出于遵守法律法规的强制性规定和维护必要的声誉考虑。本文结论为完善中国特色ESG评分机制,促进其与财务信息的功能协同提供了借鉴。 展开更多
关键词 企业ESG评分 财务特征 随机森林方法 识别预测
原文传递
基于随机森林的网络入侵检测方法 被引量:24
9
作者 芶继军 李均华 +2 位作者 陈晨 陈一鸣 吕奕达 《计算机工程与应用》 CSCD 北大核心 2020年第2期82-88,共7页
为了提高网络安全水平,及时对网络攻击进行主动检测,提出了一种基于随机森林的网络入侵检测模型。该模型能够对大流量攻击进行分布式检测,且检测算法在引入了两个随机性后,即可降低网络流量内不同属性特征字段的噪声,并消除关联性,以便... 为了提高网络安全水平,及时对网络攻击进行主动检测,提出了一种基于随机森林的网络入侵检测模型。该模型能够对大流量攻击进行分布式检测,且检测算法在引入了两个随机性后,即可降低网络流量内不同属性特征字段的噪声,并消除关联性,以便更为便捷、迅速地对攻击进行主动检测。将经典的Adaboost组合多分类器方法与提出的算法在检测率、正确率、精确率三个方面进行对比,体现了该算法的优越性,为大数据时代下网络安全提供了更好的保护。 展开更多
关键词 网络安全 机器学习 随机森林方法 攻击检测
下载PDF
改进随机森林法在断路器机械故障诊断中的应用 被引量:3
10
作者 许逵 陈沛龙 +3 位作者 刘君 张艳萍 曾鹏 黄军凯 《电气自动化》 2021年第2期112-114,共3页
高压断路器机械故障时有发生,严重影响设备及电力系统的安全稳定运行。针对目前高压断路器机械故障诊断准确率不理想的现状,将改进后的随机森林方法应用于高压断路器机械故障诊断。结合高压断路器分合闸线圈电流信号的原理分析,提取出... 高压断路器机械故障时有发生,严重影响设备及电力系统的安全稳定运行。针对目前高压断路器机械故障诊断准确率不理想的现状,将改进后的随机森林方法应用于高压断路器机械故障诊断。结合高压断路器分合闸线圈电流信号的原理分析,提取出可有效反映断路器机械故障的相应特征量,建立高压断路器机械故障诊断模型,通过不同噪声干扰强度下高压断路器机械故障诊断实例的对比分析。结果表明,随机森林方法具有更加优良的准确性和抗干扰能力。同时验证了基于改进随机森林方法的高压断路器机械故障诊断模型的有效性和优越性。 展开更多
关键词 高压断路器 机械故障 线圈电流 随机森林方法 故障诊断
下载PDF
西太平洋台风活动对中国西北地区东部夏季降水的影响
11
作者 王顼 张立凤 +2 位作者 王羱 刘洋 谢勇 《大气科学》 CSCD 北大核心 2024年第2期507-520,共14页
基于1979~2020年(42年)降水及台风资料,利用常用的统计方法和随机森林方法,研究了西太平洋台风对我国西北地区东部(33°N~45°N,93°E~110°E,ENWC)降水的影响。结果发现,在台风频数和降水量都出现峰值的7、8、9月,出... 基于1979~2020年(42年)降水及台风资料,利用常用的统计方法和随机森林方法,研究了西太平洋台风对我国西北地区东部(33°N~45°N,93°E~110°E,ENWC)降水的影响。结果发现,在台风频数和降水量都出现峰值的7、8、9月,出现在西北太平洋的台风对台风期间的ENWC平均日降水(TP)有影响。7月份台风的位置和强度对降水影响显著,8月份台风的位置、强度和频数对降水都有影响,9月份影响较小。台风的影响具有地域选择性,不同的月份这种选择性不同,对不同等级降水的影响也不同。其影响主要表现在EOF分解的第二模态以及强降水和极强降水等级上,这说明了台风不是影响TP的主要因素,这种影响是间接的和非线性的,台风的出现是通过影响东亚地区中高纬度的槽脊系统、西太平洋副热带高压以及低纬度低涡的强度和位置来形成有利于降水的条件,从而影响降水的分布和强度。相对于多元线性回归方法,基于随机森林方法建立的降水模型能更好地拟合出降水分布和强度,这说明台风对TP的影响主要是非线性的,且降水强度越强,非线性作用越明显。同时,随机森林模型也显示出台风的位置是影响ENWC降水的最关键因素。 展开更多
关键词 中国西北地区东部 降水 西太平洋台风 随机森林方法
下载PDF
四川省滑坡灾害危险性评价模型比较研究
12
作者 刘亚彬 刘云腾 +3 位作者 朱真梅 刘志红 范智高 史红人 《成都信息工程大学学报》 2024年第1期101-107,共7页
为探讨四川省滑坡灾害分布状况及对滑坡灾害危险性评价建模效果进行比较,以四川省为研究区,分析地质灾害尤其是滑坡灾害的时空分布,运用信息量法、基于信息量的逻辑回归法、随机森林法3种方法,取坡度、植被覆盖率、地震烈度、断层密度... 为探讨四川省滑坡灾害分布状况及对滑坡灾害危险性评价建模效果进行比较,以四川省为研究区,分析地质灾害尤其是滑坡灾害的时空分布,运用信息量法、基于信息量的逻辑回归法、随机森林法3种方法,取坡度、植被覆盖率、地震烈度、断层密度及年累计降雨量5个因子建立危险性评价模型,结合ROC曲线和AUC值对模型性能进行精度比较。研究结果表明:(1)坡度因子对滑坡灾害的贡献最大,3种评价模型中坡度、地震烈度及降雨3个因子均有较大贡献。(2)滑坡灾害主要分布于地震带附近,在成都平原处灾害发生几率最小。(3)3种评价方法均适用于滑坡危险性区划工作,具有良好的建模效果。相对于其他两种模型,逻辑回归模型在实际情况下更加适合四川省滑坡灾害的危险性评价工作。 展开更多
关键词 滑坡灾害 信息量方法 随机森林方法 逻辑回归方法 模型评价
下载PDF
基于CT影像数据的出血性脑卒中人工智能辅助诊治模型研究
13
作者 张心怡 王林霞 +1 位作者 周韩祺 陈苗根 《中国计量大学学报》 2024年第3期518-527,共10页
目的:建立出血性脑卒中人工智能辅助诊治模型。方法:依据血肿体积增长绝对量和相对量判断患者是否发生血肿,综合考虑患者临床和影像信息,基于随机森林方法对患者血肿扩张风险进行预测。提出了一种基于高斯时序拟合的患者水肿进展模式亚... 目的:建立出血性脑卒中人工智能辅助诊治模型。方法:依据血肿体积增长绝对量和相对量判断患者是否发生血肿,综合考虑患者临床和影像信息,基于随机森林方法对患者血肿扩张风险进行预测。提出了一种基于高斯时序拟合的患者水肿进展模式亚类分组方法,得出不同疗法对水肿体积进展的影响。结果:血肿预测数学模型准确率达到了0.819,治疗方法重要性占比前两项是降颅压和镇静镇痛,它们占所有治疗方法效果的23.4%和22.1%。结论:本血肿预测模型能够有效预测患者血肿发生情况,降颅压和镇静镇痛治疗方法具有更好的水肿控制效果。 展开更多
关键词 出血性脑卒中 随机森林方法 人工智能辅助诊治
下载PDF
基于集成学习的二手车保值率估计方法
14
作者 张敏杰 《经济技术协作信息》 2021年第14期66-67,共2页
现有的二手车保值率估计方法高度依赖人工评估判断,主观性强;研究特征不全面,样本量不充足,难以充分挖掘汽车残值影响因素。本文运用集成学习LightGBM、随机森林模型,利用大量二手车样本的四十余个维度特征进行建模分析,实验证明,集成... 现有的二手车保值率估计方法高度依赖人工评估判断,主观性强;研究特征不全面,样本量不充足,难以充分挖掘汽车残值影响因素。本文运用集成学习LightGBM、随机森林模型,利用大量二手车样本的四十余个维度特征进行建模分析,实验证明,集成学习能够根据车况综合数据自动计算保值率,而LightGBM在处理多分类变量数据时,较随机森林方法有更高的准确性。 展开更多
关键词 集成学习 随机森林模型 二手车 综合数据 随机森林方法 样本量 自动计算 实验证明
下载PDF
嘉陵江流域极端连续性降水时空变化及其驱动因素研究
15
作者 王跃峰 胡月 +2 位作者 尹思危 杨琴 刘春红 《水资源与水工程学报》 CSCD 北大核心 2023年第4期35-44,共10页
针对嘉陵江流域极端连续性降水气候驱动因素复杂且主控因素尚不明确的问题,利用1960-2019年逐日降水资料,采用Sen’s斜率、Mann-Kendall检验和随机森林等方法,分析流域连续干旱日数(CDD)和连续湿润日数(CWD)的时空变化特征,探究其气候... 针对嘉陵江流域极端连续性降水气候驱动因素复杂且主控因素尚不明确的问题,利用1960-2019年逐日降水资料,采用Sen’s斜率、Mann-Kendall检验和随机森林等方法,分析流域连续干旱日数(CDD)和连续湿润日数(CWD)的时空变化特征,探究其气候驱动因素。结果表明:流域CDD和CWD多年趋势分别为-3.8~4.8 d/10a和-0.42~0 d/10a,分别有2个(3.3%)和10个(15.9%)气象站点的趋势达0.05显著性。局地气候驱动因子方面,CWD与年降水量存在较强正相关,共34个(54%)站相关系数达到0.05显著性;气候环流驱动因子方面,单、多因子分析均表明Nino3.4和SOI(southern oscillation index)是流域极端连续性降水的主控气候因子,CDD和CWD各有28个(44.4%)和15个(23.8%)气象站点的相关系数达0.05显著性,而SASMI(south Asian summer monsoon index)和PDO(Pacific decadal oscillation)分别为流域CDD和CWD的次要气候驱动因子。 展开更多
关键词 极端连续性降水 时空变化 气候驱动因素 随机森林方法 嘉陵江流域
下载PDF
基于GIS的京杭大运河扬州段沿岸土地利用变化分析 被引量:1
16
作者 沈佩姗 张开源 陶前辉 《黄河水利职业技术学院学报》 2023年第3期23-28,共6页
以2002年SPOT5影像和2022年的GF1影像为基准,利用随机森林方法对京杭大运河扬州段沿岸1 km范围进行土地利用分类,基于土地利用转换矩阵、土地利用动态度模型和重心迁移模型进行分类后比较。结果表明:20 a间,研究区耕地、林地、水域面积... 以2002年SPOT5影像和2022年的GF1影像为基准,利用随机森林方法对京杭大运河扬州段沿岸1 km范围进行土地利用分类,基于土地利用转换矩阵、土地利用动态度模型和重心迁移模型进行分类后比较。结果表明:20 a间,研究区耕地、林地、水域面积减少,草地、建设用地、未利用地面积增加。耕地为转出面积最多的土地类型,主要转出为建设用地。研究区的综合土地利用动态度为0.63%,整体土地利用类型数量变化相对平稳,未利用地和建设用地的单一土地利用动态度分别为4.61%和4.10%,数量变化相对剧烈。耕地和林地重心向北迁移,建设用地和水域重心向南迁移,耕地重心迁移距离最大(6.38 km)。 展开更多
关键词 京杭大运河扬州段 土地利用变化 土地利用分类 随机森林方法 转换矩阵 土地利用动态度模型 重心迁移模型 SPOT5影像 GF1影像
下载PDF
基于聚煤环境分区的煤体结构测井判别及应用--以沁水盆地南部马必东地区为例 被引量:2
17
作者 张建国 韩晟 +1 位作者 张聪 陈彦君 《煤田地质与勘探》 CSCD 北大核心 2021年第4期114-122,共9页
煤体结构的测井曲线判别是一种高效经济的地球物理判别方法,但是受沉积环境和煤储层物性等因素影响,测井曲线具有多解性,造成煤体结构测井响应不明显,由此得到的判别方法也会有区域局限性。因此,在进行测井判别之前,需要对除煤体结构以... 煤体结构的测井曲线判别是一种高效经济的地球物理判别方法,但是受沉积环境和煤储层物性等因素影响,测井曲线具有多解性,造成煤体结构测井响应不明显,由此得到的判别方法也会有区域局限性。因此,在进行测井判别之前,需要对除煤体结构以外的影响测井曲线的因素加以控制。以沁水盆地马必东区块3号煤为例,首先利用煤心灰分与伽马测井曲线的正相关性进行煤心归位,以确保测井深度与取心深度的一致性;再利用煤心的镜质组与惰质组含量之比(镜惰比)对工区的聚煤环境进行分区,并优选聚煤环境相近分区的测井曲线。结果表明,电阻率系列曲线可以较清晰地反映该地区的煤体结构,受探测深度的影响,声波曲线无法准确地反映该地区煤体结构的变化规律。利用取心井训练的多测井曲线随机森林模型对未取心井煤体结构进行预测和判定,实测压裂曲线检验表明,预测结果与实测数据吻合率高。应用表明,基于聚煤环境分区的煤体结构测井判别方法可以反映煤体结构分布规律,指导压裂工作,降低煤层气开发成本,且有助于指导跨区块的煤体结构测井响应研究。 展开更多
关键词 煤体结构 测井响应 聚煤环境 煤心归位 随机森林方法 显微组分
下载PDF
高铁时代的城市经济增长路径与效益机制研究 被引量:11
18
作者 孙娜 张梅青 陶克涛 《经济与管理研究》 CSSCI 北大核心 2020年第5期44-63,共20页
本文基于综合的分析框架,探讨高铁对城市经济增长的影响及内在机制,并在不同规模城市之间进行比较;使用列车数作为城市高铁建设与运营水平的指标具体考察两种连接方式的不同影响,结合随机森林方法和样本划分进行了机制验证。结果显示,... 本文基于综合的分析框架,探讨高铁对城市经济增长的影响及内在机制,并在不同规模城市之间进行比较;使用列车数作为城市高铁建设与运营水平的指标具体考察两种连接方式的不同影响,结合随机森林方法和样本划分进行了机制验证。结果显示,高铁的城市经济效益主要是一种间接影响,作用路径的不同解释了高铁对不同规模城市影响程度的差异性;随着城市规模的扩大,高铁在提高服务业生产效率和促进产业升级方面作用显著,而对于规模较小的城市,高铁的影响主要在于加速产业结构调整;从连接方式看,外向型交通网络的发展能够从多个方面提升大城市的经济绩效,而与邻近城市联系的加强对于中、小城市的发展显示出了积极的影响。 展开更多
关键词 高铁 城市经济 城市规模 服务业 产业结构 随机森林方法
下载PDF
基于机器学习的岩石微量元素与主量元素关系初探:以洋岛玄武岩中锆元素为例 被引量:3
19
作者 洪瑾 甘成势 刘洁 《地质科学》 CAS CSCD 北大核心 2018年第4期1285-1299,共15页
本文尝试利用机器学习的随机森林算法分析岩石主量元素与微量元素之间的关系。大洋玄武岩几乎不受混染作用影响,各元素成分之间的关系相对稳定,其中微量元素Zr是一种稳定的高场强元素。本文采用随机森林算法对洋岛玄武岩中Zr元素和主... 本文尝试利用机器学习的随机森林算法分析岩石主量元素与微量元素之间的关系。大洋玄武岩几乎不受混染作用影响,各元素成分之间的关系相对稳定,其中微量元素Zr是一种稳定的高场强元素。本文采用随机森林算法对洋岛玄武岩中Zr元素和主量元素的关系进行探索。利用算法中变量重要性度量判断各个主量元素与Zr元素之间关系的强弱,结合Pearson相关性分析,选择出5种主量元素(TiO2、CaO、MgO、Na2O和P2O5,)作为预测变量。由这5种元素确定了共1000棵,每棵决策树含3个特征的随机森林模型,该模型对Zr元素的预测效果优于普通多变量回归方法。随后还探索了Zr元素与这5种主量元素的经验公式,得到的经验公式对Zr元素的预测结果也较好。本文更重要的意义是为拥有海量数据的地球化学领域引入一种用于数据挖掘的机器学习方法,并提出一套具有启发性的数据分析方案。 展开更多
关键词 机器学习 随机森林方法 洋岛玄武岩 微量元素 主量元素
下载PDF
应用机器学习算法的成都市冬季空气污染预报研究 被引量:8
20
作者 孙苏琪 王式功 +2 位作者 罗彬 杜云松 张巍 《气象与环境学报》 2020年第2期98-104,共7页
利用2014年3月至2017年2月成都市8个环境监测站的PM 2.5、PM 10、SO 2、NO 2、CO、O 3共6种污染物质量浓度资料以及T639全球中期数值预报模式产品,采用两种机器学习算法—递归特征消除法(Recursive feature elimination,RFE)和随机森林... 利用2014年3月至2017年2月成都市8个环境监测站的PM 2.5、PM 10、SO 2、NO 2、CO、O 3共6种污染物质量浓度资料以及T639全球中期数值预报模式产品,采用两种机器学习算法—递归特征消除法(Recursive feature elimination,RFE)和随机森林方法,构建了成都市冬季5种(O 3除外,因为其冬季污染较轻)污染物浓度的预报模型,并对模型的预报效果进行了评价。结果表明:基于RFE模型的5种污染物预报值与实测值的均方根误差值分别为47.58μg·m^-3、72.10μg·m^-3、8.87μ·m-3、0.59 mg·m^-3、19.84μg·m^-3;基于随机森林模型的5种污染物预报值与实测值均方根误差值分别为23.94μg·m^-3、20.98μg·m^-3、2.40μg·m^-3、0.16 mg·m^-3、8.09μg·m^-3,随机森林模型对各污染物浓度的预报效果均优于RFE模型,说明该预报方法性能良好,可为成都市冬季空气质量业务化预报提供技术支持和防控依据。 展开更多
关键词 空气污染预报 递归特征消除法 随机森林方法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部