期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于XGBoost-RF的制冷剂泄漏故障检测与诊断 被引量:1
1
作者 吴孔瑞 韩华 +3 位作者 任正雄 高雨 江松轩 杨钰婷 《暖通空调》 2023年第1期105-111,130,共8页
针对冷水机组运行中正常数据多于故障数据情况和制冷系统中最常见的制冷剂泄漏故障,本文采用极端梯度提升算法(XGBoost)建立故障检测模型,采用随机森林(RF)算法建立故障诊断模型,研究了检测阈值改变对检测模型的影响及有、无正常样本训... 针对冷水机组运行中正常数据多于故障数据情况和制冷系统中最常见的制冷剂泄漏故障,本文采用极端梯度提升算法(XGBoost)建立故障检测模型,采用随机森林(RF)算法建立故障诊断模型,研究了检测阈值改变对检测模型的影响及有、无正常样本训练的诊断模型的对比。结果表明,在检测阈值设定为0.99时,可保证大部分故障样本均能被检测出来,且虚警率低,仅由故障数据训练得到的诊断模型整体性能最佳,可最大限度发挥检测模型和诊断模型的优势。 展开更多
关键词 冷水机组 制冷剂泄漏 故障检测与诊断 极端梯度提升 随机森林 阈值
下载PDF
结合遥感林龄因子的亚热带森林蓄积量估算方法 被引量:5
2
作者 周小成 黄婷婷 +4 位作者 李媛 肖祥希 朱洪如 陈芸芝 冯芝淸 《林业科学》 EI CAS CSCD 北大核心 2023年第4期88-99,共12页
【目的】应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,评价遥感估算的林龄因子与遥感因子相结合提高森林蓄积量估算精度的有效性,为实现高效、快速、精准的大范围森林蓄积量估算提供一种新的思路和方法。【方法】以福建省将乐县... 【目的】应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,评价遥感估算的林龄因子与遥感因子相结合提高森林蓄积量估算精度的有效性,为实现高效、快速、精准的大范围森林蓄积量估算提供一种新的思路和方法。【方法】以福建省将乐县为研究示范区,首先,基于1987—2016年时序Landsat影像,采用LandTrendr森林干扰与恢复监测算法监测年度林分更替干扰并估算干扰区林龄;然后,基于GF-1号影像光谱、纹理、地形等特征,采用递归特征消除的随机森林算法(RFE-RF)估算非干扰区林龄;在此基础上,结合GF-1影像光谱、纹理因子和森林资源二类调查小班实测蓄积量数据,采用极端梯度提升算法估算研究区森林蓄积量。对比有无林龄因子的森林蓄积量估算精度,进一步验证遥感林龄因子对提高森林蓄积量估算精度的重要性。【结果】采用LandTrendr森林干扰与恢复监测算法获得的干扰区林分林龄误差仅1~2年,林龄估算精度明显优于传统利用遥感因子估算的林龄精度(误差4~12年)。仅采用常规遥感因子估算森林蓄积量时,XGBoost模型决定系数(R^(2))为0.59,平均均方根误差(RMSE)为30.72 m^(3)·hm^(-2),相对均方根误差(rRMSE)为16.46%;加入林龄因子后,模型R^(2)提高至0.73,平均RMSE减少至23.73 m^(3)·hm^(-2),rRMSE为13.26%,森林蓄积量估算平均总体精度约提高10.4%,达84.4%。【结论】相比仅采用常规遥感因子估算森林蓄积量,应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,其估算精度接近森林资源调查相关规定要求,可为大范围亚热带森林资源快速调查评估提供重要技术支持。 展开更多
关键词 森林蓄积量 林龄 时序遥感 递归特征消除的随机森林 极端梯度提升算法
下载PDF
基于LightGBM的南阳市西部地区山洪灾害风险评价 被引量:3
3
作者 范桂英 汤军 +2 位作者 高贤君 占杨英 邓莉婷 《中国农村水利水电》 北大核心 2023年第8期135-141,156,共8页
山洪灾害是对人类影响较大的自然灾害之一,给国民经济和人民生命财产造成了巨大的损失。开展山洪灾害风险评价是防御山洪灾害的有效方式之一,准确评价山洪灾害风险可为山洪防治工作和决策部署提供有力的技术支撑。研究以南阳市西部地区... 山洪灾害是对人类影响较大的自然灾害之一,给国民经济和人民生命财产造成了巨大的损失。开展山洪灾害风险评价是防御山洪灾害的有效方式之一,准确评价山洪灾害风险可为山洪防治工作和决策部署提供有力的技术支撑。研究以南阳市西部地区为研究区域,基于415个历史山洪灾害点,选取高程、坡度、年平均降水量和年最大3 h降水量均值等12项风险指标,构建了轻量级梯度提升LightGBM(Light Gradient Boosting Machine)山洪灾害风险评价模型。同时结合随机森林RF(Random Forest)和极端梯度提升XGBoost(Extreme Gradient Boosting)两种方法,通过准确度、精度等5种主要评价指标对比分析各模型精度,最后采用性能最佳模型绘制研究区山洪灾害风险图,并在此基础上,生成多尺度山洪灾害风险评价图,借此对南阳市西部地区山洪灾害分布特征进行探究,分析山洪灾害成因。结果表明:①LightGBM模型性能最好,精度为91.57%。RF模型性能较差,精度为84.62%;②坡度、高程和年平均降水量是影响研究区山洪发生的主要风险指标;③研究区山洪灾害风险评价结果与实际山洪发育情况基本一致,极高风险区与高风险区的面积占总面积的21%,且主要分布于山脉附近、河流周边最低处以及农田生产潜力大的区域。LightGBM是山洪灾害风险评价的有效方法,可以给南阳市的山洪灾害防御管理规划工作提供指导作用。 展开更多
关键词 山洪灾害 LightGBM RF XGBoost 风险评价 GIS
下载PDF
基于KRX模型集成算法 被引量:1
4
作者 李佳晋 王国春 +2 位作者 李万龙 王洋 潘一文 《长春工业大学学报》 CAS 2023年第2期177-182,共6页
KRX模型将改进KNN算法、随机森林算法及XGBooost算法作为基模型,KNN算法通过其相邻样本的距离进行权值分配,提高了分类的准确性。对两个标签的准确率达到81%和88%。
关键词 KNN RF XGBoost 集成算法
下载PDF
基于XGBoost模型的安徽省土壤pH空间建模 被引量:2
5
作者 邱士其 赵明松 +3 位作者 芦园园 卢宏亮 徐少杰 陈宣强 《科学技术与工程》 北大核心 2023年第4期1472-1480,共9页
土壤pH是土壤的基本属性之一,对土壤环境管理有重要作用。以安徽省为研究区域,选用气候、地形、生物等17个相关环境变量,利用XGBoost和随机森林(random forest,RF)模型建立安徽省土壤pH空间预测模型,对比两模型的预测精度,并估算了两种... 土壤pH是土壤的基本属性之一,对土壤环境管理有重要作用。以安徽省为研究区域,选用气候、地形、生物等17个相关环境变量,利用XGBoost和随机森林(random forest,RF)模型建立安徽省土壤pH空间预测模型,对比两模型的预测精度,并估算了两种制图结果的不确定性。结果表明:与随机森林模型相比,XGBoost模型对安徽省土壤pH的预测精度更高。XGBoost模型中eta、max_depth和nrounds对于模型的精度均具有一定的影响,eta的变化对于XGBoost模型精度影响最大。年均降水量(mean annual precipitation,MAP)、纬度(latitude,记为Y)、多尺度谷底平坦度(multiresolution index of valley bottom flatness,MRVBF)、年均温(mean annual temperature,MAT)、多尺度脊顶平坦度(multiresolution index of the ridge top flatness,MRRTF)、增强植被指数(enhanced vegetation index,EVI)对土壤pH建模有较大的影响,在两种模型的变量重要性排序中均重要。空间制图结果表明:两模型的预测结果大体趋势相同,安徽省土壤pH呈“南酸北碱”的趋势,但两者在部分地区的结果仍有区别。 展开更多
关键词 XGBoost 土壤PH 随机森林(RF) 安徽省
下载PDF
基于Stacking模型融合的高性能混凝土强度预测方法 被引量:5
6
作者 胡以婵 梁铭 +5 位作者 谢灿荣 解威威 翁贻令 池浩 彭浩 罗雪霜 《硅酸盐通报》 CAS 北大核心 2023年第11期3914-3926,共13页
针对传统经验公式对高性能混凝土强度预测时存在偏差大、效率低等问题,本文提出一种基于Stacking模型融合的高性能混凝土强度预测方法。首先,通过数据清洗和归一化对1030组高性能混凝土抗压强度试验数据进行预处理,剔除异常数据及消除... 针对传统经验公式对高性能混凝土强度预测时存在偏差大、效率低等问题,本文提出一种基于Stacking模型融合的高性能混凝土强度预测方法。首先,通过数据清洗和归一化对1030组高性能混凝土抗压强度试验数据进行预处理,剔除异常数据及消除数据间量纲影响;其次,基于极端梯度提算法(XGBoost)、类别优先梯度提升算法、多层感知器和随机森林(RF)4种算法开展超参数优化、模型训练和评估,采用决定系数、均方根误差和平均绝对误差对比分析4种基学习器对强度预测的整体效果,在此基础上构建基于Stacking集成学习融合多种机器学习算法的高性能混凝土强度预测模型;最后,采用103组新的高性能数据集对模型进行验证,并开展可解释分析。结果表明:与其他基学习器的组合相比,XGBoost和RF融合模型的预测精度和性能均明显提高,泛化性能较好,且可解释分析显示最重要的输入特征变量是龄期和水泥,说明模型内在的预测逻辑与工程实践的经验较吻合,具有较高的合理性与可靠度。研究结果为进一步提高高性能混凝土强度的预测精度提供参考。 展开更多
关键词 混凝土 强度预测模型 集成学习 stacking算法 XGBoost算法 RF算法
下载PDF
基于机器学习的长沙市滑坡灾害快速风险评价 被引量:1
7
作者 王璨 肖浩 +2 位作者 肖婷 方亚其 刘磊磊 《矿冶工程》 CAS 北大核心 2023年第5期26-31,36,共7页
提出采用随机森林(RF)和极限梯度提升(XGboost)模型对长沙市滑坡灾害进行快速危险性评价,并利用频率比法对评价结果进行检验和校准。基于层次分析法构建易损性快速评价体系并进行易损性评价。最后,采用数值分级方法集成危险性和易损性... 提出采用随机森林(RF)和极限梯度提升(XGboost)模型对长沙市滑坡灾害进行快速危险性评价,并利用频率比法对评价结果进行检验和校准。基于层次分析法构建易损性快速评价体系并进行易损性评价。最后,采用数值分级方法集成危险性和易损性评价结果实现快速风险评价。结果表明,RF模型与XGBoost模型性能相近,但经频率比法校正后的XGBoost模型危险性评价结果更加合理;易损性评价中人口密度的权重值最大,高易损区多集中于市区、交通干线等区域。长沙市风险区划结果中较高风险、高风险区域占整个研究区面积的4.6%,主要集中在沟谷、城镇和交通干线等区域。 展开更多
关键词 滑坡灾害 机器学习 滑坡 随机森林 极限梯度提升 危险性评价 风险评价
下载PDF
基于XGBoost算法的胶凝砂砾石劈拉强度预测分析 被引量:3
8
作者 郭磊 李泽宣 +2 位作者 田青青 郭利霞 高航 《建筑材料学报》 EI CAS CSCD 北大核心 2023年第4期378-382,388,共6页
将水泥质量浓度、砂率、水胶比和粉煤灰质量浓度设为输入变量,28 d劈拉强度设为输出变量,用极端梯度提升树(XGBoost)算法对胶凝砂砾石(CSG)的劈拉强度进行预测,并与随机森林(RF)算法的预测结果进行对比,以决策系数(R^(2))、均方根误差(R... 将水泥质量浓度、砂率、水胶比和粉煤灰质量浓度设为输入变量,28 d劈拉强度设为输出变量,用极端梯度提升树(XGBoost)算法对胶凝砂砾石(CSG)的劈拉强度进行预测,并与随机森林(RF)算法的预测结果进行对比,以决策系数(R^(2))、均方根误差(RMSE)、平均绝对误差(MAE)和平均百分比误差(MAPE)作为评估标准对2种算法进行对比分析.结果表明:XGBoost算法的R2为0.968 1,具有高度的预测准确性;相比表现良好的RF算法,XGBoost算法测试集的RMSE和MAE均降低了0.003, MAPE降低了0.32%,表明XGBoost算法能够对CSG劈拉强度进行更为精准的预测. 展开更多
关键词 极端梯度提升树算法 随机森林算法 强度预测 胶凝砂砾石 劈拉强度
下载PDF
基于改进的随机森林模型的个人信用风险评估研究 被引量:26
9
作者 周永圣 崔佳丽 +2 位作者 周琳云 孙红霞 刘淑芹 《征信》 北大核心 2020年第1期28-32,共5页
提出基于XGBoost算法的随机森林模型(即XGBoost-RF模型),以评估个人信用风险。将德国信用数据集作为数据样本,引入XGBoost算法处理数据样本,依据其得出的重要性得分筛选个人信用风险评估指标;基于所得指标,运用随机森林算法(RF)对数据... 提出基于XGBoost算法的随机森林模型(即XGBoost-RF模型),以评估个人信用风险。将德国信用数据集作为数据样本,引入XGBoost算法处理数据样本,依据其得出的重要性得分筛选个人信用风险评估指标;基于所得指标,运用随机森林算法(RF)对数据样本进行分类,并分析了指标特点及分类性能。研究结果表明:实务中个人信用风险评估指标体系对"人脉关系"指标关注欠缺;无论从成本还是预测效果来看,改进的随机森林模型即XGBoost-RF模型都展示了较好的可行性和优越性。 展开更多
关键词 信用风险评估 信用指标 特征选择 XGBoost 随机森林(RF) xgboost-rf
下载PDF
基于RF-XGBoost算法的汽油辛烷值损失预测模型 被引量:2
10
作者 陈亚丽 苟苗苗 +1 位作者 邵露娟 邓丹 《炼油技术与工程》 CAS 2021年第12期49-53,共5页
对某炼油企业催化裂化汽油精制脱硫装置的354个操作特征进行定性降维,得到与辛烷值损失相关的39个操作特征变量;再利用随机森林(RF)算法进行定量降维,得到28个辛烷值损失评价指标体系;最后使用极端梯度提升(XGBoost)算法及调优策略,建... 对某炼油企业催化裂化汽油精制脱硫装置的354个操作特征进行定性降维,得到与辛烷值损失相关的39个操作特征变量;再利用随机森林(RF)算法进行定量降维,得到28个辛烷值损失评价指标体系;最后使用极端梯度提升(XGBoost)算法及调优策略,建立基于RF-XGBoost算法的汽油辛烷值损失预测模型。结果表明:通过充分降维,得到的操作特征比较全面,能够作为刻画辛烷值损失的指标,并且符合企业实际优化条件,可以用于实际生产操作调控。建立的预测模型通过对相关参数调优,提高了预测精度。经过可视化分析,发现辛烷值的预测值和真实值较为接近,模型测试集的误差在0.13~0.27,决定系数约78.3%,需要进一步优化算法来提高测试集的预测精度。 展开更多
关键词 RF-XGBoost算法 汽油 辛烷值损失 预测模型 操作特征 调优策略
下载PDF
极端梯度提升与随机森林融合的天然气露点预测方法 被引量:2
11
作者 熊伟 何彦霖 +2 位作者 宋伟 张厚望 尹爱军 《装备环境工程》 CAS 2022年第6期133-140,共8页
目的解决目前水露点数据多为人工采用测量仪器测得,时效性低且成本高昂的问题。方法建立一种基于极端梯度提升(XGBoost)和随机森林(RF)的天然气水露点预测方法。采用XGBoost方法对所有监测工艺参数进行分析,筛选出主要影响水露点的关键... 目的解决目前水露点数据多为人工采用测量仪器测得,时效性低且成本高昂的问题。方法建立一种基于极端梯度提升(XGBoost)和随机森林(RF)的天然气水露点预测方法。采用XGBoost方法对所有监测工艺参数进行分析,筛选出主要影响水露点的关键工艺特征参数,以排除无关特征参数对预测的干扰。建立RF预测模型,输入关键特征集参数,实现对水露点的实时预测。以重庆气矿某脱水监测系统监测数据与生产数据为例,对所提预测方法进行对比分析验证。结果相较于XGBoost、SVM等预测方法,RF模型具有最佳的预测性能,且经过XGBoost特征选择后,RF预测结果的MAE值降低了0.0169℃,RMSE值降低了0.0146℃。结论基于极端梯度提升与随机森林融合的水露点预测方法具有更优的预测精度与鲁棒性,对指导脱水现场生产具有积极作用。 展开更多
关键词 三甘醇脱水装置 天然气水露点 极端梯度提升(XGBOOST) 特征提取 随机森林(RF)
下载PDF
大数据平台下的电力负荷预测系统设计与实现 被引量:9
12
作者 夏博 杨超 郑凯文 《自动化仪表》 CAS 2018年第6期81-84,共4页
在常规的电力系统负荷预测过程中,所用的预测方法不能快速、有效地训练大量数据样本,并且不能有效地运用历史数据。为了解决这些问题,设计了一种基于大数据平台的电力系统负荷预测模型。运用Xgboost算法搭建训练样本模型生成决策树,为... 在常规的电力系统负荷预测过程中,所用的预测方法不能快速、有效地训练大量数据样本,并且不能有效地运用历史数据。为了解决这些问题,设计了一种基于大数据平台的电力系统负荷预测模型。运用Xgboost算法搭建训练样本模型生成决策树,为了防止在该过程中出现过拟合,采用了Gradient Boosting思想和Shrinkage思想;搭建Hadoop平台部署Xgboost算法。通过对某省M县实际负荷数据特性的分析,构建了基于负荷的时间特性、温度特性的训练样本,分别进行了夏季、冬季情况下的负荷预测,同时与随机森林(RF)算法和梯度提升决策树(GBDT)算法进行对比。预测试验对比验证了Xgboost算法具有准确性好、训练速度快等特点,且在开启多线程的情况下,Xgboost算法有更明显的提升。 展开更多
关键词 负荷预测 大数据 Xgboost 随机森林 梯度提升决策树
下载PDF
基于机器学习的药物血浆蛋白结合率的预测 被引量:4
13
作者 付洺宇 朱一阳 +2 位作者 吴春勇 侯凤贞 关媛 《中国药科大学学报》 CAS CSCD 北大核心 2021年第6期699-706,共8页
预测药物在血浆中的蛋白结合率,有助于了解药物的药代动力学特征,对药物发现的早期研究有重要的参考价值。本研究收集了2452个临床药物的血浆蛋白结合率信息,用Molecular Operating Environment(MOE)和Mordred两种软件计算分子描述符,... 预测药物在血浆中的蛋白结合率,有助于了解药物的药代动力学特征,对药物发现的早期研究有重要的参考价值。本研究收集了2452个临床药物的血浆蛋白结合率信息,用Molecular Operating Environment(MOE)和Mordred两种软件计算分子描述符,将算得的分子描述符作为模型的输入特征。使用极端梯度提升(extreme gradient boosting,XGBoost)算法和随机森林(randomforest,RF)算法构建机器学习模型。结果表明,与MOE相比,将Mordred计算的分子描述符作为模型的输入,构建的模型预测性能更优。使用XGBoost算法和RF算法构建模型的预测性能结果相近,最优模型的R2均为0.715。此外,根据研究结果得出药物血浆蛋白结合率与药物分子的一些理化性质参数,如水溶性,辛醇/水分配系数以及共轭双键密切相关。通过这些参数预测药物血浆蛋白结合率具有方便快捷的优点,可以为相关药代动力学研究提供参考依据。 展开更多
关键词 血浆蛋白结合率 机器学习 XGBoost算法 RF算法 药物发现
下载PDF
一种面向高维缺失不平衡数据的信用评估方法 被引量:3
14
作者 樊东醒 叶春明 《计算机应用研究》 CSCD 北大核心 2021年第9期2667-2672,共6页
传统随机森林填补方法并未考虑高维不平衡问题导致填补没有针对性,且使用0值预填补的方式可能会引入噪声并导致预测精度降低,因此提出一种基于Q学习和随机森林的缺失值填补方法(QL-RF)。该方法在特征选择后使用Q-learning权衡填补精度... 传统随机森林填补方法并未考虑高维不平衡问题导致填补没有针对性,且使用0值预填补的方式可能会引入噪声并导致预测精度降低,因此提出一种基于Q学习和随机森林的缺失值填补方法(QL-RF)。该方法在特征选择后使用Q-learning权衡填补精度和填补数量,通过计算奖励筛选出具有填补价值的样本和特征组合,然后利用冗余特征填补重要特征中的缺失,并重点填补了少数类样本。此外,为提高不平衡数据下的分类效果,基于Bagging框架提出一种融合量子粒子群算法(QPSO)和XGBoost的集成分类模型(QXB)。实验表明:QL-RF在G-means、F_(1)-measure、AUC指标下均优于传统RF填补法,QXB显著优于SMOTE-RF和SMOTE-XGBoost,所提方法能够有效地处理高维不平衡数据下的缺失和分类问题。 展开更多
关键词 高维不平衡 QL-RF BAGGING QPSO XGBoost QXB
下载PDF
基于CPSO-XGboost的个人信用评估 被引量:16
15
作者 王名豪 梁雪春 《计算机工程与设计》 北大核心 2019年第7期1891-1895,共5页
在大数据时代的背景下,个人信用数据指标日益繁杂。为降低个人信用数据冗余性,使用基于随机森林与梯度提升决策树组合的特征选取方法;提出混沌粒子群算法优化XGboost信用评估模型参数,提高个人信用评估准确性。实例分析结果表明,CPSO-XG... 在大数据时代的背景下,个人信用数据指标日益繁杂。为降低个人信用数据冗余性,使用基于随机森林与梯度提升决策树组合的特征选取方法;提出混沌粒子群算法优化XGboost信用评估模型参数,提高个人信用评估准确性。实例分析结果表明,CPSO-XGboost相比XGboost、Logistic和SVM在个人信用评估中具有更高的稳定性和准确性。 展开更多
关键词 个人信用评估 极端梯度提升树 混沌粒子群 特征选择 随机森林 梯度提升决策树
下载PDF
XGBoost算法在四川省GPM降水数据降尺度中的应用 被引量:3
16
作者 廉睿玲 《水电能源科学》 北大核心 2021年第10期14-17,共4页
针对GPM降水产品低空间分辨率的缺陷,结合四川省156个站点观测资料及地形、海陆位置、水汽、地表覆盖等环境变量,运用XGBoost和随机森林(RF)算法建立降尺度模型,将区域GPM产品从0.1°空间分辨率提升至1 km。结果表明,融合多源环境... 针对GPM降水产品低空间分辨率的缺陷,结合四川省156个站点观测资料及地形、海陆位置、水汽、地表覆盖等环境变量,运用XGBoost和随机森林(RF)算法建立降尺度模型,将区域GPM产品从0.1°空间分辨率提升至1 km。结果表明,融合多源环境因子的XGBoost和RF降尺度模型具有可靠性,与原GPM数据相比在提高空间分辨率的同时,数据精度决定系数R2增加了6.98%~8.14%,平均相对误差M AE、均方根误差RMSE分别减小了15.34%~30.17%、8.97%~17.27%;XGBoost比RF模型的R2提升0.01,M AE、RMSE分别减小3.47、6.53 mm;四川省GPM产品经降尺度后的空间误差与降水量分布一致,降水丰富地区的模型不确定性更强,模型误差主要受水汽、地表覆被因子影响,海陆位置和地形的影响较小。 展开更多
关键词 GPM降水产品 降尺度 XGBoost算法 RF模型 模型精度
下载PDF
基于RF特征选择和XGBoost模型的赤潮等级预测 被引量:3
17
作者 赖祥源 朱勤东 +2 位作者 陈火荣 王臻 陈佩君 《渔业研究》 2021年第1期1-12,共12页
赤潮的发生是各种自然因素综合作用的结果,涉及物理、化学、生物等方面的因素。针对赤潮预测中影响因子选取难、准确率不够等问题,本文提出一种基于随机森林(RF)特征选择方法的极端梯度提升树(XGBoost)赤潮等级预测模型。以三沙湾赤潮... 赤潮的发生是各种自然因素综合作用的结果,涉及物理、化学、生物等方面的因素。针对赤潮预测中影响因子选取难、准确率不够等问题,本文提出一种基于随机森林(RF)特征选择方法的极端梯度提升树(XGBoost)赤潮等级预测模型。以三沙湾赤潮监控区为研究区,将2005—2019年间湾区内发生的赤潮事件数据作为模型输入数据,结合随机森林算法的特征重要性和皮尔逊相关性分析得出特征最终排序。其次,根据RF算法在各特征下的AUC值求得模型最佳特征数并结合特征重要性选出XGBoost模型所需的最佳特征集合。最后,利用最佳特征集合对XGBoost分类模型进行训练。实验结果表明,该方法相比其他分类方法可以达到较高的分类精度,能够为三沙湾赤潮等级预测提供新的解决方法。 展开更多
关键词 RF 特征选择 XGBoost 赤潮等级预测
下载PDF
基于XGBoost算法的预警模型研究 被引量:2
18
作者 陆万万 王维芳 马煜敏 《电子设计工程》 2022年第19期49-54,59,共7页
针对智慧警务建设过程中犯罪预警机制滞后的问题,提出了一种融合警务系统中人员数据的通用预警模型。该模型采用随机森林算法对高维稀疏样本特征进行重要性排序,筛选得到最优特征子集。利用SMOTE过采样算法对训练集样本进行采样处理,以... 针对智慧警务建设过程中犯罪预警机制滞后的问题,提出了一种融合警务系统中人员数据的通用预警模型。该模型采用随机森林算法对高维稀疏样本特征进行重要性排序,筛选得到最优特征子集。利用SMOTE过采样算法对训练集样本进行采样处理,以平衡正负样本集。该文预警模型基于XGBoost算法实现风险样本数据的分类提取,并使用粒子群优化算法对XGBoost模型的AUC值为目标函数做参数调优,提高模型预测精度。结果表明,该模型在不均衡数据集下平均准确度可达到90%以上。 展开更多
关键词 大数据 XGBoost 随机森林(RF) SMOTE过采样算法 粒子群算法(PSO)
下载PDF
基于机器学习算法的股指期货价格预测模型研究 被引量:1
19
作者 杨学威 《软件工程》 2022年第12期1-8,共8页
人工智能技术和量化投资领域的结合,诞生了各类基于机器学习算法的价格预测模型。为研究不同机器学习算法在股指期货价格预测中的应用效果,采用支持向量回归、长短期记忆网络、随机森林及极端梯度提升树四种常用的机器学习算法构建价格... 人工智能技术和量化投资领域的结合,诞生了各类基于机器学习算法的价格预测模型。为研究不同机器学习算法在股指期货价格预测中的应用效果,采用支持向量回归、长短期记忆网络、随机森林及极端梯度提升树四种常用的机器学习算法构建价格预测模型,对沪深300股指期货价格进行预测研究,并利用贝叶斯算法对模型进行超参数优化,对比贝叶斯优化对于以上四种机器学习算法预测精度的提升效果。研究结果表明,随机森林和极端梯度提升树因其模型自身的优点,可以实现对金融时序数据的准确预测,而贝叶斯优化利用高斯过程,不断更新先验,可以显著提高支持向量回归预测效果,均方误差(MSE)、平均绝对误差(MAE)、对称平均绝对百分比误差(SMAPE)和损失适应度(LOSS)分别降低了78.6%、94.7%、95.1%和97.0%。 展开更多
关键词 机器学习 支持向量机 长短期记忆网络 随机森林 极端梯度提升树
下载PDF
基于EMD-XGB-ELM和FSGM双元处理的碳排放交易价格集成预测
20
作者 周坤 高晓辉 李廉水 《中国管理科学》 CSSCI CSCD 北大核心 2024年第10期325-334,共10页
碳排放交易价格的精准预测是推动碳金融市场可持续发展的基础。针对碳金融市场交易价格的连贯演进和同比演进特征,从纵向维度和横向维度的双元处理视角出发,以经验模态分解(EMD)、极端梯度提升(XGBoost)、极限学习机(ELM)、分数阶季节... 碳排放交易价格的精准预测是推动碳金融市场可持续发展的基础。针对碳金融市场交易价格的连贯演进和同比演进特征,从纵向维度和横向维度的双元处理视角出发,以经验模态分解(EMD)、极端梯度提升(XGBoost)、极限学习机(ELM)、分数阶季节性灰色系统(FSGM)及其组合模型,构建基于随机森林(RF)的集成预测模型。选取国内外6个碳交易市场作为研究对象,并以深圳碳交所为例进行专项分析。为验证所提出模型的有效性,进一步将其与季节性指数平滑(HW)、支持向量机(SVM)、长短期记忆网络(LSTM)、FSGM、RF以及EDM-XGB-ELM等模型的预测结果进行对比。研究结果表明,本文提出的预测模型较基准模型具备更高的预测性能,且这种基于双元处理层面的建模范式在其他领域也具备较好的应用前景。 展开更多
关键词 碳金融 EMD-XGBoost-ELM FSGM RF 双元处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部