期刊文献+
共找到134篇文章
< 1 2 7 >
每页显示 20 50 100
Modeling of Total Dissolved Solids (TDS) and Sodium Absorption Ratio (SAR) in the Edwards-Trinity Plateau and Ogallala Aquifers in the Midland-Odessa Region Using Random Forest Regression and eXtreme Gradient Boosting
1
作者 Azuka I. Udeh Osayamen J. Imarhiagbe Erepamo J. Omietimi 《Journal of Geoscience and Environment Protection》 2024年第5期218-241,共24页
Efficient water quality monitoring and ensuring the safety of drinking water by government agencies in areas where the resource is constantly depleted due to anthropogenic or natural factors cannot be overemphasized. ... Efficient water quality monitoring and ensuring the safety of drinking water by government agencies in areas where the resource is constantly depleted due to anthropogenic or natural factors cannot be overemphasized. The above statement holds for West Texas, Midland, and Odessa Precisely. Two machine learning regression algorithms (Random Forest and XGBoost) were employed to develop models for the prediction of total dissolved solids (TDS) and sodium absorption ratio (SAR) for efficient water quality monitoring of two vital aquifers: Edward-Trinity (plateau), and Ogallala aquifers. These two aquifers have contributed immensely to providing water for different uses ranging from domestic, agricultural, industrial, etc. The data was obtained from the Texas Water Development Board (TWDB). The XGBoost and Random Forest models used in this study gave an accurate prediction of observed data (TDS and SAR) for both the Edward-Trinity (plateau) and Ogallala aquifers with the R<sup>2</sup> values consistently greater than 0.83. The Random Forest model gave a better prediction of TDS and SAR concentration with an average R, MAE, RMSE and MSE of 0.977, 0.015, 0.029 and 0.00, respectively. For the XGBoost, an average R, MAE, RMSE, and MSE of 0.953, 0.016, 0.037 and 0.00, respectively, were achieved. The overall performance of the models produced was impressive. From this study, we can clearly understand that Random Forest and XGBoost are appropriate for water quality prediction and monitoring in an area of high hydrocarbon activities like Midland and Odessa and West Texas at large. 展开更多
关键词 Water Quality Prediction Predictive Modeling Aquifers Machine Learning regression extreme gradient boosting
下载PDF
一种基于贝叶斯优化和XGBoost的膏体流变参数预测模型
2
作者 赵艳伟 胡正祥 +4 位作者 乔登攀 姚晋龙 李广涛 杨天雨 王俊 《有色金属(矿山部分)》 2024年第5期118-128,共11页
探究膏体充填料浆流变特性,对矿山合理布置充填管路,高效进行充填作业有重要意义。目的:将繁琐且影响因素众多的膏体流变参数测量试验与先进的机器学习回归预测模型相结合,实现膏体流变参数的准确预测。方法:利用不同物料配合比条件下共... 探究膏体充填料浆流变特性,对矿山合理布置充填管路,高效进行充填作业有重要意义。目的:将繁琐且影响因素众多的膏体流变参数测量试验与先进的机器学习回归预测模型相结合,实现膏体流变参数的准确预测。方法:利用不同物料配合比条件下共128组膏体流变特性试验数据作为模型数据集,选择极度梯度提升回归树(XGBoost)模型,结合贝叶斯算法(BO)对模型进行超参数寻优设置,建立了多目标参数回归预测模型。结果:研究结果表明:经贝叶斯算法优化后的BO-XGBoost模型较XGBoost模型性能显著提升,决定系数R^(2)提高6%。所构建BO-XGBoost模型真实值与预测值在屈服应力数据集上相对误差维持在0.02水平;黏度数据集维持在0.1水平。结论:BO-XGBoost模型可实现膏体流变参数的高效准确预测,创新性地使用了多目标回归模型,为矿山充填作业设计提供参考,具有一定实际工程应用意义。 展开更多
关键词 膏体充填 流变特性 机器学习 贝叶斯优化 极度提升回归树
下载PDF
基于BiLSTM-XGBoost混合模型的储层岩性识别
3
作者 杜睿山 黄玉朋 +2 位作者 孟令东 张轶楠 周长坤 《计算机系统应用》 2024年第6期108-116,共9页
储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidi... 储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidirectional long short-term memory,BiLSTM)和极端梯度提升决策树(extreme gradient boosting decision tree,XGBoost),提出双向记忆极端梯度提升(BiLSTM-XGBoost,BiXGB)模型预测储层岩性.该模型在传统XGBoost基础上融入了BiLSTM,大大增强了模型对测井数据的特征提取能力.BiXGB模型使用BiLSTM对测井数据进行特征提取,将提取到的特征传递给XGBoost分类模型进行训练和预测.将BiXGB模型应用于储层岩性数据集时,模型预测的总体精度达到了91%.为了进一步验证模型的准确性和稳定性,将模型应用于UCI公开的Occupancy序列数据集,结果显示模型的预测总体精度也高达93%.相较于其他机器学习模型,BiXGB模型能准确地对序列数据进行分类,提高了储层岩性的识别精度,满足了油气勘探的实际需要,为储层岩性识别提供了新的方法. 展开更多
关键词 神经网络 机器学习 测井数据 岩性分类 BiLSTM xgboost
下载PDF
结合SVM与XGBoost的链式多路径覆盖测试用例生成
4
作者 钱忠胜 俞情媛 +3 位作者 张丁 姚昌森 秦朗悦 成轶伟 《软件学报》 EI CSCD 北大核心 2024年第6期2795-2820,共26页
机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借... 机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借助遗传算法实现多路径测试数据生成.首先,利用一定样本训练若干个用于预测路径节点状态的子模型(SVM和XGBoost),通过子模型的预测精度值筛选最优子模型,并根据路径节点顺序将其依次链接,形成一个链式模型C-SVMXGBoost(chained SVM and XGBoost).在利用遗传算法生成测试用例时,使用训练好的链式模型代替插桩法获取测试数据覆盖路径(预测路径),寻找预测路径与目标路径相似的路径集,对存在相似路径集的预测路径进行插桩验证,获取精确路径,计算适应度值.在交叉变异过程中引入样本集中路径层级深度较大的优秀测试用例进行重用,生成覆盖目标路径的测试数据.最后,保留进化生成中产生的适应度较高的个体,更新链式模型C-SVMXGBoost,进一步提高测试效率.实验表明,C-SVMXGBoost较其他各对比链式模型更适合解决路径预测问题,可提高测试效率.并且通过与已有经典方法相比,所提方法在覆盖率上提高可达15%,平均进化代数也有所降低,在较大规模程序上其降低百分比可达65%. 展开更多
关键词 测试用例 SVM xgboost 链式模型 多路径覆盖
下载PDF
基于SC-XGBoost的电站燃煤低位发热量软测量方法
5
作者 乔世超 王轶男 +4 位作者 吕佳阳 陈衡 刘涛 徐钢 翟融融 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第S01期332-340,共9页
随着国家大力推进能源供给侧结构性改革,新能源装机容量不断提升,电力市场竞争愈加激烈。另一方面,全球煤炭市场的复杂多变,导致以煤炭为能量来源的发电企业成本上涨。燃煤发热量是衡量煤质的重要评价标准之一,也是采购煤炭最重要的依据... 随着国家大力推进能源供给侧结构性改革,新能源装机容量不断提升,电力市场竞争愈加激烈。另一方面,全球煤炭市场的复杂多变,导致以煤炭为能量来源的发电企业成本上涨。燃煤发热量是衡量煤质的重要评价标准之一,也是采购煤炭最重要的依据,对燃煤发热量进行准确预测能够有效地控制电厂运行采购成本。为了实现燃煤发热量的高效预测,采用Pearson系数对相关变量进行特征选取,采用基于密度的噪点空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法对某电厂自备煤厂近2年1733条化验数据进行去噪,对去噪后数据进行谱聚类(Spectral Clustering,SC)分析。将分类后的子样本集采用极致梯度提升(Extreme Gradient Boosting,XGBoost)算法分别建立预测模型,并与最小二乘法回归(Ordinary Least Squares,OLS)、支持向量机(Support Vector Machines,SVM)模型进行性能比较。结果表明,基于XGBoost的电站燃煤发热量预测模型相较于其他算法准确性有明显提升,泛化能力更强。对经过SC算法分类后的燃煤分别建立预测模型能够进一步提高模型的精细化水平,为燃煤电站发热量预测提供一种可靠高效的方法。 展开更多
关键词 低位发热量 机器学习 谱聚类 极致梯度提升(xgboost) 软测量
下载PDF
井下动态环境基于DAE的XGBoost自适应定位算法研究
6
作者 洪金祥 崔丽珍 窦占树 《传感器与微系统》 CSCD 北大核心 2024年第10期23-26,30,共5页
针对煤矿井下高动态环境导致WiFi定位模型的精度降低的问题,提出极端梯度提升(XGBoost)的指纹定位算法,利用其高维数据特征的学习能力完成定位。与传统的梯度提升树(GBDT)算法相比,在完成更好定位效果的同时,速度也大大提升。同时针对W... 针对煤矿井下高动态环境导致WiFi定位模型的精度降低的问题,提出极端梯度提升(XGBoost)的指纹定位算法,利用其高维数据特征的学习能力完成定位。与传统的梯度提升树(GBDT)算法相比,在完成更好定位效果的同时,速度也大大提升。同时针对WiFi数据的波动性和XGBoost算法面对动态环境模型漂移问题,分别提出融合降噪自编码器(DAE)和自适应机制的D-XGBoost算法和Z-XGBoost算法。实验结果表明:XGBoost算法的定位精度比GBDT算法提高了,效率提高了5倍多。融合DAE的D-XG-Boost算法的定位准确率比XGBoost算法提高了17%;融合了自适应机制的Z-XGBoost算法有效降低了模型漂移造成的误差。所提改进算法更好地改善了WiFi定位模型精度降低和模型漂移问题。 展开更多
关键词 极端梯度提升 井下指纹定位 模型漂移 降噪自编码器 误差补偿
下载PDF
基于改进XGBoost的金融客户投资行为特征选择方法
7
作者 吴成英 马东方 《计算机应用》 CSCD 北大核心 2024年第S01期330-336,共7页
金融客户投资购买行为是投资者动态购买理财产品交易决策的综合结果,受到客户自身属性、产品因素、行情信息和历史交易等多个不同因素的影响,原始因子属性的特征维度庞大、拟合风险偏高。现有研究主要通过不同的算法提高特征选择的准确... 金融客户投资购买行为是投资者动态购买理财产品交易决策的综合结果,受到客户自身属性、产品因素、行情信息和历史交易等多个不同因素的影响,原始因子属性的特征维度庞大、拟合风险偏高。现有研究主要通过不同的算法提高特征选择的准确率,忽略了不同群体的差异化特征及动态因素的影响。因此,提出一种改进XGBoost(eXtreme Gradient Boosting)的特征选择算法,并在金融客户投资行为上应用研究。针对客户群体投资行为的差异性,多维度综合量化分析投资行为,以解决单一投资行为指标不合理问题;对不同客户群体通过主成分分析(PCA)降维和优化的K-均值(K-means)聚类算法进行多属性融合聚类,然后分别对聚类后的不同群体使用改进XGBoost进行多分类预测,并通过修剪特征因子提升预测准确率。实验结果表明,使用改进XGBoost后,金融客户投资行为的特征因子维度更贴近实际,准确率更高。 展开更多
关键词 特征选择 xgboost 多类别分类 主成分分析 K-MEANS聚类 投资行为
下载PDF
基于ISSA-XGBoost的毕赤酵母菌发酵软测量
8
作者 沈瑶 张立刚 王建扬 《传感器与微系统》 CSCD 北大核心 2024年第8期122-125,共4页
针对毕赤酵母菌发酵过程菌体浓度难以在线检测,离线测量又存在极易染菌导致数据集不完整等问题,提出了一种基于改进麻雀搜索算法(ISSA)优化极致梯度提升(XGBoost)的软测量建模方法。首先,利用主成分分析(PCA)算法对样本数据进行主元分析... 针对毕赤酵母菌发酵过程菌体浓度难以在线检测,离线测量又存在极易染菌导致数据集不完整等问题,提出了一种基于改进麻雀搜索算法(ISSA)优化极致梯度提升(XGBoost)的软测量建模方法。首先,利用主成分分析(PCA)算法对样本数据进行主元分析,降低噪声和冗余度;然后,在标准麻雀算法(SSA)中引入自适应超参数和混合变异策略,增强了算法跳出局部极值和全局搜索的能力;最后,构建菌体浓度的ISSA-XGBoost软测量模型,并与XGBoost、SSA-XGBoost模型进行比较。仿真实验结果表明:ISSA-XGBoost模型的均方根误差(RMSE)、平均相对误差(MRE)均比XGBoost、SSA-XGBoost模型低,且ISSA-XGBoost的决定系数(R^(2))更接近于1,说明预测精度明显优于改进前,能够满足对毕赤酵母菌发酵过程菌体浓度的实时测量。 展开更多
关键词 毕赤酵母 麻雀算法 极致梯度提升 软测量模型
下载PDF
在线医药电商评论情感分析——基于XGBoost集成加权词向量和大语言模型的情感识别模型
9
作者 田梦影 时维 《科技和产业》 2024年第9期128-135,共8页
消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost... 消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost(极限梯度提升树)集成词向量和LLM(大语言模型)构建情感识别模型,最后得出评论情感指数,从多个维度展开,分析消费者评论中的情感趋势。实证分析表明,构建的情感识别模型的AUC(曲线下的面积)等验证指标较LLM模型相比有进一步提升,具有一定的应用价值。 展开更多
关键词 在线医药电商 LLM(大语言模型) xgboost(极限梯度提升树)算法 情感指数 情感识别
下载PDF
群智能算法优化XGBoost的信贷风险预测 被引量:1
10
作者 朱丽华 龙海侠 《计算机工程与应用》 CSCD 北大核心 2023年第23期305-310,共6页
为改善极端梯度提升(extreme gradient boosting,XGBoost)集成算法的信贷风险预测准确率,提出了一种改进的麻雀算法(improved sparrow search algorithm based on golden sine search,Cauchy mutation and oppositionbased learning,GCO... 为改善极端梯度提升(extreme gradient boosting,XGBoost)集成算法的信贷风险预测准确率,提出了一种改进的麻雀算法(improved sparrow search algorithm based on golden sine search,Cauchy mutation and oppositionbased learning,GCOSSA)来优化XGBoost参数。采用黄金正弦搜索策略来更新发现者位置,既增强全局搜索能力又增强局部搜索能力;在算法中引入反向学习策略和柯西变异进行扰动来扩大搜索领域改善陷入局部最优,同时使用贪婪规则确定最优解;将改进的算法用6个基准函数进行测试,并对SSA和GCOSSA进行对比,评估GCOSSA寻优性能;用GCOSSA优化XGBoost参数。在数据集上测试,并与网格搜索寻优、SSA及其混合正余弦改进算法(improved sparrow search algorithm based on sine and cosine,ISSA)方法进行对比。结果表明改进后的GCOSSA优化XGBoost参数,在信贷风险预测中准确率更高。 展开更多
关键词 麻雀搜索算法 黄金正弦搜索 反向学习 柯西变异 极端梯度提升(xgboost)
下载PDF
基于RFE-BXGBoost的轴承套圈沟道表面缺陷识别方法 被引量:1
11
作者 徐凯 张会妨 《机电工程》 CAS 北大核心 2023年第11期1691-1699,共9页
轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基... 轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基于特征衍生的思想,对轴承沟道的时域、频域等特征进行了提取,使用了极度梯度提升树(XGBoost)作为基于特征递归消除(RFE)的基学习器,对影响轴承沟道表面缺陷最佳特征子集进行了选择,并过滤了冗余特征;然后,利用基于贝叶斯优化的XGBoost模型组成弱分类器,为了降低模型预测结果的方差,使用有放回随机抽样法,对基分类器进行了选取;最后,根据抽样结果,利用投票法获得了最终的表面缺陷识别结果,并使用轴承套圈沟道实测数据集进行了模型预测性能的测试。实验结果表明:基于RFE-BXGBoost的表面缺陷识别模型的识别准确率为0.90,F1-score为0.879,优于仅使用自适应提升法(Adaboost)、随机森林、梯度提升树的表面缺陷识别结果。研究结果表明:该表面缺陷识别模型对复杂零部件和系统的表面缺陷识别有一定的效果。 展开更多
关键词 滚动轴承 特征递归消除 极度梯度提升树 轴承套圈沟道 有放回随机抽样 集成模型
下载PDF
基于UKDE和XGBoost的航班过站时间动态预测
12
作者 吴薇薇 熊奥萍 唐红武 《南京航空航天大学学报》 CAS CSCD 北大核心 2023年第6期1016-1024,共9页
为了提高机场运行高峰时航班过站时间预测的精度及可靠性,研究了一种结合无偏核密度估计(Unbiased kernel density estimation,UKDE)和极端梯度提升决策树(Extreme gradient boosting,XGBoost)模型的航班过站时间动态预测方法。首先,考... 为了提高机场运行高峰时航班过站时间预测的精度及可靠性,研究了一种结合无偏核密度估计(Unbiased kernel density estimation,UKDE)和极端梯度提升决策树(Extreme gradient boosting,XGBoost)模型的航班过站时间动态预测方法。首先,考虑模型输入变量航班密度的连续性和不确定性变化,利用UKDE法估计机场航班密度,将其作为动态指标输入模型。其次,引入量子粒子群(Quantum particle swarm optimization,QPSO)法优化XGBoost模型。最后,考虑前序航班延误发生前后输入特征的变化,利用初始预测结果对航班密度进行修正,得到二阶段预测结果。研究结果表明:本文方法在高峰时段的预测平均绝对误差为7.365 min,效果优于随机森林(Random forest,RF)、粒子群(Particle swarm optimization,PSO)-XGBoost和XGBoost,修正后的预测结果平均绝对误差减少了3.373 min;模型输入参数按敏感性程度由高到低依次为航班密度、前序航班提前到港时间和延误到港时间。 展开更多
关键词 航空运输 时间预测 极端梯度提升决策树 航班过站保障 核密度估计
下载PDF
基于LSTM-XGBoost和多模型算法的短期负荷预测
13
作者 邵必林 庄雪莉 曾卉玢 《计算机时代》 2023年第12期49-54,共6页
针对负荷数据波动性强、特征存在冗余而导致使用单一模型预测短期负荷时精度较低的问题,提出一种融合梯度提升树(GBDT)、自适应噪声完备集合经验模态分解(CEEMDAN)、长短期记忆(LSTM)和极端梯度提升(XGBoost)的短期负荷预测组合方法。... 针对负荷数据波动性强、特征存在冗余而导致使用单一模型预测短期负荷时精度较低的问题,提出一种融合梯度提升树(GBDT)、自适应噪声完备集合经验模态分解(CEEMDAN)、长短期记忆(LSTM)和极端梯度提升(XGBoost)的短期负荷预测组合方法。首先利用GBDT对负荷数据集进行特征选择,筛选出重要特征;然后使用CEEMDAN将负荷序列分解后合并为低频分量和高频分量;再将低频分量输入到LSTM中进行预测,将高频分量输入到XGBoost中进行预测;最后,短期负荷的最终预测结果由两个模型的预测结果进行叠加而成。与单一预测模型相比,所提方法在短期负荷方面具有更高的准确性。 展开更多
关键词 长短期记忆 极端梯度提升 短期负荷预测 自适应噪声完备集合经验模态分解 梯度提升树
下载PDF
基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型 被引量:3
14
作者 陈曦泽 贾俊峰 +2 位作者 白玉磊 郭彤 杜修力 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第6期1061-1070,共10页
为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV... 为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合.采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较.使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释.结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出. 展开更多
关键词 钢管混凝土(CFST)柱 轴向承载力 极限梯度提升(xgboost) 超参数优化 SHAP 可解释性
下载PDF
基于XGBoost-LSTM的胶凝砂砾石抗压强度预测 被引量:2
15
作者 郭磊 高航 +2 位作者 田青青 郭利霞 李泽宣 《建筑材料学报》 EI CAS CSCD 北大核心 2023年第6期631-637,共7页
针对胶凝砂砾石(CSG)抗压强度试验周期长、耗材大等问题,运用极度梯度提升树-长短期记忆网络(XGBoost-LSTM)组合模型对CSG抗压强度进行预测.先选取相关性较强的“水泥含量”和“砂率”这2个输入变量代入XGBoost模型进行预测,并将结果与... 针对胶凝砂砾石(CSG)抗压强度试验周期长、耗材大等问题,运用极度梯度提升树-长短期记忆网络(XGBoost-LSTM)组合模型对CSG抗压强度进行预测.先选取相关性较强的“水泥含量”和“砂率”这2个输入变量代入XGBoost模型进行预测,并将结果与原特征一起代入LSTM模型;再采用94组抗压强度数据进行训练和验证.结果表明:与基础模型XGBoost和LSTM相比,XGBoost-LSTM组合模型的决定系数分别提高5.6%和3.5%.说明通过XGBoost模型构造新特征具有可行性,且XGBoost-LSTM组合模型能够对CSG抗压强度进行精准预测. 展开更多
关键词 极度梯度提升树 长短期记忆网络 胶凝砂砾石 抗压强度
下载PDF
基于XGBoost扩展金融因子的风电功率预测方法 被引量:4
16
作者 王永生 关世杰 +3 位作者 刘利民 高静 许志伟 刘广文 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第5期1038-1049,共12页
现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序... 现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序数据衍生金融因子的预测模型.采用具有较高预测准确率与较快训练速度的XGBoost算法进行预测,使得预测模型快速收敛.在中国内蒙古某风电场的风电功率数据集与德国Tennet公司风电功率数据集上进行实验验证.实验结果表明,以R2score为例,所提方法与基准方法相比提升约14.71%.所提方法中的建模与预测合计时间不超过500 ms. 展开更多
关键词 风力发电 超短期风电功率预测 梯度提升回归树 xgboost 金融因子
下载PDF
基于CEEMD-PCA-XGBoost的滚动轴承故障诊断方法 被引量:1
17
作者 马东 何毅斌 +2 位作者 李铭 唐权 胡明涛 《机电工程》 CAS 北大核心 2023年第2期186-194,共9页
在轴承的故障诊断过程中,往往会存在因数据缺失或分布不均,从而导致其运算速度慢和分类准确率低的问题,为此,提出了一种互补集成经验模态分解结合主成分分析和极限梯度提升(CEEMD-PCA-XGBoost)的故障诊断方法。首先,基于互补集成经验模... 在轴承的故障诊断过程中,往往会存在因数据缺失或分布不均,从而导致其运算速度慢和分类准确率低的问题,为此,提出了一种互补集成经验模态分解结合主成分分析和极限梯度提升(CEEMD-PCA-XGBoost)的故障诊断方法。首先,基于互补集成经验模态分解(CEEMD)对第三方轴承故障数据集进行时域和频域的特征提取,实现了数据初步筛选的目的;然后,采用主成分分析法(PCA),降低了分解后的本征模态函数分量(IMF)的特征值维度;将提取的特征量作为输入量,输入到极限梯度提升(XGBoost)模型中,并采用栅格法优化了模型的参数;最后,通过2种不同轴承数据集对该方法进行了验证,并从分类精度、准确度等角度出发,将该方法所得结果与采用其他算法所得到的结果进行了对比分析。实验结果表明:经美国凯斯西储大学轴承数据集检验,采用优化后的算法模型得到的分类准确率为100%,运算时间为11.264 s;经IEEE PHM 2012数据集验证,采用该算法得到的轴承寿命预测曲线拟合效果优于其他算法。研究结果表明:在运算速度和分类准确率方面,该轴承故障诊断方法具有较好的综合性能。 展开更多
关键词 特征提取 互补集成经验模态分解 主成分分析 极限梯度提升 分类准确率 特征值维度
下载PDF
基于XGBoost-RF的制冷剂泄漏故障检测与诊断 被引量:1
18
作者 吴孔瑞 韩华 +3 位作者 任正雄 高雨 江松轩 杨钰婷 《暖通空调》 2023年第1期105-111,130,共8页
针对冷水机组运行中正常数据多于故障数据情况和制冷系统中最常见的制冷剂泄漏故障,本文采用极端梯度提升算法(XGBoost)建立故障检测模型,采用随机森林(RF)算法建立故障诊断模型,研究了检测阈值改变对检测模型的影响及有、无正常样本训... 针对冷水机组运行中正常数据多于故障数据情况和制冷系统中最常见的制冷剂泄漏故障,本文采用极端梯度提升算法(XGBoost)建立故障检测模型,采用随机森林(RF)算法建立故障诊断模型,研究了检测阈值改变对检测模型的影响及有、无正常样本训练的诊断模型的对比。结果表明,在检测阈值设定为0.99时,可保证大部分故障样本均能被检测出来,且虚警率低,仅由故障数据训练得到的诊断模型整体性能最佳,可最大限度发挥检测模型和诊断模型的优势。 展开更多
关键词 冷水机组 制冷剂泄漏 故障检测与诊断 极端梯度提升 随机森林 阈值
下载PDF
基于双层XGBoost和数据增强的空间负荷预测方法 被引量:3
19
作者 黄冬梅 张宁宁 +3 位作者 胡安铎 胡伟 肖勇 陈岸青 《电力工程技术》 北大核心 2023年第1期201-208,共8页
为了解决空间负荷预测面临的特征变量众多和数据匮乏问题,文中提出一种基于双层极端梯度提升(extreme gradient boosting,XGBoost)和数据增强的空间负荷预测方法。该方法首先将待预测区域按馈线供电范围划分为若干子区域;其次构建基于双... 为了解决空间负荷预测面临的特征变量众多和数据匮乏问题,文中提出一种基于双层极端梯度提升(extreme gradient boosting,XGBoost)和数据增强的空间负荷预测方法。该方法首先将待预测区域按馈线供电范围划分为若干子区域;其次构建基于双层XGBoost的特征选择模型,第一层XGBoost对特征进行评分及排序,将组合特征和负荷输入第二层XGBoost并进行子区域负荷预测,根据子区域负荷预测结果选择每个子区域的最佳特征变量;然后利用生成对抗网络(generative adversarial network,GAN)增强每个子区域的训练集样本,并通过极限学习机(extreme learning machine,ELM)实现子区域预测;最后将每个子区域的预测值相加得到待预测区域的预测值。以上海市局部区域为例,对文中方法进行仿真实验和对比分析。结果表明,文中方法可同时解决特征变量选择和数据匮乏问题,具有更高的预测精度。 展开更多
关键词 空间负荷预测 极端梯度提升(xgboost) 特征选择 生成对抗网络(GAN) 数据增强 极限学习机(ELM)
下载PDF
基于XGBoost算法的胶凝砂砾石劈拉强度预测分析 被引量:2
20
作者 郭磊 李泽宣 +2 位作者 田青青 郭利霞 高航 《建筑材料学报》 EI CAS CSCD 北大核心 2023年第4期378-382,388,共6页
将水泥质量浓度、砂率、水胶比和粉煤灰质量浓度设为输入变量,28 d劈拉强度设为输出变量,用极端梯度提升树(XGBoost)算法对胶凝砂砾石(CSG)的劈拉强度进行预测,并与随机森林(RF)算法的预测结果进行对比,以决策系数(R^(2))、均方根误差(R... 将水泥质量浓度、砂率、水胶比和粉煤灰质量浓度设为输入变量,28 d劈拉强度设为输出变量,用极端梯度提升树(XGBoost)算法对胶凝砂砾石(CSG)的劈拉强度进行预测,并与随机森林(RF)算法的预测结果进行对比,以决策系数(R^(2))、均方根误差(RMSE)、平均绝对误差(MAE)和平均百分比误差(MAPE)作为评估标准对2种算法进行对比分析.结果表明:XGBoost算法的R2为0.968 1,具有高度的预测准确性;相比表现良好的RF算法,XGBoost算法测试集的RMSE和MAE均降低了0.003, MAPE降低了0.32%,表明XGBoost算法能够对CSG劈拉强度进行更为精准的预测. 展开更多
关键词 极端梯度提升树算法 随机森林算法 强度预测 胶凝砂砾石 劈拉强度
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部