期刊文献+
共找到318篇文章
< 1 2 16 >
每页显示 20 50 100
Modeling of Total Dissolved Solids (TDS) and Sodium Absorption Ratio (SAR) in the Edwards-Trinity Plateau and Ogallala Aquifers in the Midland-Odessa Region Using Random Forest Regression and eXtreme Gradient Boosting
1
作者 Azuka I. Udeh Osayamen J. Imarhiagbe Erepamo J. Omietimi 《Journal of Geoscience and Environment Protection》 2024年第5期218-241,共24页
Efficient water quality monitoring and ensuring the safety of drinking water by government agencies in areas where the resource is constantly depleted due to anthropogenic or natural factors cannot be overemphasized. ... Efficient water quality monitoring and ensuring the safety of drinking water by government agencies in areas where the resource is constantly depleted due to anthropogenic or natural factors cannot be overemphasized. The above statement holds for West Texas, Midland, and Odessa Precisely. Two machine learning regression algorithms (Random Forest and XGBoost) were employed to develop models for the prediction of total dissolved solids (TDS) and sodium absorption ratio (SAR) for efficient water quality monitoring of two vital aquifers: Edward-Trinity (plateau), and Ogallala aquifers. These two aquifers have contributed immensely to providing water for different uses ranging from domestic, agricultural, industrial, etc. The data was obtained from the Texas Water Development Board (TWDB). The XGBoost and Random Forest models used in this study gave an accurate prediction of observed data (TDS and SAR) for both the Edward-Trinity (plateau) and Ogallala aquifers with the R<sup>2</sup> values consistently greater than 0.83. The Random Forest model gave a better prediction of TDS and SAR concentration with an average R, MAE, RMSE and MSE of 0.977, 0.015, 0.029 and 0.00, respectively. For the XGBoost, an average R, MAE, RMSE, and MSE of 0.953, 0.016, 0.037 and 0.00, respectively, were achieved. The overall performance of the models produced was impressive. From this study, we can clearly understand that Random Forest and XGBoost are appropriate for water quality prediction and monitoring in an area of high hydrocarbon activities like Midland and Odessa and West Texas at large. 展开更多
关键词 Water Quality Prediction Predictive Modeling Aquifers Machine Learning Regression extreme gradient boosting
下载PDF
Object-Based Burned Area Mapping with Extreme Gradient Boosting Using Sentinel-2 Imagery
2
作者 Dimitris Stavrakoudis Ioannis Z. Gitas 《Journal of Geographic Information System》 2023年第1期53-72,共20页
The Sentinel-2 satellites are providing an unparalleled wealth of high-resolution remotely sensed information with a short revisit cycle, which is ideal for mapping burned areas both accurately and timely. This paper ... The Sentinel-2 satellites are providing an unparalleled wealth of high-resolution remotely sensed information with a short revisit cycle, which is ideal for mapping burned areas both accurately and timely. This paper proposes an automated methodology for mapping burn scars using pairs of Sentinel-2 imagery, exploiting the state-of-the-art eXtreme Gradient Boosting (XGB) machine learning framework. A large database of 64 reference wildfire perimeters in Greece from 2016 to 2019 is used to train the classifier. An empirical methodology for appropriately sampling the training patterns from this database is formulated, which guarantees the effectiveness of the approach and its computational efficiency. A difference (pre-fire minus post-fire) spectral index is used for this purpose, upon which we appropriately identify the clear and fuzzy value ranges. To reduce the data volume, a super-pixel segmentation of the images is also employed, implemented via the QuickShift algorithm. The cross-validation results showcase the effectiveness of the proposed algorithm, with the average commission and omission errors being 9% and 2%, respectively, and the average Matthews correlation coefficient (MCC) equal to 0.93. 展开更多
关键词 Operational Burned Area Mapping Sentinel-2 extreme gradient boosting (XGB) QuickShift Segmentation Machine Learning
下载PDF
基于随机森林和XGBoost算法构建心脏骤停患者自主循环恢复后神经功能预后不良的风险预测模型
3
作者 桑珍珍 崔杰 +2 位作者 闫寒 王维峰 庞秀艳 《中国急救医学》 CAS CSCD 2024年第7期577-585,共9页
目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集... 目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集患者临床资料,根据患者转出重症监护病房(ICU)时的格拉斯哥-匹兹堡脑功能表现分级(CPC)评分,将其分为预后良好组(GNO,n=158)和预后不良组(PNO,n=323)。481例患者按7∶3随机分为训练集(n=338)和测试集(n=143),训练集用于构建模型,测试集用评价模型效能。利用极端梯度提升(XGBoost)和随机森林(RF)两种机器学习算法构建患者神经功能预后不良的预测模型,分别得出影响患者神经功能预后的变量,应用SHAP进行XGBoost模型可解释性分析。将XGBoost和RF算法得出的变量取交集,再将交集变量进行多因素Logistic回归分析,得到差异有统计学意义的变量,进而构建决策树模型。在训练集和测试集上利用受试者工作特征(ROC)曲线和曲线下面积(AUC)评估决策树模型的预测性能。结果 通过XGBoost模型得到与神经功能预后不良相关的变量15个,RF模型得到与神经功能预后不良相关的变量14个,两种模型取交集得到11个与神经功能预后不良相关的交集变量[视神经鞘直径(ONSD)变化率、神经元特异性烯醇化酶(NSE)、入ICU第3天ONSD(ONSD day3)、心脏骤停至心肺复苏(CA-CPR)时间、ROSC时间、急性生理学与慢性健康状况评价Ⅱ(APACHEⅡ)评分、血肌酐、白蛋白、住ICU时间、血乳酸及年龄]。将这11个交集变量进行多因素Logistic回归分析,结果显示,PNO组与GNO组ONSD变化率、NSE、ONSD day3、ROSC时间及年龄这5个变量差异有统计学意义(P<0.05)。用这5个重要变量构建决策树模型,得出3个与患者神经功能预后不良最相关的变量(NSE、ROSC时间及ONSD变化率),在训练集上的决策树模型预测CA行CPR后ROSC患者神经功能预后不良的AUC为0.857(95%CI 0.809~0.903,P<0.001),在测试集上的AUC为0.834 (95%CI 0.761~0.906,P<0.001)。结论 基于XGBoost和RF这2种机器学习方法构建的决策树模型能够更准确地评估CA患者ROSC后神经功能的不良预后,且评价指标可能简化为NSE、ROSC时间及ONSD变化率。 展开更多
关键词 心脏骤停 自主循环恢复 神经功能 预测模型 随机森林 极端梯度提升
下载PDF
基于PSO-CNN-XGBoost水下柱形装药峰值超压预测
4
作者 刘芳 李士伟 +1 位作者 卢熹 郭策安 《兵工学报》 EI CAS CSCD 北大核心 2024年第5期1602-1612,共11页
为探索水下柱形装药结构、爆距等参数与水下柱形装药峰值超压的关系,将装药样本数据视为二维数据,建立粒子群优化(Particle Swarm Optimization,PSO)算法、一维卷积神经网络(1D Convolutional Neural Network,1DCNN)和极端梯度提升(Extr... 为探索水下柱形装药结构、爆距等参数与水下柱形装药峰值超压的关系,将装药样本数据视为二维数据,建立粒子群优化(Particle Swarm Optimization,PSO)算法、一维卷积神经网络(1D Convolutional Neural Network,1DCNN)和极端梯度提升(Extreme Gradient Boosting,XGBoost)的水下柱形装药峰值超压融合预测算法。采用相关性分析与数据可视化方法,分析装药结构参数、爆距与峰值超压之间的关联关系。设计1DCNN深度网络挖掘不同长径比、爆距等参数与峰值超压之间的纵向时序关系。运用XGBoost算法寻找装药结构参数、爆距与峰值超压之间的横向非线性关系,提升小样本数据的预测精度。使用PSO算法优化1DCNN和XGBoost的超参数,获得最优算法结构。研究结果表明,在包含10种智能算法的对比实验中,PSO-CNN-XGBoost水下柱形装药峰值超压预测算法在精度、稳定性、拟合程度上均高于其他模型。 展开更多
关键词 水下柱形装药 长径比 爆距 峰值超压 粒子群优化算法 一维卷积神经网络 极端梯度提升
下载PDF
基于BiLSTM-XGBoost混合模型的储层岩性识别
5
作者 杜睿山 黄玉朋 +2 位作者 孟令东 张轶楠 周长坤 《计算机系统应用》 2024年第6期108-116,共9页
储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidi... 储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidirectional long short-term memory,BiLSTM)和极端梯度提升决策树(extreme gradient boosting decision tree,XGBoost),提出双向记忆极端梯度提升(BiLSTM-XGBoost,BiXGB)模型预测储层岩性.该模型在传统XGBoost基础上融入了BiLSTM,大大增强了模型对测井数据的特征提取能力.BiXGB模型使用BiLSTM对测井数据进行特征提取,将提取到的特征传递给XGBoost分类模型进行训练和预测.将BiXGB模型应用于储层岩性数据集时,模型预测的总体精度达到了91%.为了进一步验证模型的准确性和稳定性,将模型应用于UCI公开的Occupancy序列数据集,结果显示模型的预测总体精度也高达93%.相较于其他机器学习模型,BiXGB模型能准确地对序列数据进行分类,提高了储层岩性的识别精度,满足了油气勘探的实际需要,为储层岩性识别提供了新的方法. 展开更多
关键词 神经网络 机器学习 测井数据 岩性分类 BiLSTM xgboost
下载PDF
结合SVM与XGBoost的链式多路径覆盖测试用例生成
6
作者 钱忠胜 俞情媛 +3 位作者 张丁 姚昌森 秦朗悦 成轶伟 《软件学报》 EI CSCD 北大核心 2024年第6期2795-2820,共26页
机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借... 机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借助遗传算法实现多路径测试数据生成.首先,利用一定样本训练若干个用于预测路径节点状态的子模型(SVM和XGBoost),通过子模型的预测精度值筛选最优子模型,并根据路径节点顺序将其依次链接,形成一个链式模型C-SVMXGBoost(chained SVM and XGBoost).在利用遗传算法生成测试用例时,使用训练好的链式模型代替插桩法获取测试数据覆盖路径(预测路径),寻找预测路径与目标路径相似的路径集,对存在相似路径集的预测路径进行插桩验证,获取精确路径,计算适应度值.在交叉变异过程中引入样本集中路径层级深度较大的优秀测试用例进行重用,生成覆盖目标路径的测试数据.最后,保留进化生成中产生的适应度较高的个体,更新链式模型C-SVMXGBoost,进一步提高测试效率.实验表明,C-SVMXGBoost较其他各对比链式模型更适合解决路径预测问题,可提高测试效率.并且通过与已有经典方法相比,所提方法在覆盖率上提高可达15%,平均进化代数也有所降低,在较大规模程序上其降低百分比可达65%. 展开更多
关键词 测试用例 SVM xgboost 链式模型 多路径覆盖
下载PDF
基于STL-XGBoost-NBEATSx的小时天然气负荷预测
7
作者 邵必林 任萌 田宁 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期170-179,共10页
小时天然气负荷预测受外部特征因素与预测方法的影响,为提高其预测精度并解决其他深度学习类模型或组合模型可解释性差、训练时间过长的问题,在引入“小时影响度”这一新特征因素的同时提出一种基于极端梯度提升树(extreme gradient boo... 小时天然气负荷预测受外部特征因素与预测方法的影响,为提高其预测精度并解决其他深度学习类模型或组合模型可解释性差、训练时间过长的问题,在引入“小时影响度”这一新特征因素的同时提出一种基于极端梯度提升树(extreme gradient boosting tress,XGBoost)模型与可解释性神经网络模型NBEATSx组合预测的方法;以XGBoost模型作为特征筛选器对特征集数据进行筛选,再将筛选降维后的数据集输入到NBEATSx中训练,提高NBEATSx的训练速度与预测精度;将负荷数据与特征数据经STL(seasonal and trend decomposition using Loess)算法分解为趋势分量、季节分量与残差分量,再分别输入到XGBoost中进行预测,减弱原始数据中的噪音影响;将优化后的NBEATSx与XGBoost模型通过方差倒数法进行组合,得出STL-XGBoost-NBEATSx组合模型的预测结果。结果表明:“小时影响度”这一新特征是小时负荷预测的重要影响因素,STL-XGBoost-NBEATSx模型训练速度有所提高,具有良好的可解释性与更高的预测准确性,模型预测结果的平均绝对百分比误差、均方误差、平均绝对误差分别比其余单一模型平均降低54.20%、63.97%、49.72%,比其余组合模型平均降低24.85%、34.39%、23.41%,模型的决定系数为0.935,能够很好地拟合观测数据。 展开更多
关键词 天然气负荷预测 小时影响因素 极端梯度提升树 可解释性 NBEATSx 组合模型
下载PDF
基于WOA-VMD-XGBoost的混凝土坝变形预测
8
作者 常留红 李晨玉 +3 位作者 曾子彬 尹光景 赵芃芃 薛雄 《水利水运工程学报》 CSCD 北大核心 2024年第3期146-157,共12页
建立混凝土坝高精准变形预测模型是掌握坝体结构服役性态的关键,而其变形监测数据具有复杂的非线性和非平稳特征,会影响预测模型的精度及泛化能力。针对上述问题,引入鲸鱼优化算法(WOA)和包络熵理论自适应寻优变分模态分解(VMD)参数,根... 建立混凝土坝高精准变形预测模型是掌握坝体结构服役性态的关键,而其变形监测数据具有复杂的非线性和非平稳特征,会影响预测模型的精度及泛化能力。针对上述问题,引入鲸鱼优化算法(WOA)和包络熵理论自适应寻优变分模态分解(VMD)参数,根据最佳参数组合多尺度分解变形数据,得到多个不同特征尺度的本征模态函数(IMF)。通过重构分量为新分量,将新分量分别输入极端梯度提升(XGBoost)模型中进行预测,叠加各预测结果得到最终预测值。基于山口岩碾压混凝土拱坝变形监测数据,开展支持向量回归机(SVR)、随机森林(RF)、XGBoost、WOA-VMD-XGBoost等4种模型的精度、泛化能力对比研究。结果表明:相比于单一预测模型,组合模型有效挖掘了变形信号多尺度特征,降低了非线性、非平稳性对模型性能的影响,在精度、泛化能力中表现出更高性能。该组合模型为大坝变形监测提供了理论依据和应用参考。 展开更多
关键词 混凝土坝 变形预测 鲸鱼优化算法 包络熵 变分模态分解 极端梯度提升
下载PDF
Prediction of undrained shear strength using extreme gradient boosting and random forest based on Bayesian optimization 被引量:50
9
作者 Wengang Zhang Chongzhi Wu +2 位作者 Haiyi Zhong Yongqin Li Lin Wang 《Geoscience Frontiers》 SCIE CAS CSCD 2021年第1期469-477,共9页
Accurate assessment of undrained shear strength(USS)for soft sensitive clays is a great concern in geotechnical engineering practice.This study applies novel data-driven extreme gradient boosting(XGBoost)and random fo... Accurate assessment of undrained shear strength(USS)for soft sensitive clays is a great concern in geotechnical engineering practice.This study applies novel data-driven extreme gradient boosting(XGBoost)and random forest(RF)ensemble learning methods for capturing the relationships between the USS and various basic soil parameters.Based on the soil data sets from TC304 database,a general approach is developed to predict the USS of soft clays using the two machine learning methods above,where five feature variables including the preconsolidation stress(PS),vertical effective stress(VES),liquid limit(LL),plastic limit(PL)and natural water content(W)are adopted.To reduce the dependence on the rule of thumb and inefficient brute-force search,the Bayesian optimization method is applied to determine the appropriate model hyper-parameters of both XGBoost and RF.The developed models are comprehensively compared with three comparison machine learning methods and two transformation models with respect to predictive accuracy and robustness under 5-fold cross-validation(CV).It is shown that XGBoost-based and RF-based methods outperform these approaches.Besides,the XGBoostbased model provides feature importance ranks,which makes it a promising tool in the prediction of geotechnical parameters and enhances the interpretability of model. 展开更多
关键词 Undrained shear strength extreme gradient boosting Random forest Bayesian optimization k-fold CV
下载PDF
基于遗传算法优化XGBoost模型的地铁乘客出站走行时间预测
10
作者 郭凯旋 肖梅 +1 位作者 刘宇 张皓 《科学技术与工程》 北大核心 2024年第18期7851-7858,共8页
地铁乘客出站走行时间的预测是城市交通运行和管理的重要依据,对其进行准确预测有助于缓解地铁拥堵、优化地铁服务和提高乘客满意度。为了准确预测地铁乘客出站走行时间,首先,基于视频分析软件从监控视频中提取了乘客出站时的走行时间... 地铁乘客出站走行时间的预测是城市交通运行和管理的重要依据,对其进行准确预测有助于缓解地铁拥堵、优化地铁服务和提高乘客满意度。为了准确预测地铁乘客出站走行时间,首先,基于视频分析软件从监控视频中提取了乘客出站时的走行时间和若干特征变量。其次,为了筛选出对走行时间有显著影响的因素,采用相关性分析和最优尺度回归模型进行影响因素分析,并使用遗传算法进行最优特征组合的提取。最终,将提取出的特征作为输入向量,使用极端梯度提升模型(extreme gradient boosting,XGBoost)进行走行时间的预测,并以平均绝对误差等作为评价指标。实验结果表明,本文提出的方法在地铁乘客出站行为预测方面具有较好的效果,平均绝对误差为1.55 s,低于未优化的极端梯度提升模型(1.87 s)、支持向量机(2.03 s)和随机森林(1.96 s)等模型。 展开更多
关键词 遗传算法 极端梯度提升模型 走行时间预测 特征提取
下载PDF
基于PCA-GA-XGBoost模型的吉林省水资源 承载力评价 被引量:1
11
作者 庞博文 李治军 《人民珠江》 2024年第4期98-106,共9页
为了提高水资源承载力评价的效率和准确性,提出了一种基于主成分分析(PCA)、遗传算法(GA)和极限梯度提升树(XGBoost)的指标评价模型。定义了以水资源、社会经济、生态环境为子系统的14项评价指标;采用主成分分析法对评价指标进行降维处... 为了提高水资源承载力评价的效率和准确性,提出了一种基于主成分分析(PCA)、遗传算法(GA)和极限梯度提升树(XGBoost)的指标评价模型。定义了以水资源、社会经济、生态环境为子系统的14项评价指标;采用主成分分析法对评价指标进行降维处理;基于梯度提升决策树对吉林省2011—2021年的水资源承载力进行评价分析,并利用遗传算法对极限梯度提升树中4个参数进行优化。结果表明:经主成分分析简化评价指标后,PCA-GA-XGBoost模型的相关系数等指标均优于GA-BP、GA-SVM、GA-XGBoost和XGBoost;2011—2021年吉林省水资源承载力位于0.192~0.724,为先上升后下降再上升趋势,承载力状况逐年改善;利用模型内置的特征值重要度排序功能,识别得出重要度最大的指标为每公顷化肥施用量(0.5307),是影响吉林省水资源承载力的关键因素。 展开更多
关键词 主成分分析 遗传算法 极限梯度提升树 水资源承载力 吉林省
下载PDF
Forecasting Multi-Step Ahead Monthly Reference Evapotranspiration Using Hybrid Extreme Gradient Boosting with Grey Wolf Optimization Algorithm 被引量:1
12
作者 Xianghui Lu Junliang Fan +1 位作者 Lifeng Wu Jianhua Dong 《Computer Modeling in Engineering & Sciences》 SCIE EI 2020年第11期699-723,共25页
It is important for regional water resources management to know the agricultural water consumption information several months in advance.Forecasting reference evapotranspiration(ET_(0))in the next few months is import... It is important for regional water resources management to know the agricultural water consumption information several months in advance.Forecasting reference evapotranspiration(ET_(0))in the next few months is important for irrigation and reservoir management.Studies on forecasting of multiple-month ahead ET_(0) using machine learning models have not been reported yet.Besides,machine learning models such as the XGBoost model has multiple parameters that need to be tuned,and traditional methods can get stuck in a regional optimal solution and fail to obtain a global optimal solution.This study investigated the performance of the hybrid extreme gradient boosting(XGBoost)model coupled with the Grey Wolf Optimizer(GWO)algorithm for forecasting multi-step ahead ET_(0)(1-3 months ahead),compared with three conventional machine learning models,i.e.,standalone XGBoost,multi-layer perceptron(MLP)and M5 model tree(M5)models in the subtropical zone of China.The results showed that theGWO-XGB model generally performed better than the other three machine learning models in forecasting 1-3 months ahead ET_(0),followed by the XGB,M5 and MLP models with very small differences among the three models.The GWO-XGB model performed best in autumn,while the MLP model performed slightly better than the other three models in summer.It is thus suggested to apply the MLP model for ET_(0) forecasting in summer but use the GWO-XGB model in other seasons. 展开更多
关键词 Reference evapotranspiration extreme gradient boosting Grey Wolf Optimizer multi-layer perceptron M5 model tree
下载PDF
基于BOXGBoost的配变日峰值负荷预测及重过载预警方法
13
作者 邓威 梅玉杰 +3 位作者 李勇 郭钇秀 康童 任磊 《电力系统及其自动化学报》 CSCD 北大核心 2024年第7期49-58,共10页
为解决配变负荷日峰值预测精度不高、重过载预警误差大的问题,提出一种配变日峰值负荷预测及重过载预警方法。首先,基于时间卷积网络对配变日负荷进行预测;然后,通过贝叶斯优化极限梯度提升模型对配变日负荷峰值出现时刻及峰值区间幅值... 为解决配变负荷日峰值预测精度不高、重过载预警误差大的问题,提出一种配变日峰值负荷预测及重过载预警方法。首先,基于时间卷积网络对配变日负荷进行预测;然后,通过贝叶斯优化极限梯度提升模型对配变日负荷峰值出现时刻及峰值区间幅值进行独立预测;最后,使用峰值预测补正日负荷预测结果并转化为预警等级,实现配变重过载预警。采用湖南某地区配电台区数据实例验证,结果表明,所提方法可实现配变日峰值负荷精确预测及准确预警重过载运行风险。 展开更多
关键词 配电变压器 时间卷积网络 贝叶斯优化 极限梯度提升 峰值负荷预测 重过载预警
下载PDF
基于XGBoost机器学习算法的肺结节浸润性预测模型构建与验证:一项双中心研究
14
作者 夏志颖 刘子蔚 +2 位作者 胡秋根 包陈政任 张榕 《中国CT和MRI杂志》 2024年第8期166-169,共4页
目的采用XGBoost机器学习算法构建一个临床影像模型,预测肺结节病理浸润性,并在一个外部验证组中对模型进行泛化性验证。方法回顾性纳入CT诊断为孤立性肺结节患者248例,分别提取肺结节区域和结节周围3mm、5mm区域的放射组学特征。经过... 目的采用XGBoost机器学习算法构建一个临床影像模型,预测肺结节病理浸润性,并在一个外部验证组中对模型进行泛化性验证。方法回顾性纳入CT诊断为孤立性肺结节患者248例,分别提取肺结节区域和结节周围3mm、5mm区域的放射组学特征。经过从粗到细的特征选择后,使用最小绝对收缩和选择算子(LASSO)方法计算Radscore。采用单因素和多因素Logistic回归分析筛选与肺结节浸润性相关的临床放射学因素。然后,利用Logistic和XGBoost算法构建临床-放射组学联合模型,在一个独立的外部验证组(n=147)中评估模型的泛化性能。结果综合Radscore、CT值、肺结节长度、月牙征的临床放射学XGBoost联合模型对肺结节浸润性的预测效果优于放射组学模型、临床放射学Logistic联合模型,在训练队列中的曲线下面积AUC为0.889(95%CI,0.848~0.927),在外部验证组中曲线下面积AUC为0.889(95%CI,0.823~0.942)。结论我们采用XGBoost机器学习算法构建了一种预测肺结节浸润性的临床放射学模型,结果显示出令人满意的预测效能,并在一个独立外部验证组中得到了良好的泛化性验证,可以帮助临床医生指导肺结节的诊疗并制定评估策略。 展开更多
关键词 肺结节 极端梯度上升 机器学习 放射组学
下载PDF
在线医药电商评论情感分析——基于XGBoost集成加权词向量和大语言模型的情感识别模型
15
作者 田梦影 时维 《科技和产业》 2024年第9期128-135,共8页
消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost... 消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost(极限梯度提升树)集成词向量和LLM(大语言模型)构建情感识别模型,最后得出评论情感指数,从多个维度展开,分析消费者评论中的情感趋势。实证分析表明,构建的情感识别模型的AUC(曲线下的面积)等验证指标较LLM模型相比有进一步提升,具有一定的应用价值。 展开更多
关键词 在线医药电商 LLM(大语言模型) xgboost(极限梯度提升树)算法 情感指数 情感识别
下载PDF
基于XGBoost模型的路段交通流量短时预测
16
作者 蒋源 陈小鸿 胡松华 《武汉理工大学学报(交通科学与工程版)》 2024年第1期25-30,36,共7页
文中利用上海杨浦区雷达设备采集的城市道路流量数据,基于XGBoost模型对路段流量进行预测.考虑城市道路交通流量的复杂性与随机性,选用包括整体特征、时间相关特征、空间相关特征等31个特征变量,并通过格网搜索对模型主要参数进行调整.... 文中利用上海杨浦区雷达设备采集的城市道路流量数据,基于XGBoost模型对路段流量进行预测.考虑城市道路交通流量的复杂性与随机性,选用包括整体特征、时间相关特征、空间相关特征等31个特征变量,并通过格网搜索对模型主要参数进行调整.结果显示:在不同时间粒度上,XGBoost模型的RMSE精度皆优于其余五个对比模型,且在效率上也具有优势.以5 min为时间粒度时,RMSE值为14.22,MAPE值为0.153,耗时23.84 s.此外,XGBoost具有较高可解释性.通过对不同特征变量的组合预测及特征变量重要度分析发现,以时间粒度为单元,1、2、3阶滞后流量及彼此间的差值可明显提高模型预测精度,随时间粒度增大,流周期性增强,随机性减弱. 展开更多
关键词 路段流量 短时预测 机器学习 xgboost模型
下载PDF
基于NNTR-SMOTE与GA-XGBoost的变压器故障诊断方法研究
17
作者 汪李忠 池建飞 +3 位作者 丁叶强 姚海燕 唐志鹏 吴同宇 《综合智慧能源》 2024年第1期84-93,共10页
针对变压器故障诊断中故障样本数量少且分布不均衡导致诊断率低的问题,提出了一种基于最近邻三角区域合成少数类过采样(NNTR-SMOTE)与利用遗传算法(GA)优化极端梯度提升(XGBoost)模型的变压器故障诊断方法。首先,将采集到的变压器故障... 针对变压器故障诊断中故障样本数量少且分布不均衡导致诊断率低的问题,提出了一种基于最近邻三角区域合成少数类过采样(NNTR-SMOTE)与利用遗传算法(GA)优化极端梯度提升(XGBoost)模型的变压器故障诊断方法。首先,将采集到的变压器故障样本数据进行标准化处理,使用NNTR-SMOTE方法得到平衡数据;其次,采用无编码比值法构造油中溶解气体的特征,得到特征数据集并对特征数据集采用多维尺度分析(MDS)方法进行特征融合;最后,利用GA对XGBoost模型的参数进行优化,构建变压器故障诊断模型。试验结果表明:基于NNTR-SMOTE与GA-XGBoost的变压器故障诊断方法诊断准确率达95.97%,不仅解决了诊断模型对多数类的偏向问题,还将模型的诊断精度进一步提高,适用于变压器非均衡数据集的多分类故障诊断。 展开更多
关键词 变压器 故障诊断 不平衡小样本 极端梯度提升 遗传算法
下载PDF
基于PRSGMD-XGBoost的光伏直流电能质量扰动识别
18
作者 朱宪宇 熊婕 +3 位作者 李庆先 刘良江 左从瑞 刘青 《电工电气》 2024年第7期61-67,共7页
光伏电网受天气因素和非线性负载等影响,直流电信号中存在的扰动成分使得电能质量评估的准确性难以保障。利用复合多尺度模糊熵可克服光伏直流电信号初始单分量相似性度量突变的问题,构建了正则化CMFE算子评估各初始单分量重构后的复杂... 光伏电网受天气因素和非线性负载等影响,直流电信号中存在的扰动成分使得电能质量评估的准确性难以保障。利用复合多尺度模糊熵可克服光伏直流电信号初始单分量相似性度量突变的问题,构建了正则化CMFE算子评估各初始单分量重构后的复杂度并约束残余量能量最小,从而实现电信号和噪声等扰动的准确分离,在此基础上,提出了基于部分重构辛几何模态分解(PRSGMD)的光伏直流电信号自适应去噪方法,结合极限梯度提升机(XGBoost)可有效挖掘特征与暂态稳定性之间关系的优势,实现了光伏直流电信号中复合扰动的分离和识别。 展开更多
关键词 光伏 电能质量扰动识别 部分重构辛几何模态分解 极限梯度提升机
下载PDF
基于RFE-BXGBoost的轴承套圈沟道表面缺陷识别方法 被引量:1
19
作者 徐凯 张会妨 《机电工程》 CAS 北大核心 2023年第11期1691-1699,共9页
轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基... 轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基于特征衍生的思想,对轴承沟道的时域、频域等特征进行了提取,使用了极度梯度提升树(XGBoost)作为基于特征递归消除(RFE)的基学习器,对影响轴承沟道表面缺陷最佳特征子集进行了选择,并过滤了冗余特征;然后,利用基于贝叶斯优化的XGBoost模型组成弱分类器,为了降低模型预测结果的方差,使用有放回随机抽样法,对基分类器进行了选取;最后,根据抽样结果,利用投票法获得了最终的表面缺陷识别结果,并使用轴承套圈沟道实测数据集进行了模型预测性能的测试。实验结果表明:基于RFE-BXGBoost的表面缺陷识别模型的识别准确率为0.90,F1-score为0.879,优于仅使用自适应提升法(Adaboost)、随机森林、梯度提升树的表面缺陷识别结果。研究结果表明:该表面缺陷识别模型对复杂零部件和系统的表面缺陷识别有一定的效果。 展开更多
关键词 滚动轴承 特征递归消除 极度梯度提升树 轴承套圈沟道 有放回随机抽样 集成模型
下载PDF
结合振动特征优选和GWOA-XGBoost的电机轴承故障诊断 被引量:4
20
作者 于飞 樊清川 宣敏 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第3期99-107,共9页
为解决电机轴承故障状态难以识别,从而造成诊断精度不高的情况,提出了一种基于信号特征提取与极限梯度提升算法(extreme gradient boosting,XGBoost)结合的电机轴承故障诊断模型。使用优化的变分模态分解获得振动信号的固有模态函数(int... 为解决电机轴承故障状态难以识别,从而造成诊断精度不高的情况,提出了一种基于信号特征提取与极限梯度提升算法(extreme gradient boosting,XGBoost)结合的电机轴承故障诊断模型。使用优化的变分模态分解获得振动信号的固有模态函数(intrinsic mode function,IMF)分量,再基于多尺度熵理论计算各IMF分量的多尺度熵值进行特征重构。在鲸鱼优化算法(whale optimization algorithm,WOA)中引入遗传算法的选择、交叉、变异操作对WOA进行改进。用改进的WOA算法对XGBoost的超参数进行寻优,获得了帮助XGBoost取得最优分类效果的超参数组合,将7种不同故障类型的振动信号进行重构后输入优化的XGBoost模型进行故障诊断。实验结果表明,所提GWOA-XGBoost模型的电机轴承故障诊断精度能够达到97.14%,相较于传统诊断方法,性能提升效果显著。 展开更多
关键词 电机轴承 故障诊断 变分模态分解 鲸鱼优化算法 极限梯度提升
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部