期刊文献+
共找到336篇文章
< 1 2 17 >
每页显示 20 50 100
基于CNN-GRU-ISSA-XGBoost的短期光伏功率预测
1
作者 岳有军 吴明沅 +1 位作者 王红君 赵辉 《南京信息工程大学学报》 CAS 北大核心 2024年第2期231-238,共8页
针对光伏功率随机性及波动性大,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高的问题,提出一种基于卷积神经网络-门控循环单元(CNN-GRU)和改进麻雀搜索算法(ISSA)优化的极限梯度提升(XGBoost)模型的短期光伏功率... 针对光伏功率随机性及波动性大,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高的问题,提出一种基于卷积神经网络-门控循环单元(CNN-GRU)和改进麻雀搜索算法(ISSA)优化的极限梯度提升(XGBoost)模型的短期光伏功率预测组合模型.首先去除历史数据中的异常值并对其进行归一化处理,利用主成分分析法(PCA)进行特征选取,以便更好地识别影响光伏功率的关键因素.然后采用CNN网络提取数据的空间特征,再经过GRU网络提取时间特征,针对XGBoost模型手动配置参数困难、随机性大的问题,利用ISSA对模型超参数寻优.最后对两种方法预测的结果用误差倒数法减小误差的同时对权重进行更新,得到新的预测值,从而完成对光伏功率的预测.实验结果表明,所提出的CNN-GRU-ISSA-XGBoost组合模型具有更强的适应性和更高的精度. 展开更多
关键词 光伏功率预测 改进麻雀搜索算法 卷积神经网络 门控循环单元 xgboost模型
下载PDF
基于贝叶斯优化XGBoost的石灰窑气预测
2
作者 温后珍 栾仪广 +1 位作者 孟碧霞 陈德斌 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期114-121,共8页
石灰窑是碳酸钙产业的关键生产设备,窑气中的CO_(2)是生产碳酸钙的原料,CO_(2)浓度直接影响碳酸钙产量,然而石灰窑气浓度依靠产品产出后采样化验得到,存在严重的滞后性,无法作为石灰窑在线工艺参数调整的依据。因此提出一种基于贝叶斯... 石灰窑是碳酸钙产业的关键生产设备,窑气中的CO_(2)是生产碳酸钙的原料,CO_(2)浓度直接影响碳酸钙产量,然而石灰窑气浓度依靠产品产出后采样化验得到,存在严重的滞后性,无法作为石灰窑在线工艺参数调整的依据。因此提出一种基于贝叶斯优化的eXtreme Gradient Boosting石灰窑气浓度预测模型BO-XGBoost,根据历史数据预测1 h后的窑气浓度,为生产工艺参数的调整提供依据。该方法首先对石灰窑传感器数据集中的缺失值、异常值进行剔除、插补,然后统一窑气浓度检测历史数据的时间尺度,构成石灰窑气监测数据集,在此基础上提出针对石灰窑气的BO-XGBoost模型。模型经训练后,采用实际生产数据进行测试,并与Light Gradient Boosting Machine(Light-GBM)模型、Category Boosting(Catboost)模型预测结果进行比较,结果表明,所提模型可以实现高维数据集的超参数快速优化,且预测模型有较好的精度,均方根误差(RMSE)达到0.70,平均绝对百分比误差(MAPE)达到2.03%。 展开更多
关键词 石灰窑 石灰窑气 xgboost模型 贝叶斯优化
下载PDF
基于RUN-XGBoost算法的土石坝渗流预测模型
3
作者 马春辉 侯媛媛 +2 位作者 杨杰 袁帅 徐笑颜 《水利水电科技进展》 CSCD 北大核心 2024年第2期72-78,共7页
针对传统土石坝渗流预测模型存在局部最优、抗干扰性差和预测精度低等问题,通过RUN算法优化XGBoost算法得到RUN-XGBoost算法,构建了RUN-XGBoost模型以获得更优的土石坝渗流预测结果。该模型在种群初始化时采用RUN算法对XGBoost算法的3... 针对传统土石坝渗流预测模型存在局部最优、抗干扰性差和预测精度低等问题,通过RUN算法优化XGBoost算法得到RUN-XGBoost算法,构建了RUN-XGBoost模型以获得更优的土石坝渗流预测结果。该模型在种群初始化时采用RUN算法对XGBoost算法的3个主要参数进行改进,使预测结果有较高的有效性;通过自动寻找最优参数增进算法的整体收敛速度和预测精度,同时引入随机解,使算法能够排除局部最小值并继续搜索,从而获得全局最优结果。工程实例验证结果表明,RUN-XGBoost模型具有简洁、高效、预测精度高、鲁棒性强等优点。 展开更多
关键词 土石坝 渗流监测 RUN-xgboost算法 预测模型
下载PDF
结合SVM与XGBoost的链式多路径覆盖测试用例生成
4
作者 钱忠胜 俞情媛 +3 位作者 张丁 姚昌森 秦朗悦 成轶伟 《软件学报》 EI CSCD 北大核心 2024年第6期2795-2820,共26页
机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借... 机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借助遗传算法实现多路径测试数据生成.首先,利用一定样本训练若干个用于预测路径节点状态的子模型(SVM和XGBoost),通过子模型的预测精度值筛选最优子模型,并根据路径节点顺序将其依次链接,形成一个链式模型C-SVMXGBoost(chained SVM and XGBoost).在利用遗传算法生成测试用例时,使用训练好的链式模型代替插桩法获取测试数据覆盖路径(预测路径),寻找预测路径与目标路径相似的路径集,对存在相似路径集的预测路径进行插桩验证,获取精确路径,计算适应度值.在交叉变异过程中引入样本集中路径层级深度较大的优秀测试用例进行重用,生成覆盖目标路径的测试数据.最后,保留进化生成中产生的适应度较高的个体,更新链式模型C-SVMXGBoost,进一步提高测试效率.实验表明,C-SVMXGBoost较其他各对比链式模型更适合解决路径预测问题,可提高测试效率.并且通过与已有经典方法相比,所提方法在覆盖率上提高可达15%,平均进化代数也有所降低,在较大规模程序上其降低百分比可达65%. 展开更多
关键词 测试用例 SVM xgboost 链式模型 多路径覆盖
下载PDF
基于Prophet-XGBoost组合模型的极端温度事件下负荷预测
5
作者 施骞 陈汉驰 《价值工程》 2024年第11期1-4,共4页
气候变化对城市的影响日益加剧,频发的极端温度事件导致城市电力系统供需不平衡问题凸显,精确的需求侧电力负荷预测成为提升电力系统适应性从而支持城市功能稳定性的关键。本文开发了一种适用于极端温度事件下负荷预测的组合模型,结合... 气候变化对城市的影响日益加剧,频发的极端温度事件导致城市电力系统供需不平衡问题凸显,精确的需求侧电力负荷预测成为提升电力系统适应性从而支持城市功能稳定性的关键。本文开发了一种适用于极端温度事件下负荷预测的组合模型,结合时间序列模型Prophet和机器学习模型XGBoost,有效表征极端温度影响下的电力负荷波动趋势。实验结果表明,相比传统单一模型,组合模型显著提高了极端温度事件下的电力负荷预测精度,在增强城市电力系统对气候变化适应性方面具有较强的有效性,从而为电力调度等电力系统应急管理工作提供了更可靠的支持。 展开更多
关键词 极端温度 电力负荷预测 Prophet模型 xgboost模型
下载PDF
基于XGBoost算法的人—虎共存区域风险等级划分
6
作者 曲智林 桂宁晨 《沈阳大学学报(自然科学版)》 CAS 2024年第3期262-266,F0003,共6页
以2014—2019年珲春地区红外相机拍摄的东北虎数据为基础,基于XGBoost算法构建了虎出没区域风险等级划分模型。由模型检验可知:模型的准确率为93.51%,精确率为93.85%,召回率为93.08%,F1值为93.31%,Cohen s Kappa统计系数为90.2%。研究... 以2014—2019年珲春地区红外相机拍摄的东北虎数据为基础,基于XGBoost算法构建了虎出没区域风险等级划分模型。由模型检验可知:模型的准确率为93.51%,精确率为93.85%,召回率为93.08%,F1值为93.31%,Cohen s Kappa统计系数为90.2%。研究结果表明:基于XGBoost算法构建的人-虎共存区域风险等级划分模型分类效果好、预测准确度高,运用该模型对人-虎共存区域进行风险等级划分是可行的。 展开更多
关键词 人-虎共存区域 xgboost算法 风险等级 划分模型 红外相机陷阱
下载PDF
一种基于改进的XGBoosting算法对婴幼儿奶粉中的脂肪含量的预测模型
7
作者 张文婧 薛河儒 +2 位作者 姜新华 刘江平 黄清 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第5期1464-1471,共8页
婴儿奶粉成分配比中,脂肪有着重要地位。脂肪不仅是婴儿生长发育中的重要成分,同时也为婴儿的生长提供必需的能量,对于婴儿脑发育及神经髓鞘的形成具有重要意义。化学的婴儿奶粉脂肪含量检测如乙醚提取法,方法检测灵敏,但存在破坏样本... 婴儿奶粉成分配比中,脂肪有着重要地位。脂肪不仅是婴儿生长发育中的重要成分,同时也为婴儿的生长提供必需的能量,对于婴儿脑发育及神经髓鞘的形成具有重要意义。化学的婴儿奶粉脂肪含量检测如乙醚提取法,方法检测灵敏,但存在破坏样本和检测周期较长的缺点,因此寻求一种为婴儿奶粉成分的无损检测方法,高光谱成像技术提供了一种可能的途径。以内蒙古地区不同阶段的婴儿奶粉为研究对象,采用多元散射校正(MSC)、标准正态变换(SNV)、平滑滤波算法(Savitzky-Golay)、鲁斯特算法(Roust)等对高光谱数据进行预处理,再利用竞争性自适应重加权算法(CARS)算法从125个特征波长中筛除光谱数据中冗余的波长保留有效波长66个。对极值梯度提升算法(XGBoosting)算法进行了贝叶斯优化(BO),最终构建了基于BO-XGBoosting对婴儿奶粉脂肪含量的预测模型。结果显示,该模型预测效果优于传统的偏最小二乘回归(PLSR)和支持向量回归(SVR)模型,且优于集成算法中Bagging、GrdientBoosting算法。贝叶斯优化极值梯度提升算法BO-XGBoosting模型在测试集实验,得到的决定系数(R^(2))和均方根误差(RMSEP)分别为0.9537和0.5773,比XGBoosting算法的R^(2)和RMSEP分别提高2.91%和降低19.2%。该研究为奶粉中脂肪含量的预测提供了基于BO-XGboosting集成算法的快速无损检测的算法支持和理论依据。 展开更多
关键词 高光谱 贝叶斯优化 xgboosting模型 脂肪含量 无损检测
下载PDF
基于XGBOOST-SHAP的地铁建成环境与站点出行距离的非线性关系研究
8
作者 李培坤 陈旭梅 +3 位作者 鲁文博 马嘉欣 刘屹 王昊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第4期1624-1633,共10页
相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境... 相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境、站点自身属性等方面构建11种建成环境指标,建立基于极端梯度提升的XGBOOST-SHAP归因分析架构的可解释性机器学习模型,以揭示两者之间的非线性关系。同时,将该模型拟合回归效果与梯度提升决策树(GBDT)及最小二乘回归(OLS)进行比较,以验证XGBOOST模型在拟合回归效果上的优势。结果表明:XGBOOST模型的R方、平均绝对误差(MAE)、均方误差(MSE)值分别为0.75、0.95、1.36,其拟合效果要优于GBDT与OLS模型。站点平均出行距离呈现出明显的环状分布的空间异质性。SHAP归因分析结果表明:距市中心距离特征贡献最大,路网密度、土地利用混合度、公交线路数量以及住宅数量对出行距离的贡献度也相对较高;POI香农熵指数、餐饮服务点对平均出行距离的正负反馈不明显;其余指标对平均出行距离的影响均呈现出正负反馈机制结合的趋势。研究结果对交通需求分析、线路容量优化、运营效果评估等提供了数据支撑,可有效提高地铁交通便利性,满足不同区域的出行需求并改善整个地铁系统的效率和可持续性。 展开更多
关键词 地铁站点 建成环境 出行距离 xgboost模型 SHAP归因分析 非线性关系
下载PDF
基于SHAP可解释性的焊缝缺陷类型超声识别XGBoost模型
9
作者 陈明良 马志远 +3 位作者 张东辉 付冬欣 廖静瑜 林莉 《无损检测》 CAS 2024年第6期36-42,共7页
针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16... 针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16个时域特征、16个频域特征以及3个信息熵特征。计算SHAP值并选择其前8个高贡献特征构建特征子集,利用交叉验证和网格搜索优化XGBoost模型进行缺陷识别。试验结果表明,4种缺陷识别的平均准确率为96.7%;其中,横通孔的识别效果最佳,精确率、召回率和F_(1-score)均达到100%,三角槽次之,方形槽略差,矩形槽的识别结果最差,其精确率、召回率和F_(1-score)均为93.3%。最后,讨论了高贡献特征与缺陷类别之间的相关性,并对特征贡献差异及其原因进行了分析。 展开更多
关键词 超声检测 缺陷分类 xgboost模型 特征选择 SHAP
下载PDF
基于DE-XGBoost的短期风电功率预测
10
作者 张健 田海 《信息技术》 2024年第7期136-142,共7页
风电功率预测可为电力系统安全稳定运行提供重要的决策参考,因此研究如何提高风电功率预测精度具有重要意义。针对短期风电功率预测精度的问题,提出一种基于差分进化算法(DE)优化极端梯度提升树的组合预测模型(DE-XGBoost)。利用收敛速... 风电功率预测可为电力系统安全稳定运行提供重要的决策参考,因此研究如何提高风电功率预测精度具有重要意义。针对短期风电功率预测精度的问题,提出一种基于差分进化算法(DE)优化极端梯度提升树的组合预测模型(DE-XGBoost)。利用收敛速度快、优化效果好、复杂性低的差分进化算法对XGBoost的模型参数进行优化,实现对风电功率的准确预测。仿真结果证明,与其他预测模型相比,DE-XGBoost模型预测精度更高,泛化能力更强,可为风电调度运行提供详实的数据。 展开更多
关键词 风电功率预测 预测精度 差分进化算法 极端梯度提升树 组合模型
下载PDF
基于机理和XGBoost算法的LF精炼钢水成分预测模型
11
作者 杨黔 程斯祥 +3 位作者 周鹏 彭翼军 彭其春 姚建华 《自动化应用》 2024年第2期5-7,共3页
以我国某钢厂120 t LF精炼炉为研究对象,通过建立由冶炼机理模型和XGBoost模型相结合的混合模型,预测LF精炼过程中的钢水成分并进行实际应用。结果表明,模型预测终点碳、硅、锰、铝等元素均处于内控范围内,并平均减少了每炉钢取样工序0.... 以我国某钢厂120 t LF精炼炉为研究对象,通过建立由冶炼机理模型和XGBoost模型相结合的混合模型,预测LF精炼过程中的钢水成分并进行实际应用。结果表明,模型预测终点碳、硅、锰、铝等元素均处于内控范围内,并平均减少了每炉钢取样工序0.8次,提高了生产效率。 展开更多
关键词 LF精炼钢 成分预测 机理模型 xgboost模型
下载PDF
基于ADASYN-GS-XGBOOST混合模型的火山岩测井岩性识别
12
作者 宋梓豪 巩红雨 +2 位作者 冉爱华 杨鹏辉 刘迪仁 《海相油气地质》 CSCD 北大核心 2024年第2期188-196,共9页
火山岩的形成环境复杂,有些地区的火山岩可能只发育两三种岩石类型,这会导致不同岩性取心资料的代表性严重失衡。针对现有的测井岩性识别方法在处理类间不均衡样本时出现效果较差的问题,提出基于ADASYNGS-XGBOOST混合模型的火山岩岩性... 火山岩的形成环境复杂,有些地区的火山岩可能只发育两三种岩石类型,这会导致不同岩性取心资料的代表性严重失衡。针对现有的测井岩性识别方法在处理类间不均衡样本时出现效果较差的问题,提出基于ADASYNGS-XGBOOST混合模型的火山岩岩性识别方法。首先通过ADASYN过采样算法对不均衡样本进行处理得到新的样本集,再以XGBOOST算法作为基分类器对样本进行分类,并利用网格搜索法(GS)对模型进行参数优化,以此建立ADASYN-GS-XGBOOST混合岩性识别模型。将该混合模型训练后的结果与K近邻、朴素贝叶斯、随机森林、XGBOOST及SMOTE-GS-XGBOOST等算法的岩性识别结果进行对比,表明基于ADASYN-GS-XGBOOST算法建立的模型识别效果最好。该方法克服了已有岩性识别方法无法有效解决不均衡样本的问题,极大地提升了火山岩岩性识别的准确率。 展开更多
关键词 ADASYN算法 xgboost算法 混合模型 火山岩 测井 岩性识别
下载PDF
基于VMD-XGBoost-GRU模型的危岩体变形预测
13
作者 许秋鸿 刘晓青 《水利水电科技进展》 CSCD 北大核心 2024年第2期92-98,共7页
针对以往对危岩体监测数据前处理效果不佳的问题,提出了一种用于危岩体变形预测的VMD-XGBoost-GRU组合模型。该模型采用变分模态分解(VMD)和样本熵理论将危岩体变形数据分解成多个子序列,利用XGBoost算法提取重要的模型因子实现特征降维... 针对以往对危岩体监测数据前处理效果不佳的问题,提出了一种用于危岩体变形预测的VMD-XGBoost-GRU组合模型。该模型采用变分模态分解(VMD)和样本熵理论将危岩体变形数据分解成多个子序列,利用XGBoost算法提取重要的模型因子实现特征降维,通过门控循环单元(GRU)神经网络对危岩体变形进行预测。以某水电站右坝肩陡壁上的危岩体变形预测为例,将VMD-XGBoost-GRU组合模型与BP、GRU和VMD-XGBoost-BP 3种模型进行对比与分析,结果表明,VMD-XGBoost-GRU组合模型在危岩体变形预测方面具有较高精度,可为危岩体安全稳定状态评价提供技术依据。 展开更多
关键词 危岩体 VMD 样本熵 xgboost GRU 变形预测模型
下载PDF
基于XGboost模型的农业供应链金融信用风险测度研究
14
作者 吕慧如 吴凯诗 吴宇章 《科技和产业》 2024年第4期63-67,共5页
随着近年来农业供应链金融的发展,如何测度和控制农业供应链金融企业的信用风险变得愈加重要。选取76家农业上市企业为研究样本,选取了企业基本情况、盈利能力、营运能力、资金周转能力4个一级指标以及14个二级指标构建农业行业上市公... 随着近年来农业供应链金融的发展,如何测度和控制农业供应链金融企业的信用风险变得愈加重要。选取76家农业上市企业为研究样本,选取了企业基本情况、盈利能力、营运能力、资金周转能力4个一级指标以及14个二级指标构建农业行业上市公司信用风险评估指标体系,对比分析XGboost模型和Logistic模型的信用风险评估结果。实践表明,两个模型都具有良好的预测能力,XGboost模型在性能和预测精度上略优于logistic模型。 展开更多
关键词 供应链金融 xgboost LOGISTIC模型 信用风险
下载PDF
基于XGBoost算法的增生型糖尿病视网膜病变预测模型的建立及可视化实现
15
作者 梁芳 朱广晶 +1 位作者 吴婕 余丰 《当代医学》 2024年第2期8-12,共5页
目的利用H2O机器学习平台,建立增生性糖尿病视网膜病变(PDR)预测模型,旨在为PDR的临床诊疗提供指导。方法选取2019年1月至2021年1月于苏州大学附属理想眼科医院体检中心及住院部连续就诊的350例糖尿病视网膜病变(DR)患者作为研究对象,根... 目的利用H2O机器学习平台,建立增生性糖尿病视网膜病变(PDR)预测模型,旨在为PDR的临床诊疗提供指导。方法选取2019年1月至2021年1月于苏州大学附属理想眼科医院体检中心及住院部连续就诊的350例糖尿病视网膜病变(DR)患者作为研究对象,根据DR类型的不同分为非增生性糖尿病视网膜病变(NPDR)组(n=256)与PDR组(n=94)。比较两组临床资料。尝试多种机器学习算法,建立预测模型,通过绘制ROC曲线、计算混淆矩阵,明确最佳模型,并通过可加性解释模型(SHAP)分析、局部可解析性算法(LIME)及部分依赖图(PDP)等可视化方法呈现重要特征在预测中的作用。结果两组糖尿病(DM)病程、体力活动、体重指数(BMI)、腰臀比、血压、高密度脂蛋白胆固醇、空腹血糖、空腹胰岛素、糖化血红蛋白、谷丙转氨酶(ALT)水平及高血压、脂肪肝、吸烟、饮酒占比比较差异有统计学意义(P<0.05)。机器学习最佳模型为XGBoost,该模型Gini值0.997,R^(2)为0.926,重要特征包括DM病程、高密度脂蛋白胆固醇及空腹胰岛素。结论本研究基于XGBoost算法建立PDR临床预测模型,通过可视化呈现重要特征在预测中的作用,为PDR临床诊疗提供了新的思路。 展开更多
关键词 增生性糖尿病视网膜病变 预测模型 xgboost算法 机器学习
下载PDF
XGBoost与GRU模型在发电功率预测中的应用
16
作者 李光环 杨小天 刘训钊 《福建电脑》 2024年第6期21-26,共6页
超短期光伏发电功率预测是电网安全调度与平稳运行的基础。针对传统单一预测模型存在预测精度不高、模型抗干扰能力差、鲁棒性不强等问题,本文提出了一种基于双重XGBoost-GRU的混合预测模型,并经过以澳大利亚爱丽丝泉光伏发电系统为算... 超短期光伏发电功率预测是电网安全调度与平稳运行的基础。针对传统单一预测模型存在预测精度不高、模型抗干扰能力差、鲁棒性不强等问题,本文提出了一种基于双重XGBoost-GRU的混合预测模型,并经过以澳大利亚爱丽丝泉光伏发电系统为算例的仿真分析。仿真实验的结果表明,双重XGBoost-GRU组合预测模型相较于GRU、XGBoost-GRU误差分别降低了93.93%、75.65%,说明了基于特征创造XGBoost-GRU融合预测模型具有良好的预测效果。 展开更多
关键词 GRU模型 xgboost模型:光伏功率预测
下载PDF
Advancing Type II Diabetes Predictions with a Hybrid LSTM-XGBoost Approach
17
作者 Ayoub Djama Waberi Ronald Waweru Mwangi Richard Maina Rimiru 《Journal of Data Analysis and Information Processing》 2024年第2期163-188,共26页
In this paper, we explore the ability of a hybrid model integrating Long Short-Term Memory (LSTM) networks and eXtreme Gradient Boosting (XGBoost) to enhance the prediction accuracy of Type II Diabetes Mellitus, which... In this paper, we explore the ability of a hybrid model integrating Long Short-Term Memory (LSTM) networks and eXtreme Gradient Boosting (XGBoost) to enhance the prediction accuracy of Type II Diabetes Mellitus, which is caused by a combination of genetic, behavioral, and environmental factors. Utilizing comprehensive datasets from the Women in Data Science (WiDS) Datathon for the years 2020 and 2021, which provide a wide range of patient information required for reliable prediction. The research employs a novel approach by combining LSTM’s ability to analyze sequential data with XGBoost’s strength in handling structured datasets. To prepare this data for analysis, the methodology includes preparing it and implementing the hybrid model. The LSTM model, which excels at processing sequential data, detects temporal patterns and trends in patient history, while XGBoost, known for its classification effectiveness, converts these patterns into predictive insights. Our results demonstrate that the LSTM-XGBoost model can operate effectively with a prediction accuracy achieving 0.99. This study not only shows the usefulness of the hybrid LSTM-XGBoost model in predicting diabetes but it also provides the path for future research. This progress in machine learning applications represents a significant step forward in healthcare, with the potential to alter the treatment of chronic diseases such as diabetes and lead to better patient outcomes. 展开更多
关键词 LSTM xgboost Hybrid models Machine Learning. Deep Learning
下载PDF
基于XGBoost与LR融合模型的信用卡欺诈检测
18
作者 张海洋 陈玉明 +1 位作者 曾念峰 卢俊文 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第3期195-200,共6页
随着银行卡业务的不断发展,各种各样的信用卡欺诈方式已经给金融机构带来严重的威胁,使得信用卡欺诈检测成为一个十分紧迫的任务。为解决此问题,提出一种XGBoost与LR融合模型。该模型首先运用XGBoost算法自动进行特征组合和离散化,然后... 随着银行卡业务的不断发展,各种各样的信用卡欺诈方式已经给金融机构带来严重的威胁,使得信用卡欺诈检测成为一个十分紧迫的任务。为解决此问题,提出一种XGBoost与LR融合模型。该模型首先运用XGBoost算法自动进行特征组合和离散化,然后将新构造的特征向量运用在逻辑回归LR模型上,通过XGBoost与LR融合模型进行分类预测。实验结果表明,与经典传统算法相比,提出的XGBoost与LR融合模型具有更好的欺诈检测性能,提高了信用卡欺诈检测的准确率。 展开更多
关键词 xgboost 欺诈检测 逻辑回归 融合模型 信用卡
下载PDF
在线医药电商评论情感分析——基于XGBoost集成加权词向量和大语言模型的情感识别模型
19
作者 田梦影 时维 《科技和产业》 2024年第9期128-135,共8页
消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost... 消费者评论是考察消费者情感的重要数据源,对商品评论进行数据挖掘是帮助在线医药电商改善经营的重要途径。立足于在线医药电商的用户评论,基于SO-PMI(情感倾向点互信息)算法构建该领域情感词典,对评论词向量进行情感加权。利用XGBoost(极限梯度提升树)集成词向量和LLM(大语言模型)构建情感识别模型,最后得出评论情感指数,从多个维度展开,分析消费者评论中的情感趋势。实证分析表明,构建的情感识别模型的AUC(曲线下的面积)等验证指标较LLM模型相比有进一步提升,具有一定的应用价值。 展开更多
关键词 在线医药电商 LLM(大语言模型) xgboost(极限梯度提升树)算法 情感指数 情感识别
下载PDF
融合XGBoost的企业财务造假识别模型构建
20
作者 程梅娟 《贵阳学院学报(自然科学版)》 2024年第1期16-20,共5页
基于XGBoost算法优化了财务造假识别模型,进行特征提取以更好地进行分析,最终融入性能评价体系对财务造假模型进行评分,旨在提高财务造假的识别准确性。研究结果显示,优化后的SVM模型在财务造假识别方面的曲线下面积为0.77,随机森林算... 基于XGBoost算法优化了财务造假识别模型,进行特征提取以更好地进行分析,最终融入性能评价体系对财务造假模型进行评分,旨在提高财务造假的识别准确性。研究结果显示,优化后的SVM模型在财务造假识别方面的曲线下面积为0.77,随机森林算法的曲线下面积达到0.83,而采用XGBoost曲线面积为0.85,XGBoost模型在财务造假识别方面取得了较高的准确性,优化后的Xscore模型在财务造假模型识别中精确度更高。因此,基于XGBoost的企业财务造假识别模型具有重要的应用价值。 展开更多
关键词 xgboost 财务造假 识别准确率 性能优化 模型设计
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部