期刊文献+
共找到929,400篇文章
< 1 2 250 >
每页显示 20 50 100
基于CatBoost模型和Logistic回归的2型糖尿病风险因素研究
1
作者 袁晓勇 蒋剑军 《绥化学院学报》 2024年第8期143-146,共4页
文章通过PolynomialFeatures方法获得高阶交互数据,应用CatBoost模型评估影响因素的重要性,引入Logistic回归对2型糖尿病进行识别并比较一阶数据和高阶数据的识别效果。CatBoost模型在对一阶变量的评估中,锻炼频率、血红蛋白、体质指数... 文章通过PolynomialFeatures方法获得高阶交互数据,应用CatBoost模型评估影响因素的重要性,引入Logistic回归对2型糖尿病进行识别并比较一阶数据和高阶数据的识别效果。CatBoost模型在对一阶变量的评估中,锻炼频率、血红蛋白、体质指数、年龄等得分较高,对高阶变量则是锻炼频率、锻炼频率×白细胞、锻炼频率×总胆固醇等得分较高,Logistic回归在2型糖尿病风险识别效果上高阶数据显著高于一阶数据。得出结论:2型糖尿病主要是多因素交互作用的结果,其中锻炼频率、体质指数、年龄等因素起着决定性的作用。 展开更多
关键词 糖尿病 catboost模型 LOGISTIC回归 风险预测
下载PDF
基于IGWO-CatBoost模型的岩石爆破块度预测
2
作者 宋家威 郇宝乾 +3 位作者 秦涛 张宇庭 王雪松 徐振洋 《爆破器材》 CAS CSCD 北大核心 2024年第2期56-64,共9页
针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优... 针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优能力。对公开数据库和现场采集的32组数据进行预测分析。首先,采用随机森林算法进行特征重要性筛选,利用IGWO对CatBoost进行参数寻优,建立IGWO-CatBoost爆破块度预测模型;然后,将预测结果与在相同条件下建立的CatBoost、XGBoost、LightGBM模型进行对比分析。经过IGWO调参,CatBoost模型的预测准确度得到有效提高,IGWO-CatBoost模型的预测准确度均优于其他3种预测模型。对比结果表明,IGWO-CatBoost模型具有很好的预测能力和适应性。 展开更多
关键词 改进灰狼算法 IGWO-catboost模型 随机森林 块度预测
下载PDF
基于CatBoost模型与SHAP分析研究地理环境因子对健康人血尿酸参考值的影响
3
作者 梁向荣 葛淼 +1 位作者 王聪霞 何进伟 《西安交通大学学报(医学版)》 CAS CSCD 北大核心 2023年第4期601-607,共7页
目的探究可能对健康人血尿酸(uric acid,UA)产生影响的地理环境因子并探究全国尺度下UA参考值的变化趋势。方法收集全国565个位点的607905例健康人的UA参考值,运用相关分析法分析25项地理环境因素与UA参考值的相关性,构建CatBoost模型... 目的探究可能对健康人血尿酸(uric acid,UA)产生影响的地理环境因子并探究全国尺度下UA参考值的变化趋势。方法收集全国565个位点的607905例健康人的UA参考值,运用相关分析法分析25项地理环境因素与UA参考值的相关性,构建CatBoost模型并应用SHAP值解释模型,预测全国各县市级的健康人UA参考值,并采用普通克里金绘制全国健康人的UA参考值地理分布图。结果纬度、海拔高度、年平均气温、年平均相对湿度、年降水量、气温年较差、年平均风速、表土粉粒百分率、表土容重、表土石砾含量、表土有机质含量、表土pH、表土(粘土)阳离子交换量、表土(粉土)阳离子交换量、表土盐基饱和度、表土总可交换量、T-CaCO 3、T-CaSO 4、表土碱度、表土盐分这20项指标与全国健康人UA参考值呈现相关。全国健康人UA参考值的空间分布呈现差异性,表现为高海拔地区较高,沿海地区在相近海拔高度下高于内陆地区,中东部低、西南部高的变化趋势。结论本研究为后续近一步研究不同影响因子对UA参考值的作用机制奠定基础。建立CatBoost模型在不同地区使用UA参考值作为高尿酸血症及相关慢性疾病预后因子制定参考标准时提供依据。 展开更多
关键词 高尿酸血症 尿酸(UA) 地理环境 catboost SHAP模型 克里金
下载PDF
基于BiLSTM-CatBoost模型的电力用户异常用电检测 被引量:2
4
作者 吴泽黎 李清清 梁皓 《自动化与仪表》 2023年第5期22-27,共6页
为进一步提高电力用户异常用电检测性能,实现异常用电行为的快速准确研判,该文提出一种基于BiLSTM-CatBoost模型的用户异常用电检测方法。该模型首先采用双向长短期记忆神经网络(bidirectional long short-term memory,BiLSTM)对用户用... 为进一步提高电力用户异常用电检测性能,实现异常用电行为的快速准确研判,该文提出一种基于BiLSTM-CatBoost模型的用户异常用电检测方法。该模型首先采用双向长短期记忆神经网络(bidirectional long short-term memory,BiLSTM)对用户用电数据进行特征深度提取,利用用电时序数据两个方向的信息来获取特征维度;接着采用完全对称决策树为基学习器的CatBoost集成学习算法作为分类器进行检测,避免检测过拟合。BiLSTM和CatBoost均采用贝叶斯优化算法(Bayesian optimization,BO)对全局进行超参数寻优。实例对比表明,基于BiLSTM-CatBoost模型的用户异常用电检测方法在准确率、F1分数、AUC、MCC值等评价指标中均表现最优。 展开更多
关键词 异常用电检测 双向长短期记忆神经网络 catboost 深度学习 集成学习
下载PDF
基于CatBoost模型的上市公司财务困境预测
5
作者 张朋燕 戴家佳 《应用数学进展》 2021年第9期2923-2932,共10页
本文按照财务异常与财务正常的公司数量为1:2的比例选取了2019~2020年间63家被特殊处理的上市公司和126家财务正常的上市公司。从公司发展能力、经营能力、盈利能力、股本结构、人员变动等十个方面的51个变量中利用统计方法和随机森林... 本文按照财务异常与财务正常的公司数量为1:2的比例选取了2019~2020年间63家被特殊处理的上市公司和126家财务正常的上市公司。从公司发展能力、经营能力、盈利能力、股本结构、人员变动等十个方面的51个变量中利用统计方法和随机森林方法筛选出17个重要变量,在此基础上首次运用CatBoost模型进行公司财务困境问题上进行建模和预测,并与之前学者经常使用的XGBoost、随机森林和逻辑回归这三种建模方法进行对比。实验结果显示CatBoost模型在特异性、准确率和AUC值方面都要优于其他三种模型,其中准确率达到了98.2%,在准确性方面要比近年广泛运用且预测效果较好的XGBoost模型高3.5%。 展开更多
关键词 变量筛选 随机森林 catboost XGBoost 逻辑回归
下载PDF
基于CatBoost-SHAP模型的滑坡易发性建模及可解释性
6
作者 曾韬睿 王林峰 +2 位作者 张俞 程平 吴帆 《中国地质灾害与防治学报》 CSCD 2024年第1期37-50,共14页
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分... 文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计,进一步划分为4,6,8,12,16,20级。随后,引入了类别增强提升树模型(CatBoost)以评估不同工况下的滑坡易发性值,再结合受试者曲线与沙普利加性解释法分析,对建模过程中的不确定性和可解释性进行了深入研究,目的在于确定最优建模策略。结果表明:(1)在CatBoost模型计算中,河流距离成为最关键的影响因子,其次是与地质条件、人类活动相关的因子;(2)不分级工况下,模型能够获得最高的AUC值,达到0.866;(3)相较于等间距法,自然断点法的划分策略展现出更佳的泛化能力,且模型预测性能随着分级数量的增加而增加;(4)沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解,提高滑坡预测的准确性和可靠性,为相关地区的防灾减灾工作提供科学依据。 展开更多
关键词 滑坡 易发性建模 可解释性 catboost模型 沙普利加性解释法模型 台风诱发滑坡
下载PDF
基于KMV-CatBoost增强的企业信用债券违约风险评估模型
7
作者 王培培 周小平 +1 位作者 陈佳佳 王涵棋 《上海师范大学学报(自然科学版中英文)》 2024年第2期247-253,共7页
针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后... 针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后,利用KMV模型评估借款公司信用违约概率,计算公司资产市场价值与公司资产市场价值的波动率,获得企业资产价值与违约点之间的差额Distance-to-Default(DD);最后,利用债务偿还期限、短期无风险收益率、公司股权市场价值、公司债务面值计算出的违约距离,将其加入指标中,利用CatBoost算法预测企业信用债券违约风险,通过基于Ordered Boosting方式的CatBoost算法训练模型,得到无偏梯度估计,以减缓预测偏移,从而增强模型的泛化能力.实验结果表明:基于KMV-CatBoost增强的模型能够提高企业信用债券违约风险识别的准确率,识别正确率约为95.5%. 展开更多
关键词 债券违约 预测模型 catboost Kaufman-Merton-Voss(KMV)
下载PDF
一种基于CatBoost优化的光伏阵列故障诊断模型
8
作者 彭自然 许怀顺 肖伸平 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2418-2428,共11页
大部分光伏电站地处偏僻、地形复杂的区域,受到外界环境的影响,易发生各种故障.而传统的光伏阵列故障诊断方法存在精度不高以及光伏数据利用率低等问题.针对以上问题,本文先是通过引入Levy飞行策略和步长因子动态调整策略改进麻雀搜索算... 大部分光伏电站地处偏僻、地形复杂的区域,受到外界环境的影响,易发生各种故障.而传统的光伏阵列故障诊断方法存在精度不高以及光伏数据利用率低等问题.针对以上问题,本文先是通过引入Levy飞行策略和步长因子动态调整策略改进麻雀搜索算法(Sparrow Search Algorithm,SSA),降低SSA算法陷入局部最优的风险,提升SSA算法的寻优能力.然后采用改进的Levy步长调整麻雀搜索算法(Levy Adjustment Sparrow Search Algorithm,LASSA)对CatBoost模型关键超参数进行寻优,提出了一种基于CatBoost并以LASSA为优化策略的光伏阵列故障诊断模型LASSA-CatBoost,以实现光伏阵列的短路、开路、老化和阴影遮挡故障的精确诊断.实验结果表明,LASSA-CatBoost模型的故障诊断准确率为99.7%,相较于优化前的CatBoost模型,准确率提高了3.6%.与现有的光伏阵列故障诊断模型相比,LASSA-CatBoost模型的准确性和稳定性更高. 展开更多
关键词 光伏阵列 故障诊断 I-V特性曲线 catboost Levy adjustment sparrow search algorithm
下载PDF
基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络模型分析
9
作者 王爱民 王凤琳 +10 位作者 黄一铭 徐雅琪 张文婧 丛显铸 苏维强 王素珍 高梦瑶 李爽 孔雨佳 石福艳 陶恩学 《吉林大学学报(医学版)》 CAS CSCD 北大核心 2024年第4期1044-1054,共11页
目的:筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考。方法:从英国生物样本(UK Biobank)数据库中纳入315896例参与者和相关变量,通过... 目的:筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考。方法:从英国生物样本(UK Biobank)数据库中纳入315896例参与者和相关变量,通过类别型特征提升(CatBoost)算法进行特征选择,将所有参与者按7∶3比例随机分为训练集和测试集,并基于最大最小爬山(MMHC)算法构建贝叶斯网络模型。结果:本研究中人群心脑血管疾病患病率为28.8%。CatBoost算法筛选的排名前10位变量分别为年龄、体质量指数(BMI)、低密度脂蛋白胆固醇(LDL-C)、总胆固醇(TC)、甘油三酯-葡萄糖(TyG)指数、家族史、载脂蛋白A/B比值、高密度脂蛋白胆固醇(HDL-C)、吸烟状态和性别。CatBoost训练集模型受试者工作特征(ROC)曲线下面积(AUC)为0.770,模型准确性为0.764;验证集模型AUC为0.759,模型准确性为0.763。临床效能分析,训练集阈值范围为0.06~0.85,验证集阈值范围为0.09~0.81。心脑血管疾病发病风险贝叶斯网络模型分析,年龄、性别、吸烟状态、家族史、BMI和载脂蛋白A/B比值与心脑血管疾病直接相关,是心脑血管疾病发生的重要风险因素,TyG指数、HDL-C、LDL-C和TC通过影响BMI和载脂蛋白A/B比值间接影响心脑血管疾病的发生风险。结论:控制BMI、载脂蛋白A/B比值和吸烟行为,可以降低心脑血管疾病的发病风险。贝叶斯网络模型可用于预测心脑血管疾病发病风险。 展开更多
关键词 心脑血管疾病 catboost算法 贝叶斯网络 风险推理
下载PDF
基于集成学习CatBoost优化模型的爆堆大块率预测 被引量:1
10
作者 金长宇 于佳强 +1 位作者 王强 陈立军 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第12期1743-1750,共8页
爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法... 爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法进行模型二次调优,并对比调优实现后模型与随机森林法、XGBoost模型、LightGBM模型和CatBoost模型进行效果对比.结果表明,经过两轮调优后的CatBoost模型预测效果明显高于其他几种模型,R~2准确度可达98.83%,证明了两轮调优后CatBoost模型具有较高的预测水平,验证了该方法在大块率预测研究中的可行性,为爆破参数设计和大块率优化分析提供了可靠的参考. 展开更多
关键词 大块率预测 机器学习 集成学习 爆破 catboost模型
下载PDF
基于CatBoost模型和SHAP解释方法的土壤重金属影响因素与程度定量分析 被引量:4
11
作者 郑家桐 王鹏 +3 位作者 石航源 肖荣波 邓一荣 庄长伟 《环境科学学报》 CAS CSCD 北大核心 2023年第4期448-456,共9页
掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空... 掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空间分布的影响因子和范围边界.结果表明,CatBoost在预测土壤Cd、Pb和Cr含量上具有较高精度,R^(2)分别为0.76、0.71和0.81.空间位置对土壤Cd、Pb分布的影响分别可达71.28%和73.54%,其中,与冶炼厂的距离(DI_(Smp))是土壤Cd空间分布的关键影响因素,影响范围在7.5 km内;与二级公路的距离(DR_(Sec))是土壤Pb空间分布的关键影响因素,影响范围可达8 km;Fe_(2)O_(3)是土壤Cr空间分布的关键影响因素,土壤中氧化铁含量达到4.5%后开始正向影响土壤Cr含量.本研究定量解析了土壤重金属影响因素,可为土壤重金属污染防治提供科学决策依据. 展开更多
关键词 重金属 空间分布 catboost模型 SHAP解释方法 可解释性 影响因素
原文传递
基于网格搜索优化CatBoost模型的GF-5卫星影像铬离子含量反演研究
12
作者 刘东宜 屈永华 +1 位作者 冯耀伟 屈冉 《生态环境学报》 2024年第9期1460-1470,共11页
高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为... 高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为数据源,基于皮尔逊相关系数、波段加法和比值指数,提取与土壤重金属含量变化相关的特征,构建反演模型。首先,剔除预处理后的遥感影像中饱和、噪声和水汽吸收波段,同时利用各波段反射率进行代数运算构建加法和比值指数,计算其与实测铬离子含量数据的皮尔逊相关系数;然后,基于皮尔逊相关系数得到的前50最高相关特征变量,采用网格搜索优化的CatBoost回归,建立土壤六价铬离子含量反演模型,并使用SHAP方法评估特征重要性,探究影响GF-5反演土壤重金属重要波段。结果显示,在相同光谱变换条件下,与偏最小二乘回归(PLSR)、随机森林回归(RFR)、支持向量机回归(SVMR)、卷积神经网络(CNN)和多元逐步线性回归模型相比,网格搜索优化的CatBoost模型效果最好,训练集拟合优度为0.92,验证集为0.88。利用网格搜索优化CatBoost回归模型对吉林省安图铬渣填埋场进行了土壤六价铬离子含量反演,结果显示该区域尾矿库开采区域周边六价铬离子污染严重,这与该地矿山开采和尾矿堆放实际情况基本一致。该研究为土壤重金属污染监测和环境管理提供了重要的技术手段和科学依据。 展开更多
关键词 高光谱反演 高光谱遥感 GF-5 六价铬离子 土壤重金属 catboost回归模型
下载PDF
基于CatBoost的供水量组合预测模型探讨
13
作者 朱俊杰 叶文静 +1 位作者 曹萃文 顾幸生 《石油化工自动化》 CAS 2023年第5期10-14,共5页
如何合理安排水资源并减少水资源浪费是亟需解决的问题,精确预测供水量并为供水系统调度方案的制定提供必要的数据支持是目前重要研究方向之一。建立了一种基于CatBoost的城市供水量组合预测模型,该模型基于KNN算法对异常数据进行识别... 如何合理安排水资源并减少水资源浪费是亟需解决的问题,精确预测供水量并为供水系统调度方案的制定提供必要的数据支持是目前重要研究方向之一。建立了一种基于CatBoost的城市供水量组合预测模型,该模型基于KNN算法对异常数据进行识别和校正,从而减少异常数据对模型精度的影响;随后采用SVR,XGBoost,LightGBM和CatBoost模型预测供水量数据;为了融合各模型的优点并提高模型的预测精度,将各单一模型的预测结果作为输入特征,采用CatBoost模型进一步预测供水量数据并得到最终的供水量预测结果。仿真实验结果表明:所提出的基于CatBoost的组合预测模型具有更好的预测精度,验证了该模型在城市供水量预测问题中的有效性。 展开更多
关键词 供水量预测 KNN算法 异常数据识别 catboost模型
下载PDF
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 被引量:2
14
作者 刘爱琴 郭少鹏 张卓星 《国家图书馆学刊》 北大核心 2023年第5期84-92,共9页
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost... 互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。 展开更多
关键词 隐含狄利克雷分布(LDA) 文本自动分类 SVM算法 catboost算法
下载PDF
基于CatBoost和XGBoost组合模型的水深反演
15
作者 曾书玉 谢涛 孔瑞瑶 《海洋测绘》 CSCD 北大核心 2023年第3期59-63,共5页
为获取高精度的水深信息以满足海洋研究各领域的需要,提出一种CatBoost和XGBoost模型组合的水深反演模型。选取Sentinel-2A卫星遥感数据,以瓦胡岛为研究区域,引入CatBoost和XGBoost模型,对二者进行线性组合,构建CatBoost-XGBoost组合模... 为获取高精度的水深信息以满足海洋研究各领域的需要,提出一种CatBoost和XGBoost模型组合的水深反演模型。选取Sentinel-2A卫星遥感数据,以瓦胡岛为研究区域,引入CatBoost和XGBoost模型,对二者进行线性组合,构建CatBoost-XGBoost组合模型。实验结果表明:组合模型的决定系数、均方根误差、平均绝对误差以及平均相对误差分别为95.32%、1.29 m、0.86 m、20.51%,与单一模型相比,组合模型的水深反演精度有一定提高。 展开更多
关键词 海洋遥感 水深反演 组合模型 catboost模型 XGBoost模型
下载PDF
利用RF-CatBoost的重大传染病患者入住ICU优先级预测模型
16
作者 高建清 陈莉婷 +1 位作者 郑晶 符鑫隆 《三明学院学报》 2023年第6期45-54,共10页
重大传染病患者入住重症加强护理病房(ICU)优先级预测是合理安排医疗资源的关键所在,因此备受医疗及其相关部门的高度重视。采用Sírio-Libanês数据智能团队公开的原始数据集,通过构建随机森林(Random Forest, RF)和CatBoost... 重大传染病患者入住重症加强护理病房(ICU)优先级预测是合理安排医疗资源的关键所在,因此备受医疗及其相关部门的高度重视。采用Sírio-Libanês数据智能团队公开的原始数据集,通过构建随机森林(Random Forest, RF)和CatBoost算法相结合的混合模型对重大传染病重症患者入住ICU优先级进行预测。应用RF算法提取20个重要特征,并通过网格搜索算法确定CatBoost算法最优参数组合,从而得到RF-CatBoost的优化模型。为了证明该模型的优越性,与朴素贝叶斯、决策树、神经网络算法和支持向量机进行比较分析。结果表明:该模型的精确率、召回率和F1值均为0.9,高于其他四种智能方法,预测时间为0.0083秒也相对较短。该模型能快速且精准预测重大传染病重症患者入住ICU优先级,提高医疗效率,促进医疗资源的合理分配。 展开更多
关键词 重大传染病 重症加强护理病房 随机森林 catboost 网格搜索
下载PDF
基于CatBoost算法的配电网分区拓扑辨识
17
作者 彭寒梅 吴行 +2 位作者 胡磊 苏永新 谭貌 《电力自动化设备》 EI CSCD 北大核心 2024年第5期95-102,共8页
含多分布式电源配电网的拓扑结构具有多样性与多变性,影响拓扑辨识的实时性和准确性。提出一种基于CatBoost算法的配电网分区拓扑辨识方法。构建结合拓扑分区的配电网拓扑辨识框架,采用区域开关状态矩阵描述拓扑结构,以进行物理上的辨... 含多分布式电源配电网的拓扑结构具有多样性与多变性,影响拓扑辨识的实时性和准确性。提出一种基于CatBoost算法的配电网分区拓扑辨识方法。构建结合拓扑分区的配电网拓扑辨识框架,采用区域开关状态矩阵描述拓扑结构,以进行物理上的辨识降维;提出基于CatBoost算法的特征选择与拓扑辨识方法,通过分区并行离线训练得到历史拓扑和未知拓扑的区域拓扑辨识CatBoost模型,通过在线应用得到实时的区域开关状态矩阵标签,形成配电网开关状态矩阵,实现系统拓扑辨识。配电网算例系统测试结果验证了所提方法的有效性。 展开更多
关键词 配电网 拓扑辨识 catboost算法 拓扑分区 特征选择
下载PDF
基于CatBoost-NSGA-Ⅲ算法的盾构姿态预测与优化
18
作者 吴贤国 刘俊 +3 位作者 曹源 雷宇 李士范 覃亚伟 《中国安全科学学报》 CAS CSCD 北大核心 2024年第8期69-77,共9页
为解决盾构掘进过程中因盾构前倾变形、蛇形、轴线偏离及纠偏等影响施工安全性与高效性的问题,提出一种将类别型特征梯度提升(CatBoost)与第三代非支配排序遗传算法(NSGA-Ⅲ)相结合的盾构姿态多目标优化方法;以贵阳地铁为例,选取22个影... 为解决盾构掘进过程中因盾构前倾变形、蛇形、轴线偏离及纠偏等影响施工安全性与高效性的问题,提出一种将类别型特征梯度提升(CatBoost)与第三代非支配排序遗传算法(NSGA-Ⅲ)相结合的盾构姿态多目标优化方法;以贵阳地铁为例,选取22个影响因素作为输入参数,利用CatBoost算法建立输入参数与盾构姿态之间的非线性映射函数关系,采用随机森林(RF)算法评价输入参数的重要性;以盾构姿态绝对值最小化为目标,构建CatBoost-NSGA-Ⅲ多目标优化模型,并通过案例分析验证所提方法的适用性和有效性。结果表明:采用CatBoost算法训练工程实测数据得到的预测模型具有较高的精度,5个盾构姿态目标的R^(2)范围为0.916~0.943;所研发的CatBoost-NSGA-Ⅲ盾构姿态多目标优化方法,可使盾构姿态得到显著优化,整体改进的平均值为53.34%。 展开更多
关键词 类别型特征梯度提升(catboost) 第三代非支配排序遗传算法(NSGA-Ⅲ) 盾构姿态 多目标优化 重要性排序
下载PDF
基于MSPA和MCR模型的庐山市生态网络构建 被引量:2
19
作者 李华 郑育桃 +1 位作者 黄荷 陈飞平 《中南林业科技大学学报》 CAS CSCD 北大核心 2024年第2期98-107,共10页
【目的】在生态环境形势严峻的背景下,构建生态网络是连接破碎化斑块间的重要纽带,是保障物种迁徙交流的有效途径。【方法】以庐山市为研究对象,以GIS技术为核心,利用MSPA法对庐山市进行景观格局分析,再运用景观连通性评价法选取重要生... 【目的】在生态环境形势严峻的背景下,构建生态网络是连接破碎化斑块间的重要纽带,是保障物种迁徙交流的有效途径。【方法】以庐山市为研究对象,以GIS技术为核心,利用MSPA法对庐山市进行景观格局分析,再运用景观连通性评价法选取重要生态源地;其次采用AHP分析法结合专家打分法建立阻力因子评价体系构建阻力面,再基于MCR模型完成庐山市生态网络的构建,运用重力模型选取重要潜在生态廊道,给出生态网络的优化对策,最后应用生态网络分析法,对出生态网络的可行性进行分析。【结果】1)庐山市10处重要生态源地的面积为37 946.52 hm^(2),庐山和鄱阳湖为两处大型生态源地;2)遴选出19条重要生态廊道长为297.05 km,主要分布于中部地区;3)构成生态廊道的景观三要素分别为林地、水系和耕地,廊道宽度设置为300 m;4)构建形成“两区两带三轴”的生态安全格局。【结论】研究区内中心城区及中南部地区斑块分布零碎,景观连通性差,缺少生物栖息活动的绿色空间,应大力改善两地的生态环境,生态绿廊由两地内部向外部空间延伸构建,最终绿廊绿道交织成网覆盖全域,新增3个生态核心节点和9条重要生态廊道后的网络连接指数明显提高,表明构建的庐山市生态网络可行性较强。研究结果对于庐山市的城市绿地系统规划、生态园林城市的建设和生物多样性保护具有一定的指导意义。 展开更多
关键词 MSPA 生态网络 MCR模型 庐山市 重力模型
下载PDF
基于CatBoost-MOEAD的大直径泥水盾构施工多目标预测优化
20
作者 吴贤国 刘俊 +2 位作者 苏飞鸣 陈虹宇 冯宗宝 《中国安全科学学报》 CAS CSCD 北大核心 2024年第6期57-64,共8页
为有效优化盾构施工参数,实现在大直径泥水盾构掘进过程中安全、高效和节能的目标,提出分类助推(CatBoost)和基于分解的多目标进化算法(MOEAD)相结合的混合智能算法;综合考虑盾构施工参数与地质条件,以主要的盾构施工参数为研究对象,选... 为有效优化盾构施工参数,实现在大直径泥水盾构掘进过程中安全、高效和节能的目标,提出分类助推(CatBoost)和基于分解的多目标进化算法(MOEAD)相结合的混合智能算法;综合考虑盾构施工参数与地质条件,以主要的盾构施工参数为研究对象,选择地表沉降、贯入度和掘进比能为预测和控制目标;优化调控选择的盾构施工参数,并以武汉市轨道交通某号线为例,验证该混合算法的有效性。结果表明:采用CatBoost算法建立的预测模型在大直径泥水盾构上表现出来的预测性能良好,对3个控制目标的拟合精度(R 2)均达到0.9以上;预测模型的重要性排序表明:大直径泥水盾构的总推进力和推进速度对地表沉降、贯入度和掘进比能有显著影响;所提出的CatBoost-MOEAD混合智能算法对3个控制目标的优化效果明显,地表沉降、贯入度和掘进比能分别达到12.35%、7.47%和10.70%的优化幅度,并给出相应盾构施工参数的控制范围。 展开更多
关键词 大直径泥水盾构 分类助推(catboost) 基于分解的多目标进化算法(MOEAD) 多目标优化 地表沉降
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部