期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于Catboost算法的中国典型农业区重金属污染特征及影响因素分析
1
作者 李珊 杨济妮 +3 位作者 苏贵金 李倩倩 孟晶 史斌 《环境化学》 CAS CSCD 北大核心 2024年第10期3377-3387,共11页
土壤是保障人类生存和发展的物质基础,农田土壤与人类生产生活密切相关,农田土壤污染问题值得关注.本文选取东北三省、京津冀和长江经济带作为研究区域,通过文献调研筛选出2000—2020年发布的400篇相关文献,收集到2052表层土壤样本,通... 土壤是保障人类生存和发展的物质基础,农田土壤与人类生产生活密切相关,农田土壤污染问题值得关注.本文选取东北三省、京津冀和长江经济带作为研究区域,通过文献调研筛选出2000—2020年发布的400篇相关文献,收集到2052表层土壤样本,通过统计学、空间分析和机器学习等方法对其污染特征进行分析.结果表明,与农用地最严格的筛选值标准相比,3个研究区域Cd污染问题较为突出,东北三省、京津冀和长江经济带的超标率分别为37.5%、34.0%和45.8%,长江经济带也存在Cu污染问题,其超标率为30.6%;进一步将采样点位分为矿区周边点位、市郊区点位和其他农田点位,采用潜在生态风险指数法评价表明,矿区周边样点严重和重风险占比(54.8%)显著高于市郊区样点(37.2%)和其他农田样点(36.6%).采用Catboost模型进行影响因子识别发现,矿区周边农田主要受选矿、尾矿暴露等造成的Cd和Hg污染影响,而市郊区农田主要受商业、工业和交通运输业等人类活动带来的Hg污染影响,其他农田土壤中主要受农药化肥的施用以及大型器械化带来的Cd污染影响. 展开更多
关键词 农田土壤 重金属 污染特征 catboost 模型 影响因素.
下载PDF
基于CatBoost-SHAP模型的滑坡易发性建模及可解释性 被引量:1
2
作者 曾韬睿 王林峰 +2 位作者 张俞 程平 吴帆 《中国地质灾害与防治学报》 CSCD 2024年第1期37-50,共14页
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分... 文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计,进一步划分为4,6,8,12,16,20级。随后,引入了类别增强提升树模型(CatBoost)以评估不同工况下的滑坡易发性值,再结合受试者曲线与沙普利加性解释法分析,对建模过程中的不确定性和可解释性进行了深入研究,目的在于确定最优建模策略。结果表明:(1)在CatBoost模型计算中,河流距离成为最关键的影响因子,其次是与地质条件、人类活动相关的因子;(2)不分级工况下,模型能够获得最高的AUC值,达到0.866;(3)相较于等间距法,自然断点法的划分策略展现出更佳的泛化能力,且模型预测性能随着分级数量的增加而增加;(4)沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解,提高滑坡预测的准确性和可靠性,为相关地区的防灾减灾工作提供科学依据。 展开更多
关键词 滑坡 易发性建模 可解释性 catboost模型 沙普利加性解释法模型 台风诱发滑坡
下载PDF
基于KMV-CatBoost增强的企业信用债券违约风险评估模型 被引量:1
3
作者 王培培 周小平 +1 位作者 陈佳佳 王涵棋 《上海师范大学学报(自然科学版中英文)》 2024年第2期247-253,共7页
针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后... 针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后,利用KMV模型评估借款公司信用违约概率,计算公司资产市场价值与公司资产市场价值的波动率,获得企业资产价值与违约点之间的差额Distance-to-Default(DD);最后,利用债务偿还期限、短期无风险收益率、公司股权市场价值、公司债务面值计算出的违约距离,将其加入指标中,利用CatBoost算法预测企业信用债券违约风险,通过基于Ordered Boosting方式的CatBoost算法训练模型,得到无偏梯度估计,以减缓预测偏移,从而增强模型的泛化能力.实验结果表明:基于KMV-CatBoost增强的模型能够提高企业信用债券违约风险识别的准确率,识别正确率约为95.5%. 展开更多
关键词 债券违约 预测模型 catboost Kaufman-Merton-Voss(KMV)
下载PDF
基于网格搜索优化CatBoost模型的GF-5卫星影像铬离子含量反演研究
4
作者 刘东宜 屈永华 +1 位作者 冯耀伟 屈冉 《生态环境学报》 CSCD 北大核心 2024年第9期1460-1470,共11页
高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为... 高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为数据源,基于皮尔逊相关系数、波段加法和比值指数,提取与土壤重金属含量变化相关的特征,构建反演模型。首先,剔除预处理后的遥感影像中饱和、噪声和水汽吸收波段,同时利用各波段反射率进行代数运算构建加法和比值指数,计算其与实测铬离子含量数据的皮尔逊相关系数;然后,基于皮尔逊相关系数得到的前50最高相关特征变量,采用网格搜索优化的CatBoost回归,建立土壤六价铬离子含量反演模型,并使用SHAP方法评估特征重要性,探究影响GF-5反演土壤重金属重要波段。结果显示,在相同光谱变换条件下,与偏最小二乘回归(PLSR)、随机森林回归(RFR)、支持向量机回归(SVMR)、卷积神经网络(CNN)和多元逐步线性回归模型相比,网格搜索优化的CatBoost模型效果最好,训练集拟合优度为0.92,验证集为0.88。利用网格搜索优化CatBoost回归模型对吉林省安图铬渣填埋场进行了土壤六价铬离子含量反演,结果显示该区域尾矿库开采区域周边六价铬离子污染严重,这与该地矿山开采和尾矿堆放实际情况基本一致。该研究为土壤重金属污染监测和环境管理提供了重要的技术手段和科学依据。 展开更多
关键词 高光谱反演 高光谱遥感 GF-5 六价铬离子 土壤重金属 catboost回归模型
下载PDF
基于IGWO-CatBoost模型的岩石爆破块度预测
5
作者 宋家威 郇宝乾 +3 位作者 秦涛 张宇庭 王雪松 徐振洋 《爆破器材》 CAS CSCD 北大核心 2024年第2期56-64,共9页
针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优... 针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优能力。对公开数据库和现场采集的32组数据进行预测分析。首先,采用随机森林算法进行特征重要性筛选,利用IGWO对CatBoost进行参数寻优,建立IGWO-CatBoost爆破块度预测模型;然后,将预测结果与在相同条件下建立的CatBoost、XGBoost、LightGBM模型进行对比分析。经过IGWO调参,CatBoost模型的预测准确度得到有效提高,IGWO-CatBoost模型的预测准确度均优于其他3种预测模型。对比结果表明,IGWO-CatBoost模型具有很好的预测能力和适应性。 展开更多
关键词 改进灰狼算法 IGWO-catboost模型 随机森林 块度预测
下载PDF
基于CatBoost的空铁联运中转城市推荐研究
6
作者 白广栋 朱建军 +2 位作者 翁湦元 张鹏 刘仁全 《铁路计算机应用》 2024年第6期15-19,共5页
随着交通网络的快速发展,越来越多的旅客选择空铁联运出行,对空铁联运中转城市推荐方法提出了更高的要求。文章设计了符合空铁联运中转城市数据特点的数据不平衡处理方法,采用能够处理类别型特征的CatBoost算法构造基准模型,在2个不同... 随着交通网络的快速发展,越来越多的旅客选择空铁联运出行,对空铁联运中转城市推荐方法提出了更高的要求。文章设计了符合空铁联运中转城市数据特点的数据不平衡处理方法,采用能够处理类别型特征的CatBoost算法构造基准模型,在2个不同数据分布的测试集上对该模型进行评估,模型准确率均超过85%。通过与其他算法的对比分析,证明了该模型具有较好的稳定性和更优的性能,提高了空铁联运中转城市的推荐效果,可更好地满足旅客的出行需求;通过对特征贡献度的分析发现,下单人的姓名特征会对模型预测带来影响,从而进一步提高空铁联运中转城市的个性化推荐效果。 展开更多
关键词 空铁联运 中转城市推荐 机器学习 catboost模型 数据不平衡
下载PDF
基于CatBoost的新型电力系统两阶段轻量化暂稳智能评估方法
7
作者 兰宇田 姚伟 +2 位作者 张文栋 刘世超 仇玉强 《山东电力技术》 2024年第2期1-10,共10页
随着风能等新能源大规模并网,基于数据驱动的机器学习方法在新型电力系统暂态稳定评估(transient stability assessment,TSA)中表现出了极大的优势,但其存在模型可解释性不足、内部知识无法获取的问题。针对以上问题,文中基于能避免梯... 随着风能等新能源大规模并网,基于数据驱动的机器学习方法在新型电力系统暂态稳定评估(transient stability assessment,TSA)中表现出了极大的优势,但其存在模型可解释性不足、内部知识无法获取的问题。针对以上问题,文中基于能避免梯度偏差问题的CatBoost模型训练电力系统暂态稳定评估模型,设计粗判与精细两阶段评估结构有效提升模型精度;使用Tree-SHAP算法对模型进行事后解释,揭示模型决策的内在逻辑,并从中获取电力系统关键影响因素;最后基于关键影响因素重新训练两阶段智能评估模型,实现模型的轻量化。IEEE 39节点系统上的仿真结果表明,所提方法在保证模型维持较高性能的前提下,有效降低模型决策特征数目。 展开更多
关键词 catboost 新能源 暂稳评估 Tree-SHAP算法 可解释性 模型轻量化
下载PDF
基于集成学习CatBoost优化模型的爆堆大块率预测 被引量:1
8
作者 金长宇 于佳强 +1 位作者 王强 陈立军 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第12期1743-1750,共8页
爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法... 爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法进行模型二次调优,并对比调优实现后模型与随机森林法、XGBoost模型、LightGBM模型和CatBoost模型进行效果对比.结果表明,经过两轮调优后的CatBoost模型预测效果明显高于其他几种模型,R~2准确度可达98.83%,证明了两轮调优后CatBoost模型具有较高的预测水平,验证了该方法在大块率预测研究中的可行性,为爆破参数设计和大块率优化分析提供了可靠的参考. 展开更多
关键词 大块率预测 机器学习 集成学习 爆破 catboost模型
下载PDF
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 被引量:2
9
作者 刘爱琴 郭少鹏 张卓星 《国家图书馆学刊》 北大核心 2023年第5期84-92,共9页
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost... 互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。 展开更多
关键词 隐含狄利克雷分布(LDA) 文本自动分类 SVM算法 catboost算法
下载PDF
基于CatBoost的供水量组合预测模型探讨
10
作者 朱俊杰 叶文静 +1 位作者 曹萃文 顾幸生 《石油化工自动化》 CAS 2023年第5期10-14,共5页
如何合理安排水资源并减少水资源浪费是亟需解决的问题,精确预测供水量并为供水系统调度方案的制定提供必要的数据支持是目前重要研究方向之一。建立了一种基于CatBoost的城市供水量组合预测模型,该模型基于KNN算法对异常数据进行识别... 如何合理安排水资源并减少水资源浪费是亟需解决的问题,精确预测供水量并为供水系统调度方案的制定提供必要的数据支持是目前重要研究方向之一。建立了一种基于CatBoost的城市供水量组合预测模型,该模型基于KNN算法对异常数据进行识别和校正,从而减少异常数据对模型精度的影响;随后采用SVR,XGBoost,LightGBM和CatBoost模型预测供水量数据;为了融合各模型的优点并提高模型的预测精度,将各单一模型的预测结果作为输入特征,采用CatBoost模型进一步预测供水量数据并得到最终的供水量预测结果。仿真实验结果表明:所提出的基于CatBoost的组合预测模型具有更好的预测精度,验证了该模型在城市供水量预测问题中的有效性。 展开更多
关键词 供水量预测 KNN算法 异常数据识别 catboost模型
下载PDF
基于CatBoost的常用电器负载电弧故障识别方法 被引量:5
11
作者 金翠 刘洋 +3 位作者 李琦 赵墨林 莫显耀 王影 《电测与仪表》 北大核心 2023年第7期193-200,共8页
电气火灾造成的危害日益受到人们重视,其成因中占比最大的是电弧故障。电弧识别是一种重要的电弧故障预防性技术,可以监测电气设备中的电弧事故,以便及时采取应对措施,是智能用电的重要组成部分。文中就电弧故障识别方法展开研究,搭建... 电气火灾造成的危害日益受到人们重视,其成因中占比最大的是电弧故障。电弧识别是一种重要的电弧故障预防性技术,可以监测电气设备中的电弧事故,以便及时采取应对措施,是智能用电的重要组成部分。文中就电弧故障识别方法展开研究,搭建了实验平台,分析了不同家用电器负载组合的电弧特征,进行了特征提取;提出了一种基于CatBoost分类模型的电弧识别方法,使用CatBoost模型对提取到的特征进行训练,以实现电弧故障的快速识别;经过测试及验证,与现有的SVM、Random Forest等常用识别分类方法相比,提出的基于CatBoost分类模型的电弧识别方法具有更高的准确率和召回率,能够有效提高电弧事故的识别精度。 展开更多
关键词 电弧故障 catboost分类模型 电弧识别 召回率
下载PDF
基于CatBoost算法的SAP混凝土抗压强度预测 被引量:1
12
作者 李宁 杨镇华 +2 位作者 马伟中 李昊 王行行 《内蒙古公路与运输》 2023年第5期1-6,共6页
高吸水树脂(SAP)作为内养护材料主要是为了减缓混凝土早期收缩开裂,而不同的水胶比和内养护材料会在一定程度上对混凝土抗压强度预测产生影响。文章基于CatBoost机器学习回归算法,建立了SAP混凝土抗压强度智能预测模型,并与LightGBM算法... 高吸水树脂(SAP)作为内养护材料主要是为了减缓混凝土早期收缩开裂,而不同的水胶比和内养护材料会在一定程度上对混凝土抗压强度预测产生影响。文章基于CatBoost机器学习回归算法,建立了SAP混凝土抗压强度智能预测模型,并与LightGBM算法和XGBoost算法进行对比,利用水胶比、SAP掺量、预吸水倍数及养护龄期对抗压强度的影响,对模型预测效果进行了验证。研究结果表明:水胶比和养护龄期对混凝土抗压强度的贡献较大,而SAP掺量和预吸水倍数产生的影响较小;CatBoost模型与LightGBM模型和XGBoost模型相比,其三个评价指标(均方误差、均方根误差和决定系数)相对最优,决定系数(R^(2))为0.981,CatBoost模型具有更高的预测精度和稳定性。 展开更多
关键词 混凝土 高吸水树脂(SAP) catboost模型 抗压强度 预测模型
下载PDF
基于CatBoost和XGBoost组合模型的水深反演 被引量:1
13
作者 曾书玉 谢涛 孔瑞瑶 《海洋测绘》 CSCD 北大核心 2023年第3期59-63,共5页
为获取高精度的水深信息以满足海洋研究各领域的需要,提出一种CatBoost和XGBoost模型组合的水深反演模型。选取Sentinel-2A卫星遥感数据,以瓦胡岛为研究区域,引入CatBoost和XGBoost模型,对二者进行线性组合,构建CatBoost-XGBoost组合模... 为获取高精度的水深信息以满足海洋研究各领域的需要,提出一种CatBoost和XGBoost模型组合的水深反演模型。选取Sentinel-2A卫星遥感数据,以瓦胡岛为研究区域,引入CatBoost和XGBoost模型,对二者进行线性组合,构建CatBoost-XGBoost组合模型。实验结果表明:组合模型的决定系数、均方根误差、平均绝对误差以及平均相对误差分别为95.32%、1.29 m、0.86 m、20.51%,与单一模型相比,组合模型的水深反演精度有一定提高。 展开更多
关键词 海洋遥感 水深反演 组合模型 catboost模型 XGBoost模型
下载PDF
基于CatBoost机器学习模型的风电机组机舱温度异常预警研究 被引量:3
14
作者 张惠强 高娟娟 +3 位作者 任晓旭 陶永刚 赵禹茗 黄剑锋 《太阳能》 2023年第1期49-55,共7页
风电机组机舱内部的机械部件众多,以机舱温度为研究对象可以实现对风电机组故障的预警。首先提取风电机组正常运行状态下的机舱温度数据,综合Pearson相关系数和Spearman相关系数,以及轻型梯度增强学习器(LightGBM)和CatBoost算法的特征... 风电机组机舱内部的机械部件众多,以机舱温度为研究对象可以实现对风电机组故障的预警。首先提取风电机组正常运行状态下的机舱温度数据,综合Pearson相关系数和Spearman相关系数,以及轻型梯度增强学习器(LightGBM)和CatBoost算法的特征变量重要性,筛选出与机舱温度相关性较大的20个特征变量,作为风电机组机舱温度的特征变量集合;然后选择CatBoost、LightGBM、随机森林(Random Forest)3个算法分别建立模型,以均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、判定系数R2作为评价指标进行综合评价,最终选择评价指标最优的采用CatBoost算法建立的模型作为风电机组机舱温度异常预警模型,并采用实际的风电机组机舱温度异常的历史数据对模型的预警效果进行验证。该模型可在机舱温度预测值与真实值之间偏离程度较大时进行预警,专业检修人员可以根据模型输出的特征变量重要性排序,优先检修相关性较高的部件,实用性较强。 展开更多
关键词 风电机组 机舱温度 机器学习模型 catboost 故障预警
下载PDF
基于卷积神经网络与CatBoost的轴承故障诊断算法 被引量:2
15
作者 鲁夕瑶 张成彬 +2 位作者 皋军 徐燕萍 邵星 《机电工程》 CAS 北大核心 2023年第5期715-722,共8页
使用一般诊断算法对滚动轴承进行故障排查时,需要对数据进行特征提取,而在其特征提取过程中存在数据量庞大、手动提取和选择受限的问题,为此,提出了一种基于卷积神经网络(CNN)与CatBoost的混合分类模型(方法),以进行轴承的故障诊断。首... 使用一般诊断算法对滚动轴承进行故障排查时,需要对数据进行特征提取,而在其特征提取过程中存在数据量庞大、手动提取和选择受限的问题,为此,提出了一种基于卷积神经网络(CNN)与CatBoost的混合分类模型(方法),以进行轴承的故障诊断。首先,将预处理后的数据经过CNN提取的特征作为输入量,输入到该模型中,提取了训练后输出的模型参数;然后,使用CatBoost方法对滚动轴承数据集进行了分析,进一步研究了不同学习模型在同一数据集下对分类精度的影响;最后,通过降低过拟合的风险,运用4种相关系数指标进行了对比实验,研究了CNN-CatBoost混合分类模型对滚动轴承故障数据的分类效果。研究结果表明:基于CNN与CatBoost方法进行轴承故障诊断的平均准确率达到98%以上,该方法的有效性得到了验证;采用少量的数据训练样本即可达到较好的轴承故障数据分类效果,与单一深度学习模型和一些典型机器学习模型相比,该模型具有更好的性能。 展开更多
关键词 卷积神经网络 catboost算法 故障特征提取 故障分类精度 深度学习模型 训练时间
下载PDF
基于CatBoost算法的高炉铁水硫含量预测
16
作者 刘福龙 郝良元 +3 位作者 靳亚涛 刘二浩 邱洪涛 张永升 《河北冶金》 2023年第6期31-36,共6页
高炉铁水中的硫含量是描述铁水质量的一个重要指标。在出铁之前了解铁水中硫含量的高低,对于高炉实际生产具有重要作用,因此预测模型的建立非常必要。本文利用Catboost算法建立了高炉铁水硫含量的预测分析模型,采用国内某钢铁企业实际... 高炉铁水中的硫含量是描述铁水质量的一个重要指标。在出铁之前了解铁水中硫含量的高低,对于高炉实际生产具有重要作用,因此预测模型的建立非常必要。本文利用Catboost算法建立了高炉铁水硫含量的预测分析模型,采用国内某钢铁企业实际高炉生产数据进行学习和预测。运行结果表明,Catboost模型预测精度较高,计算时间较短,满足实际生产需求,同时模型的特征参量通过人工经验和相关性分析相结合的方法,相关关系结果与高炉冶炼理论基本吻合。测试结果表明,基于Catboost算法建立的高炉铁水硫含量预测模型在实际生产中能够起到很好的预测效果,对合理把控高炉铁水硫含量具有重要的参考意义。 展开更多
关键词 高炉 硫含量 catboost模型 相关性分析 特征工程
下载PDF
基于蜣螂优化-集成加权融合的NO_(x)浓度动态预测
17
作者 金秀章 畅晗 +1 位作者 赵大勇 赵术善 《计量学报》 CSCD 北大核心 2024年第4期600-608,共9页
针对SCR入口NO_(x)浓度单一预测模型无法满足在不同工况下保持预测精度的问题,提出了一种基于蜣螂优化(dung beetle optimizer,DBO)集成模型加权融合的预测SCR入口NO_(x)浓度的动态模型。首先使用CatBoost与LightGBM的混合模型在筛选辅... 针对SCR入口NO_(x)浓度单一预测模型无法满足在不同工况下保持预测精度的问题,提出了一种基于蜣螂优化(dung beetle optimizer,DBO)集成模型加权融合的预测SCR入口NO_(x)浓度的动态模型。首先使用CatBoost与LightGBM的混合模型在筛选辅助变量的同时,求取辅助变量的迟延时间和阶次信息,并根据以上信息确定预测模型的输入变量;然后建立由LightGBM,XGBoost与CatBoost组成的集成模型,并使用蜣螂优化算法对预测结果进行加权融合;最后将DBO-集成加权融合动态预测模型与3种单模型和蜣螂算法优化2种模型加权融合的预测模型进行对比。结果证明DBO综合加权融合动态预测模型的评价指标优于其他模型,具有更高的预测精度、实时性和适应性,能够更好地满足不同工况下的NO_(x)浓度预测要求。 展开更多
关键词 化学计量 NO_(x)排放预测 蜣螂优化算法 catboost LightGBM XGBoost 集成模型
下载PDF
考虑建成环境的交通事故严重程度致因交互效应研究
18
作者 王健宇 陈献天 +2 位作者 焦朋朋 覃楚亮 王泽昊 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期272-280,共9页
为探究考虑建成环境影响下各类因素对交通事故的作用机理,本文提出一种融合ADASYN(Adaptive Synthetic Sampling)平衡算法与CatBoost模型的方法,对沈阳市2015—2020年的道路交通事故进行研究,并解析事故致因的交互效应。首先,通过地理... 为探究考虑建成环境影响下各类因素对交通事故的作用机理,本文提出一种融合ADASYN(Adaptive Synthetic Sampling)平衡算法与CatBoost模型的方法,对沈阳市2015—2020年的道路交通事故进行研究,并解析事故致因的交互效应。首先,通过地理信息匹配的方法补充事故地点周围14项建成环境因子,构建多源数据集。其次,通过比较4种经典的机器学习模型,即CatBoost,Random Forest,XGBoost,LightGBM,并筛选出泛化能力最强的模型。随后,利用SHAP(Shapley Additive Explanation)归因方法对最优模型进行解释以揭示单个风险因素效应以及影响重要度排序。最后,基于单因素分析,探究建成环境与事故特征之间的交互效应。研究表明:相同的特征在单因素以及双因素交互分析中对事故影响机制存在差异。在单因素分析中,季节、交通方式这2项因素对致命事故具有显著的正向影响;而主干路密度、快速路密度、工业用地比例、现场形态、道路物理隔离这5项因素对致命事故有着显著的负向影响。在双因素交互分析中,高主路密度与秋冬季节交互以及低工业用地比例与春季交互等对致命事故具有正向影响;而高工业用地比例与行人交互则产生了负向影响。本文成果可为相关人员提供准确的影响交通事故严重程度的相关因素,为优化和建设城市交通系统提供一定的理论支撑。 展开更多
关键词 交通工程 事故严重程度分析 catboost模型 城市道路交通事故 建成环境 交互效应
下载PDF
基于CatBoost算法的P2P违约预测模型应用研究 被引量:12
19
作者 马晓君 宋嫣琦 +2 位作者 常百舒 袁铭忆 苏衡 《统计与信息论坛》 CSSCI 北大核心 2020年第7期9-17,共9页
在互联网金融背景下,智能算法的应用能够为经济领域提供新的思路和方向,有效推动中国互联网金融向“互联网+金融+智能”模式的转变。P2P网络借贷是通过P2P公司搭建的第三方互联网平台进行“个人对个人”的直接信贷。以人人贷平台为研究... 在互联网金融背景下,智能算法的应用能够为经济领域提供新的思路和方向,有效推动中国互联网金融向“互联网+金融+智能”模式的转变。P2P网络借贷是通过P2P公司搭建的第三方互联网平台进行“个人对个人”的直接信贷。以人人贷平台为研究对象,运用特征工程技术,将CatBoost算法应用于构建P2P违约预测模型,并对违约影响因素进行综合分析。结果表明,CatBoost算法的预测准确率达96%,对实际结果的拟合效果较好,并能够对模型出错所导致的损失成本进行有效控制。此外,综合分析违约影响因素发现,借款人的信用情况对借款人违约行为影响较大,其中还清贷款次数、逾期次数与成功借款次数应作为借款人信用评估的重要参考指标。结合本文的研究成果与中国P2P行业发展状况,本文建议P2P平台积极促进数据分析与测算分析技术的革新与应用,政府及相关部门形成政策法规的同步发展,促成从平台内部到外部环境的合力发展态势。 展开更多
关键词 P2P 违约预测模型 catboost算法 特征工程 影响因素
下载PDF
基于LSTM和CatBoost组合模型的短期负荷预测 被引量:13
20
作者 党存禄 杨海兰 武文成 《电气工程学报》 CSCD 2021年第3期62-69,共8页
针对现有的电力系统短期负荷预测方法存在预测精度较差的问题,提出一种基于长短期记忆神经网络(Long short term memory,LSTM)和CatBoost组合的短期负荷预测方法,针对电力负荷数据具有时序性和非线性的特点,以及长短期记忆网络不能直接... 针对现有的电力系统短期负荷预测方法存在预测精度较差的问题,提出一种基于长短期记忆神经网络(Long short term memory,LSTM)和CatBoost组合的短期负荷预测方法,针对电力负荷数据具有时序性和非线性的特点,以及长短期记忆网络不能直接处理类别型特征,对处理后的电力负荷数据建立LSTM负荷预测模型和CatBoost负荷预测模型;用方差倒数法确定加权系数,得到LSTM和CatBoost组合模型的预测值;最后使用实际负荷数据对算法有效性进行验证,预测结果表明采用LSTM和CatBoost组合模型的方法在负荷预测精度上有显著的提高。 展开更多
关键词 短期负荷预测 方差倒数法 LSTM catboost 组合模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部