期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
Gradient Boosting算法在典型浅埋煤层液压支架选型中的应用 被引量:4
1
作者 张杰 孙遥 +3 位作者 谢党虎 蔡维山 刘清洲 龙晶晶 《煤矿安全》 CAS 北大核心 2020年第7期166-170,175,共6页
针对目前工作面液压支架阻力确定方法的不足,提出了1种新的预测方法,采用改进后的逻辑斯提算法(LR)来优化梯度提升回归(GBRT)模型,以此来预测液压支架阻力。在GBRT中加入学习速率来限制子模型的学习速率,防止其过拟合;应用LR对样本参数... 针对目前工作面液压支架阻力确定方法的不足,提出了1种新的预测方法,采用改进后的逻辑斯提算法(LR)来优化梯度提升回归(GBRT)模型,以此来预测液压支架阻力。在GBRT中加入学习速率来限制子模型的学习速率,防止其过拟合;应用LR对样本参数进行优化,建立LR-GBRT回归预测模型;将该预测模型应用于液压支架阻力的预测,预测结果与LR(线性回归模型)、SVM(支持向量机模型)、DTR(决策树回归模型)、EN(弹性网回归模型)进行对比分析。结果表明:LR-GBRT模型具有较强的泛化能力,较高的预测精度,可以对液压支架阻力进行有效预测。 展开更多
关键词 梯度提升回归算法 逻辑斯谛算法 工作面液压支架阻力 预测 学习速率
下载PDF
Predictive-Analysis-based Machine Learning Model for Fraud Detection with Boosting Classifiers
2
作者 M.Valavan S.Rita 《Computer Systems Science & Engineering》 SCIE EI 2023年第4期231-245,共15页
Fraud detection for credit/debit card,loan defaulters and similar types is achievable with the assistance of Machine Learning(ML)algorithms as they are well capable of learning from previous fraud trends or historical... Fraud detection for credit/debit card,loan defaulters and similar types is achievable with the assistance of Machine Learning(ML)algorithms as they are well capable of learning from previous fraud trends or historical data and spot them in current or future transactions.Fraudulent cases are scant in the comparison of non-fraudulent observations,almost in all the datasets.In such cases detecting fraudulent transaction are quite difficult.The most effective way to prevent loan default is to identify non-performing loans as soon as possible.Machine learning algorithms are coming into sight as adept at handling such data with enough computing influence.In this paper,the rendering of different machine learning algorithms such as Decision Tree,Random Forest,linear regression,and Gradient Boosting method are compared for detection and prediction of fraud cases using loan fraudulent manifestations.Further model accuracy metric have been performed with confusion matrix and calculation of accuracy,precision,recall and F-1 score along with Receiver Operating Characteristic(ROC)curves. 展开更多
关键词 Random forest decision tree logistic regression machine Learning gradient boosting method confusion matrix
下载PDF
进港航班滑入时间预测
3
作者 唐小卫 丁叶 +2 位作者 张生润 任思豫 吴佳琦 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第7期2218-2224,共7页
准确预测进港航班滑入时间对合理调配航班保障资源和提高机场场面运行效率具有重要意义,可有效克服各大机场粗放式预测航班进港时刻的不足,为此提出一种基于机器学习模型的滑入时间预测方法。以首都机场为具体研究对象,分析进港航班滑... 准确预测进港航班滑入时间对合理调配航班保障资源和提高机场场面运行效率具有重要意义,可有效克服各大机场粗放式预测航班进港时刻的不足,为此提出一种基于机器学习模型的滑入时间预测方法。以首都机场为具体研究对象,分析进港航班滑入时间的影响因素并构建特征集;将线性回归、K-最近邻、支持向量机、决策树、随机森林和梯度提升回归树6种在滑出时间预测方面得到广泛应用的机器学习模型用于进港航班滑入时间预测。研究结果表明:在误差范围±3 min内6种机器学习模型的预测精度均超过90%,表明特征集的构建和模型的选择是有效的;综合预测性能与模型拟合评估结果,梯度提升回归树模型的预测效果最好;在梯度提升回归树模型上场面流量特征的贡献度最大,新引入的跨区特征对预测模型的贡献度超过了大部分传统特征。 展开更多
关键词 航空运输 机场场面运行 滑行时间预测 机器学习 梯度提升回归树
下载PDF
土地利用与城市轨道交通客流的非线性关系
4
作者 魏丽英 石晶晶 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期43-51,共9页
城市轨道交通站点影响范围内土地利用对客流影响具有时空分异特征且存在类型差异,为针对性探讨不同站点两者的复杂非线性关系,提出一种基于土地利用空间分布规律、对站点实际影响范围进行差异化识别的方法;并通过分时段多尺度地理加权回... 城市轨道交通站点影响范围内土地利用对客流影响具有时空分异特征且存在类型差异,为针对性探讨不同站点两者的复杂非线性关系,提出一种基于土地利用空间分布规律、对站点实际影响范围进行差异化识别的方法;并通过分时段多尺度地理加权回归,获取能够表征土地利用对客流影响时空变化特征的站点聚类指标,采用K-means++算法将研究区域内的站点划分为4类;进而基于改进的梯度提升决策树模型分类定量探讨不同类别下土地利用与轨道交通客流的复杂非线性关系。研究表明:通过捕捉不同站点土地利用与客流的时空分异特征对站点进行分类识别,可有效提升两者非线性关系模型的解释度。根据模型输出结果,发现不同类别站点影响轨道交通客流的关键土地利用要素不同,第1类中关键变量为相对重要性分别为61.35%和30.08%的公交站点数量和慢行密度;第4类的情况类似但相对数值有所变化,公交站点数量的相对重要性由61.35%下降至30.31%;建筑密度在第2类中以66.57%的相对重要度占据最大比例;但在第3类中仅占5.59%。此外,不同类别站点影响范围内土地利用与轨道交通客流的关系存在较为显著且各异的阈值效应。研究表明,对于不同类别站点的用地开发应各有侧重,且应结合实际将土地利用设计指标控制在相应的合理范围内。研究为差异化的站点周边土地利用开发策略的制定提供了理论支持和量化指导。 展开更多
关键词 多尺度地理加权回归 土地利用 空间差异性 阈值效应 梯度提升决策树 轨道交通客流
下载PDF
基于集成学习的交通事故严重程度预测研究与应用 被引量:1
5
作者 单永航 张希 +2 位作者 胡川 丁涛军 姚远 《计算机工程》 CAS CSCD 北大核心 2024年第2期33-42,共10页
目前自动驾驶技术重点是关注如何主动避免碰撞,然而在面对其他交通参与者入侵而导致不可避免的碰撞事故场景时,预测车辆在不同行驶模式下的碰撞严重程度来降低事故严重程度的研究却很少。为此,提出一种双层Stacking事故严重程度预测模... 目前自动驾驶技术重点是关注如何主动避免碰撞,然而在面对其他交通参与者入侵而导致不可避免的碰撞事故场景时,预测车辆在不同行驶模式下的碰撞严重程度来降低事故严重程度的研究却很少。为此,提出一种双层Stacking事故严重程度预测模型。基于真实交通事故数据集NASS-CDS完成训练,模型输入为车辆传感器可感知得到的事故相关特征,输出为车内乘员最高受伤级别。在第1层中,通过实验对不同学习器组合进行训练,最终综合考虑预测性能以及耗时挑选K近邻、自适应提升树、极度梯度提升树作为基学习器;在第2层中,为降低过拟合,采用逻辑回归作为元学习器。实验结果表明,该方法准确率达到85.01%,在精确率、召回率和F1值方面优于其他个体模型和集成模型,该预测结果可作为智能车辆决策规划模块先验信息,帮助车辆做出正确的决策,减缓事故损害。最后阐述了模型在L_(2)辅助驾驶与L_(4)自动驾驶车辆中的应用,在常规车辆安全防护的基础上进一步提升车辆的安全性。 展开更多
关键词 交通安全 交通事故严重程度预测 智能车辆 集成学习 K近邻 自适应提升树 极度梯度提升树 逻辑回归
下载PDF
青藏高原草地地上生物量估算
6
作者 姚雨微 任鸿瑞 《生态学报》 CAS CSCD 北大核心 2024年第7期3049-3059,共11页
及时准确评估草地产草量对草地资源的科学管理和可持续发展具有重要意义。青藏高原自然环境特殊,气候差异显著,地形复杂,仅依靠遥感信息准确监测草地地上生物量(Aboveground Biomass,AGB)变化有较大限制。基于青藏高原草地AGB野外实测... 及时准确评估草地产草量对草地资源的科学管理和可持续发展具有重要意义。青藏高原自然环境特殊,气候差异显著,地形复杂,仅依靠遥感信息准确监测草地地上生物量(Aboveground Biomass,AGB)变化有较大限制。基于青藏高原草地AGB野外实测数据与Landsat遥感影像,探索了植被指数表征草地AGB信息的有效性,评估了气象和地形信息对准确估算草地AGB的影响,综合利用气象、地形和遥感信息,在新一代地球科学数据和分析应用平台(Google Earth Engine)上构建了梯度增强回归树草地AGB估算模型,绘制了青藏高原多年草地AGB空间分布图。结果表明:(1)基于单因素遥感因子的线性回归模型仅能解释8%—40%的草地AGB变化情况,其中绿色归一化植被指数(Green Normalized Difference Vegetation Index,GNDVI)对草地AGB解释能力较强(40%)。(2)基于遥感因子构建的梯度增强回归树模型测试集R~2为0.57。分别添加气象、地形信息,模型对草地AGB的估测准确性有所提升,测试R~2为0.62和0.63。(3)基于气象、地形和遥感因子的多因素估测模型能够提高草地AGB估测精度,经递归特征消除法优选后,基于13个特征变量的梯度增强回归树模型拟合效果最好(训练数据集R~2=0.79,RMSE=43.42 g/m^(2),P<0.01;测试数据集R~2=0.66,RMSE=53.64 g/m^(2),P<0.01),可以解释66%草地AGB变化情况。(4)2010年青藏高原平均AGB为94.58 g/m^(2),2015年93.63 g/m^(2),2020年100.78 g/m^(2)。青藏高原西北部草地AGB较低,东南部草地AGB较高,整体呈现自西北向东南逐渐增加的分布格局。研究结果为准确估算青藏高原草地产草量和碳储量等研究提供重要参考。 展开更多
关键词 青藏高原 草地地上生物量 梯度增强回归树 遥感
下载PDF
双参数Tweedie机器学习模型及其精算应用
7
作者 高雅倩 孟生旺 《统计研究》 北大核心 2024年第4期126-140,共15页
Tweedie回归是保险损失预测和风险定价的主要工具之一。为充分利用大数据、物联网、机器学习等技术促进保险业的数字化转型,实现更加精准的风险识别和风险定价,本文将传统的Tweedie广义线性模型推广到双参数形式,并结合机器学习算法,提... Tweedie回归是保险损失预测和风险定价的主要工具之一。为充分利用大数据、物联网、机器学习等技术促进保险业的数字化转型,实现更加精准的风险识别和风险定价,本文将传统的Tweedie广义线性模型推广到双参数形式,并结合机器学习算法,提出双参数Tweedie梯度提升树模型和双参数Tweedie组合神经网络模型。基于我国一家保险公司的车联网大数据,提取了新的驾驶行为风险因子。通过实证研究检验了双参数Tweedie梯度提升树和双参数Tweedie组合神经网络在风险识别以及风险定价中的有效性,为促进我国保险业数字化转型提供了一种新的模型和方法。 展开更多
关键词 Tweedie回归 双参数梯度提升树 双参数组合神经网络 驾驶行为因子
下载PDF
低覆盖草地叶面积指数遥感估算方法
8
作者 张云峰 任鸿瑞 《草业科学》 CAS CSCD 北大核心 2024年第3期588-598,共11页
有效估算低覆盖草地叶面积指数(LAI),对监测低覆盖草地生长状况、优化完善草地管理具有重要意义。以往针对草地叶面积指数的研究大多集中于中高覆盖度草地,对低覆盖草地的研究相对较少。利用谷歌地球引擎(GEE),基于Landsat-8卫星数据提... 有效估算低覆盖草地叶面积指数(LAI),对监测低覆盖草地生长状况、优化完善草地管理具有重要意义。以往针对草地叶面积指数的研究大多集中于中高覆盖度草地,对低覆盖草地的研究相对较少。利用谷歌地球引擎(GEE),基于Landsat-8卫星数据提取所需特征变量,通过特征变量与叶面积指数的相关性及其在模型中的重要性进行特征优选,确定模型最佳变量个数,以此构建机器学习模型,探寻适合在低覆盖区草地估算叶面积指数的方法。结果显示,基于相关性特征优选的梯度提升回归树模型(r-GBRT)在低覆盖草地估算叶面积指数的效果较好,测试集的R 2为0.686,均方根误差(RMSE)为0.101。结果表明,基于特征优选构建的机器学习模型在低覆盖条件下估算草地叶面积指数方面具有较好的应用价值。 展开更多
关键词 叶面积指数 低覆盖草地 机器学习 特征优选 随机森林 梯度提升回归树 遥感
下载PDF
基于梯度提升回归树算法的煤炭发热量计算
9
作者 万国祥 《能源科技》 2024年第3期85-89,共5页
煤炭发热量是衡量煤质的关键指标,反映了煤炭充分燃烧时释放的能量。煤炭发热量可通过实验测定和计算途径获取,其中实验方法虽精确却复杂昂贵耗时。在实际应用中,通过多元线性回归估算得出发热量数据,但是这种方法计算的结果准确率较低... 煤炭发热量是衡量煤质的关键指标,反映了煤炭充分燃烧时释放的能量。煤炭发热量可通过实验测定和计算途径获取,其中实验方法虽精确却复杂昂贵耗时。在实际应用中,通过多元线性回归估算得出发热量数据,但是这种方法计算的结果准确率较低。鉴于此,提出了一种基于梯度提升回归树(GBRT)的煤炭发热量计算方法,该方法是一种机器学习回归分析方法,能够有效克服多元线性回归模型在处理非线性数据时的局限性。在国际公认的COALQUAL煤质数据库上对提出的模型进行了验证和对比,结果显示:GBRT模型的预测误差(MAE、MSE、RMSE)均小于多元线性回归模型;拟合优度(R2=0.989)大于多元线性回归模型(R2=0.970)。说明GBRT是一种高效、准确的煤炭发热量预测模型,对于煤质评价具有一定的实际意义。 展开更多
关键词 煤炭发热量 梯度提升回归树 回归分析 预测
下载PDF
内蒙古退耕还林工程区林冠覆盖率卫星遥感监测
10
作者 格根塔娜 王天璨 +2 位作者 王建和 沈通 月亮高可 《测绘通报》 CSCD 北大核心 2024年第6期139-145,共7页
内蒙古新一轮退耕还林还草工程于2015年启动,是内蒙古生态环境建设恢复的重大举措。本文利用2022年生长季Sentinel-2A影像及地形数据,结合实地测量数据,基于GEE平台采用梯度提升树回归模型(GBRT),对内蒙古新一轮退耕还林工程区林冠覆盖... 内蒙古新一轮退耕还林还草工程于2015年启动,是内蒙古生态环境建设恢复的重大举措。本文利用2022年生长季Sentinel-2A影像及地形数据,结合实地测量数据,基于GEE平台采用梯度提升树回归模型(GBRT),对内蒙古新一轮退耕还林工程区林冠覆盖率进行反演分析。结果表明,模型验证决定系数(R^(2))为0.87,均方根误差(RMSE)为0.079,平均绝对误差(MAE)为0.062。内蒙古新一轮退耕还林工程区林冠覆盖率均值为0.147,其分布存在明显的空间差异,受植被配置类型、种植年份和地理环境等因素影响,总体从西向东逐渐递增。利用Sentinel-2A影像和地形数据可以有效地估测退耕还林工程区林冠覆盖率,对低林冠覆盖率区域的反演提供参考。 展开更多
关键词 退耕还林 林冠覆盖率 梯度提升树 内蒙古
下载PDF
GTB-PPI:Predict Protein-protein Interactions Based on L1-regularized Logistic Regression and Gradient Tree Boosting 被引量:2
11
作者 Bin Yu Cheng Chen +2 位作者 Hongyan Zhou Bingqiang Liu Qin Ma 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2020年第5期582-592,共11页
Protein-protein interactions(PPIs)are of great importance to understand genetic mechanisms,delineate disease pathogenesis,and guide drug design.With the increase of PPI data and development of machine learning technol... Protein-protein interactions(PPIs)are of great importance to understand genetic mechanisms,delineate disease pathogenesis,and guide drug design.With the increase of PPI data and development of machine learning technologies,prediction and identification of PPIs have become a research hotspot in proteomics.In this study,we propose a new prediction pipeline for PPIs based on gradient tree boosting(GTB).First,the initial feature vector is extracted by fusing pseudo amino acid composition(Pse AAC),pseudo position-specific scoring matrix(Pse PSSM),reduced sequence and index-vectors(RSIV),and autocorrelation descriptor(AD).Second,to remove redundancy and noise,we employ L1-regularized logistic regression(L1-RLR)to select an optimal feature subset.Finally,GTB-PPI model is constructed.Five-fold cross-validation showed that GTB-PPI achieved the accuracies of 95.15% and 90.47% on Saccharomyces cerevisiae and Helicobacter pylori datasets,respectively.In addition,GTB-PPI could be applied to predict the independent test datasets for Caenorhabditis elegans,Escherichia coli,Homo sapiens,and Mus musculus,the one-core PPI network for CD9,and the crossover PPI network for the Wnt-related signaling pathways.The results show that GTB-PPI can significantly improve accuracy of PPI prediction.The code and datasets of GTB-PPI can be downloaded from https://github.com/QUST-AIBBDRC/GTB-PPI/. 展开更多
关键词 Protein-protein interaction Feature fusion L1-regularized logistic regression gradient tree boosting Machine learning
原文传递
基于GBRT模型的湖南县域农村居民点整治潜力预测 被引量:2
12
作者 赵翔 蔡博诚 +2 位作者 王静 罗海凤 陈松林 《农业工程学报》 EI CAS CSCD 北大核心 2023年第3期198-207,F0003,共11页
针对现有农村居民点整治潜力预测研究存在的评价方法主观性强、预测结果可靠性缺乏事实证据支持等问题,该研究利用土地利用时空数据和梯度提升回归树(gradient boosted regression trees,GBRT)方法构建农村居民点整治潜力预测模型,自动... 针对现有农村居民点整治潜力预测研究存在的评价方法主观性强、预测结果可靠性缺乏事实证据支持等问题,该研究利用土地利用时空数据和梯度提升回归树(gradient boosted regression trees,GBRT)方法构建农村居民点整治潜力预测模型,自动识别区域自然和社会经济多因素综合作用下的农村居民点整治潜力释放规律,并以湖南省为案例区开展了实证研究。精度验证结果表明,模型的回归预测R2为0.9765,平均绝对百分比误差为11.64%,预测精度总体能满足规划决策支持的需要。根据模型预测:(1)2020-2035年,湖南省农村居民点复垦整治潜力总规模约为36050.26 hm^(2),占2020年现状农村建设用地规模的4.58%,且预测结果与湖南省各县域单元历史整治潜力释放特征基本相符,表明预测结果具有较好的可行性。(2)湖南省潜力规模较大的区域主要分布在地形平缓、交通便利、城镇化水平较高的“长株潭”地区、环洞庭湖地区和湘中盆地地区,而湘南和湘西地区则相对较小。总体上模型预测结果具有较强的可行性,研究结果将为省级尺度统筹推进全域土地综合整治、农村存量建设用地挖潜和国土空间规划提供更加准确、可靠的决策依据。 展开更多
关键词 整治 潜力 农村居民点 梯度提升回归树 土地整治 湖南省
下载PDF
基于GBDT-LR和信息量模型耦合的滑坡易发性评价
13
作者 董张玉 张晋 +3 位作者 彭鹏 王燕 杨智 安森 《水土保持通报》 CSCD 北大核心 2023年第1期149-157,166,共10页
[目的]探索准确、快速的滑坡易发性区划方法,为区域安全监测提供参考,为政府治理滑坡灾害提供科学依据。[方法]以安徽省池州市贵池区为研究区域,采用梯度提升决策树—逻辑回归(GBDT-LR)和信息量(I)模型耦合的方法,实现区域滑坡易发性评... [目的]探索准确、快速的滑坡易发性区划方法,为区域安全监测提供参考,为政府治理滑坡灾害提供科学依据。[方法]以安徽省池州市贵池区为研究区域,采用梯度提升决策树—逻辑回归(GBDT-LR)和信息量(I)模型耦合的方法,实现区域滑坡易发性评价。该方法通过对原样本地学习,组合产生新的模拟样本,从而增强易发性评价模型对滑坡的拟合能力;采用Borderline-Smote算法解决样本数据不对称的问题。选用r.slopeunits软件划分的斜坡单元作为最小评价单元,选取坡度、坡向、地形曲率、剖面曲率、平面曲率、地形湿度指数(TWI)、地形起伏度、归一化植被指数(NDVI)、距断裂距离和距水系距离总计10个评价因子。分别从频率比、滑坡灾害点及隐患点密度、ROC曲线3个方面对构建的滑坡易发性模型进行评价。[结果]试验结果表明:耦合模型I-GBDT-LR分别比I,LR,I-LR模型的高易发区频率比所占比例提升约10%,13%,7%,高易发区滑坡灾害点及隐患点密度分别提升约9,11,7,ROC精度提升约10%,9%,5%。[结论]从检验指标综合来看,耦合模型的精度均高于单一模型,所提出耦合模型精度又高于I-LR耦合模型,为滑坡易发性评价提供了一种有效的、新型的评价方法。 展开更多
关键词 滑坡易发性 信息量 逻辑回归 GBDT-LR 安徽省池州市
下载PDF
基于梯度提升回归树的有机污染物生物-沉积物积累因子预测模型
14
作者 王如冰 蔡喜运 《生态毒理学报》 CAS CSCD 北大核心 2023年第4期22-33,共12页
生物-沉积物积累因子(BSAF)是评价底栖无脊椎生物对有机污染物生物积累能力的重要参数,是由化合物、底栖环境与无脊椎生物之间的三相作用决定的。现有模型通常采用线性算法研究化合物BSAF与化合物理化性质的关系,忽略了由于环境-生物-... 生物-沉积物积累因子(BSAF)是评价底栖无脊椎生物对有机污染物生物积累能力的重要参数,是由化合物、底栖环境与无脊椎生物之间的三相作用决定的。现有模型通常采用线性算法研究化合物BSAF与化合物理化性质的关系,忽略了由于环境-生物-化合物相互作用引发的非线性影响,导致线性模型拟合和预测能力有限。本研究基于理化性质(PCP)和分子指纹(ECFP)描述化合物特征,结合环境样点和生物特征,采用梯度提升回归树(GBRT)的非线性算法,分别构建了底栖生物体内积累因子的GBRT-PCP和GBRT-ECFP预测模型,并与利用岭回归算法构建的线性模型进行比较。结果表明,GBRT模型训练集决定系数(R 2)均为0.97,验证集R 2为0.82~0.83,表明GBRT模型的拟合优度和预测能力显著优于岭回归模型(训练集和验证集R 2分别为0.38~0.56和0.38~0.52)。沉积物有机碳含量对生物-沉积物积累因子的影响呈波动下降趋势,脂质含量呈先波动上升而后下降趋势。GBRT-PCP模型结果表明,化合物疏水性(log K_(OW))对生物积累影响呈先平稳后上升而后下降趋势,吸附性(log K_(OC))对生物积累呈波动下降趋势。总体上,具有中等log K_(OW)(6.8~8.2)和中等log K_(OC)(4.4~5.2)的化合物易于积累在生物组织。GBRT-ECFP模型阐明了稠环、芳香环、醚键、C—Br键、联苯键等结构是影响生物积累的关键子结构,该模型基于分子指纹结构可实现对化学品生物积累的高通量预测。本研究建立的模型为化学品生态风险评价和管理决策制定提供理论依据和方法参考。 展开更多
关键词 有机污染物 底栖无脊椎生物 生物-沉积物积累因子 梯度提升回归树
下载PDF
基于机器学习的钠离子电池剩余使用寿命预测
15
作者 史永胜 翟欣然 胡玙珺 《华南师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期17-24,共8页
钠离子电池容量退化具有非线性和复杂性,准确预测剩余使用寿命(RUL)十分困难,因此构建SSA优化算法结合梯度提升回归树(GBRT)的RUL预测模型。对实验数据进行滤波平滑处理,绘制容量增量(IC)曲线,从IC曲线中提取与容量衰减相关性高的健康指... 钠离子电池容量退化具有非线性和复杂性,准确预测剩余使用寿命(RUL)十分困难,因此构建SSA优化算法结合梯度提升回归树(GBRT)的RUL预测模型。对实验数据进行滤波平滑处理,绘制容量增量(IC)曲线,从IC曲线中提取与容量衰减相关性高的健康指标(HI),即IC峰值、峰值对应的电压值、峰值面积以及峰值斜率。利用PCA算法对数据进行降维处理以减少数据间的冗余性,将处理后的数据输入GBRT模型,并采用SSA算法寻找最优超参数提高预测精度。利用多组老化实验数据进行验证,RMSE、MAPE和MAE分别在15.2、7%、11.2以下,结果表明该模型有较高的预测精度及稳健性且优于其他主流算法。 展开更多
关键词 钠离子电池 剩余使用寿命 增量容量曲线 梯度提升回归树
下载PDF
新冠疫情及建成环境对公交客流量的影响模型 被引量:3
16
作者 傅志妍 高于越 +1 位作者 陈坚 陈琦 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第1期207-215,共9页
为揭示新冠疫情背景下公交客流量变化的空间影响因素,以疫情前后公交站点层面客流变化量为因变量,以建成环境、病毒感染情况及病毒传播途径等指标为自变量,构建新冠疫情与建成环境对公交客流量共同影响的线性回归(Ordinary Least Square... 为揭示新冠疫情背景下公交客流量变化的空间影响因素,以疫情前后公交站点层面客流变化量为因变量,以建成环境、病毒感染情况及病毒传播途径等指标为自变量,构建新冠疫情与建成环境对公交客流量共同影响的线性回归(Ordinary Least Squares,OLS)模型与梯度提升回归树(Gradient Boosting Regression Trees,GBRT)模型。以广州市为实证对象,基于公交IC卡数据、兴趣点数据(Point of Interest,POI)及道路网络数据等多源异构数据进行模型实证分析。结果表明:考虑非线性效应的GBRT模型比OLS模型具有更好的拟合度;同时,常规公交站点的公交线路数量(22.02%)和到市中心距离(13.56%)是影响疫情背景下公交客流量变化的最重要因素,片区病毒感染与传播情况对疫情防控常态化时期的公交客流量作用有限,居民日常公交出行已经从疫情的影响下逐渐恢复。 展开更多
关键词 城市交通 非线性效应 梯度提升回归树 公交客流 新冠疫情
下载PDF
基于XGBoost扩展金融因子的风电功率预测方法 被引量:4
17
作者 王永生 关世杰 +3 位作者 刘利民 高静 许志伟 刘广文 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第5期1038-1049,共12页
现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序... 现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序数据衍生金融因子的预测模型.采用具有较高预测准确率与较快训练速度的XGBoost算法进行预测,使得预测模型快速收敛.在中国内蒙古某风电场的风电功率数据集与德国Tennet公司风电功率数据集上进行实验验证.实验结果表明,以R2score为例,所提方法与基准方法相比提升约14.71%.所提方法中的建模与预测合计时间不超过500 ms. 展开更多
关键词 风力发电 超短期风电功率预测 梯度提升回归树 XGBoost 金融因子
下载PDF
基于机器学习的多模型耦合径流预报研究 被引量:1
18
作者 祝宾皓 周建中 +1 位作者 方威 张勇传 《中国农村水利水电》 北大核心 2023年第5期119-123,128,共6页
为具体考虑各水文模型适用条件、灵活利用模型预报特征对研究流域进行高精度耦合径流预报,将雅砻江流域雅江~吉居区间作为研究对象,以提升径流预报精度和稳定性为首要目的,构建涵盖新安江模型、水箱模型和TOPMODEL模型的多模型径流预报... 为具体考虑各水文模型适用条件、灵活利用模型预报特征对研究流域进行高精度耦合径流预报,将雅砻江流域雅江~吉居区间作为研究对象,以提升径流预报精度和稳定性为首要目的,构建涵盖新安江模型、水箱模型和TOPMODEL模型的多模型径流预报方法库,引入最小二乘法、岭回归法和极端梯度提升树法耦合各模型进行水文预报,并提出多评价指标体系对各耦合方法的预测性能进行对比分析。结论表明,极端梯度提升树法相较于其余两种方法有稳定的预测性能和强大的泛化能力,为该流域其他区间的预报工作提供了新的思路。 展开更多
关键词 多模型预报 水文预报 极端梯度提升树 岭回归
下载PDF
基于回归近邻成分分析和GBRT的室内定位方法
19
作者 王斌涛 冷腾飞 +1 位作者 王益涵 郑家骅 《传感器与微系统》 CSCD 北大核心 2023年第11期66-69,共4页
WiFi指纹定位方法性能易受到室内无线信号波动的影响使得离线指纹存在冗余噪声而导致定位精度不足。对此,本文提出一种改进近邻成分分析(NCA)结合渐近梯度回归树(GBRT)室内定位方法。首先,构造连续可微的目标函数将离散优化问题转化为... WiFi指纹定位方法性能易受到室内无线信号波动的影响使得离线指纹存在冗余噪声而导致定位精度不足。对此,本文提出一种改进近邻成分分析(NCA)结合渐近梯度回归树(GBRT)室内定位方法。首先,构造连续可微的目标函数将离散优化问题转化为连续优化问题,并对离线指纹数据库进行特征提取去除冗余得到离线指纹的主要特征;然后,利用提取特征后的位置指纹数据和特征对应的坐标迭代构造多个CART TREE,利用每个CART TREE损失函数的负梯度值构造集成多个CART TREE得到GBRT定位模型;最后,利用待定位点位置指纹信号特征结合GBRT定位模型预测待定位点位置。实验结果表明:所提出算法相较于其他同类算法误差分别减少14.7%,22.4%,37.1%,能够有效提高定位精度。 展开更多
关键词 室内定位 冗余噪声 近邻成分分析 位置指纹 渐进梯度回归树
下载PDF
基于Landsat的香格里拉市高山松地上生物量动态研究
20
作者 罗利彬 张加龙 《林业调查规划》 2023年第6期7-12,共6页
采用不同时期的Landsat5 TM卫星遥感影像数据和1987—2007年5期云南省香格里拉市森林资源连续清查样地调查数据,通过数据筛选,应用随机森林算法(RF)、梯度提升回归树算法(GBRT)等相关性分析模型,估测1987—2007年间云南省香格里拉市高... 采用不同时期的Landsat5 TM卫星遥感影像数据和1987—2007年5期云南省香格里拉市森林资源连续清查样地调查数据,通过数据筛选,应用随机森林算法(RF)、梯度提升回归树算法(GBRT)等相关性分析模型,估测1987—2007年间云南省香格里拉市高山松地上生物量动态变化规律。结果表明,GBRT算法的估测模型效果最好,决定系数R^(2)为0.99,预估精度P为70.07%;RF算法次之,决定系数R^(2)为0.89,预估精度P为66.10%。1987—2007年的20年间,香格里拉高山松地上生物量总量经历了先减又增的过程,1987、1992、1997、2002、2007年地上生物量分别为1023.29、1022.38、1011.73、1018.02、1019.33万t。但截至2007年,高山松地上生物量仍然未恢复到1987年水平。结合20年的林业发展过程,对高山松地上生物量动态变化原因进行简要分析,对后续研究提出了建议。 展开更多
关键词 高山松 地上生物量 动态变化 梯度提升回归树算法(GBRT) 香格里拉市
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部