期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
应用机器学习算法模型预测兴安落叶松地上生物量 被引量:2
1
作者 沐钊颖 张兹鹏 +1 位作者 张浩 姜立春 《东北林业大学学报》 CAS CSCD 北大核心 2024年第3期41-47,共7页
为了准确预测兴安落叶松地上生物量,以小兴安岭201株兴安落叶松地上生物量作为研究对象,以胸径(D)和树高(H)为变量,构建随机森林(RF)、人工神经网络(ANN)、支持向量回归(SVR)和梯度提升回归树(GBRT)等4种机器学习模型,并将机器学习算法... 为了准确预测兴安落叶松地上生物量,以小兴安岭201株兴安落叶松地上生物量作为研究对象,以胸径(D)和树高(H)为变量,构建随机森林(RF)、人工神经网络(ANN)、支持向量回归(SVR)和梯度提升回归树(GBRT)等4种机器学习模型,并将机器学习算法的预测结果与传统二元生物量模型的预测结果进行对比分析。结果表明:对比传统生物量模型,4种机器学习算法的拟合效果与检验精度均有了大幅度提高。模型拟合精度由高到低的顺序为随机森林、梯度提升回归树、人工神经网络、支持向量回归、传统生物量模型;RF模型在各模型中的拟合精度最高,相对于传统生物量模型,RF模型的确定系数(R~2)提升了3.72%,均方根误差(R_(MSE))降低了44.47%,平均绝对误差(M_(AE))降低了42.81%,相对误差绝对值(M_(PB))降低了42.80%,赤池信息准则值降低了18.17%。模型检验精度由高到低的顺序为随机森林、人工神经网络、梯度提升回归树、支持向量回归、传统生物量模型;RF模型在各模型中的预测精度最高,与传统生物量模型相比,RF模型的确定系数(R~2)提升了1.08%,均方根误差(R_(MSE))降低了10.95%,平均绝对误差(M_(AE))降低了10.34%,相对误差绝对值(M_(PB))降低了10.34%,赤池信息准则值降低了5.20%。因此,相对于传统生物量模型,4种机器学习算法模型均可以提高兴安落叶松地上生物量的预测精度,RF模型的预测精度最高。 展开更多
关键词 兴安落叶松 地上生物量 随机森林 人工神经网络 支持向量回归 梯度提升回归树
下载PDF
基于多特征融合的细胞特异性lncRNA的亚细胞定位预测 被引量:1
2
作者 杨佳宏 陈颖丽 +1 位作者 盖智敏 刘姝含 《内蒙古大学学报(自然科学版)》 CAS 2024年第2期173-182,共10页
长链非编码RNA(long non-coding RNA,lncRNA)在细胞生物学过程和疾病发展中扮演着关键性角色。由于lncRNA的亚细胞定位和其生物学功能密切相关,因此确定lncRNA的亚细胞定位具有重要意义。目前已有一些基于机器学习的方法来识别lncRNA的... 长链非编码RNA(long non-coding RNA,lncRNA)在细胞生物学过程和疾病发展中扮演着关键性角色。由于lncRNA的亚细胞定位和其生物学功能密切相关,因此确定lncRNA的亚细胞定位具有重要意义。目前已有一些基于机器学习的方法来识别lncRNA的亚细胞位置,但在识别人类lncRNA的细胞特异性定位方面的相关工作仍然有限。该模型对人类细胞系lncRNA亚细胞定位问题进行了研究,提取了k-mer、CKSNAP、SRS和TSS特征信息,并对各类特征信息进行了融合,基于XGBoost和LightGBM结合的算法来预测人类细胞系lncRNA的亚细胞位置,并通过10倍交叉检验对模型进行了评估。结果表明,该模型预测人类细胞系lncRNA亚细胞定位的方法与现有的预测方法相比,预测成功率均有一定改进,其基准数据集的AUROC值最高达到92.26%。 展开更多
关键词 细胞系特异性 长链非编码RNA 二级结构 特征融合 梯度提升决策树
下载PDF
基于梯度提升树模型的坡耕地土壤水蚀模拟与分析
3
作者 李潼亮 赵梓鉴 +5 位作者 李斌斌 张风宝 郭正 何琪琳 何庆 杨明义 《水土保持学报》 CSCD 北大核心 2024年第3期54-63,共10页
[目的]针对黄土高原坡耕地土壤侵蚀过程复杂、人为干扰强烈且难以量化的特点,利用机器学习定量解析主要影响因素对坡耕地土壤水蚀的作用与贡献,模拟分析坡耕地土壤水蚀特征并探究其机理,为坡耕地土壤侵蚀的预报提供基础支撑。[方法]基... [目的]针对黄土高原坡耕地土壤侵蚀过程复杂、人为干扰强烈且难以量化的特点,利用机器学习定量解析主要影响因素对坡耕地土壤水蚀的作用与贡献,模拟分析坡耕地土壤水蚀特征并探究其机理,为坡耕地土壤侵蚀的预报提供基础支撑。[方法]基于黄土高原子洲试验站坡耕地小区1959—1969年产流产沙观测数据,精细化表征其影响因子,运用梯度提升树模型对侵蚀量和径流深的变化及其影响因素的贡献进行分析。[结果]数据集中次降雨侵蚀量(0~122.72 t/km^(2))、径流深(0.02~17.20 mm)、降雨历时(2~1410 min)及平均雨强(0.02~4.63 mm)属强变异,变异系数均>1,且多数变量呈右偏态;在相同训练集和测试集划分情况下,对侵蚀量模型预测精度(R^(2)=0.81)略优于径流深模型(R^(2)=0.80),但侵蚀量模型的层数(8层)大于径流深模型(5层),表明侵蚀机理相较径流机理更为复杂;通过梯度提升树模型与SHAP算法对自变量重要性进行排序发现,影响侵蚀模型与径流模型的自变量重要性不同。[结论]受特征提取的限制,在侵蚀量与径流深较小时预测结果不理想,未来研究应当通过引入更多自变量组合方式寻找更多相关变量以提高对侵蚀事件的预测。产流和产沙的主要影响因素存在差异,降水本身特征对产流过程起主要作用,侵蚀产沙过程中主要受到降水与地形相关自变量的共同影响。基于数据驱动,为揭示黄土高原坡耕地侵蚀机理提供参考,并为区域坡耕地土壤侵蚀防治提供科学依据。 展开更多
关键词 预报模型 梯度提升树模型 坡耕地 黄土坡面
下载PDF
基于多中心队列数据的机器学习预测重症感染患儿死亡风险和筛选临床特征的研究
4
作者 朱雪梅 陈申成 +4 位作者 章莹莹 陆国平 叶琪 阮彤 郑英杰 《中国循证儿科杂志》 CSCD 北大核心 2024年第1期31-35,共5页
背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏... 背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏感指标。设计队列研究。方法基于全国20个省级行政区域的54家PICU的儿童多中心感染性疾病协作网数据库,纳入年龄>28天至18岁、确诊感染和至少有1个器官发生功能障碍的患儿,统计122项临床特征信息,以出PICU时死亡/恶化或治愈/好转为结局,通过机器学习构建逻辑回归模型(LR)、随机森林模型(RF)、极端梯度提升树(XGB)和反向传播神经网络(BP),筛选重要的临床特征建立重症感染患儿死亡风险预测模型。主要结局指标模型接收者操作特征曲线下面积(AUROC)和模型筛选临床特征性能的优劣。结果2022年4月1日至2023年12月31日协作网数据库中入PICU时确诊重症感染且入PICU时、入PICU 24 h时和出PICU时临床特征记录均完整的(病例1738例,经过数据预处理包括异常值处理、缺失值填充、强制值区间范围检验、归一化处理)1738条信息进入机器学习构建模型。存活或好转患儿1396例,死亡或恶化患儿342例(19.6%)。队列数据按4∶1分为训练集(1390条)和验证集(348条),训练集中存活或好转1116条,死亡或恶化274条;验证集中存活或好转280条,死亡或恶化68条。在训练集中,共输入模型122个临床特征,经过机器模型学习以及特征筛选后,在50轮的5折分层交叉验证下,验证集LR、RF和XGB的AUROC为0.74~0.78。LR、RF和XGB选择重要性大于均值的临床特征构建最优临床特征,尚无比较好的衡量BP特征重要性的方法,LR模型较RF和XGB构建的最优临床特征较为接近临床预期。结论机器学习预测儿童重症感染性疾病死亡/恶化结局表现一般,预测模型筛选的临床特征与临床预期尚有距离。 展开更多
关键词 机器学习 儿童重症监护室 感染 随机森林模型 极端梯度提升树
下载PDF
基于GBDT算法的弓网动态匹配特性预测模型
5
作者 黄桂灶 马同鑫 +3 位作者 杨泽锋 李政 魏文赋 吴广宁 《振动与冲击》 EI CSCD 北大核心 2024年第16期26-32,50,共8页
高速铁路通过弓网系统的滑动电接触获取电能驱动列车运行,弓网动态匹配特性是保障良好滑动电接触的基础。首先,建立了弓网动态匹配的有限元分析模型,并通过与文献结果对比验证了模型的正确性。采用拉丁超立方抽样方法,对接触网的关键结... 高速铁路通过弓网系统的滑动电接触获取电能驱动列车运行,弓网动态匹配特性是保障良好滑动电接触的基础。首先,建立了弓网动态匹配的有限元分析模型,并通过与文献结果对比验证了模型的正确性。采用拉丁超立方抽样方法,对接触网的关键结构参数和运行速度参数进行样本抽样,获得输入参数集;然后,利用有限元模型对输入参数集开展大量计算分析并进行结果的特征提取,获得弓网动态匹配关键特征参量的输出结果,结合输入和输出结果,构成了样本数据集;最后,采用梯度提升决策树(gradient lifting decision tree, GBDT)算法对数据集进行学习训练和验证测试,建立弓网动态匹配特性预测模型,并将其与基于决策树、随机森林、极端随机树和极端梯度提升树算法的4个模型进行对比分析。结果表明,基于GBDT算法的模型预测精度更高、稳定性更好,在测试集上的R~2达到了0.929,能够准确快速地评估弓网匹配特性。通过对GBDT模型进行参数重要性分析可知,运行速度对弓网匹配特性的影响程度最大,达61%,其次是接触线的张力、承力索张力和档距。该研究初步探索了采用机器学习方法建立预测模型来替代有限元模型的可能性,所建立的模型可用于弓网动态匹配特性的快速预测与评价。 展开更多
关键词 弓网系统 动态特性 机器学习 梯度提升决策树(GBDT) 受流质量
下载PDF
基于长短期记忆网络和梯度提升的高血压患者RR间期时间序列预测方法
6
作者 喻文杰 陈宏文 +3 位作者 齐宏亮 潘智林 李翰威 胡德斌 《中国医疗器械杂志》 2024年第4期392-395,共4页
目的 对高血压患者的RR间期进行预测,帮助临床医生对患者心脏状况进行分析和预警。方法 以8位患者数据为样本,通过长短期记忆网络(LSTM)和梯度提升树(XGBoost)分别对患者的RR间期进行预测,将2个模型的预测结果通过方差倒数法进行组合,... 目的 对高血压患者的RR间期进行预测,帮助临床医生对患者心脏状况进行分析和预警。方法 以8位患者数据为样本,通过长短期记忆网络(LSTM)和梯度提升树(XGBoost)分别对患者的RR间期进行预测,将2个模型的预测结果通过方差倒数法进行组合,克服单一模型预测的劣势。结果 提出的组合模型相较于单一模型在8位患者RR间期的预测上具有不同程度的改善效果。结论 LSTM-XGBoost模型为高血压患者RR间期预测提供了方法,具有一定的临床价值。 展开更多
关键词 RR间期 长短期记忆网络 梯度提升 时序预测 高血压
下载PDF
用梯度提升决策树实现电力负荷非线性影响因素分析 被引量:1
7
作者 邹鑫 罗涓 《电力科学与工程》 2024年第3期10-19,共10页
为了避免由因素冗余导致的预测精度下降,对比分析了6种集成机器学习模型的性能,发现梯度提升决策树回归模型性能最好。利用梯度提升决策树进行特征重要性排序,选出显著影响因素;然后通过计算偏依赖量来评估各影响因素与最大负荷之间的... 为了避免由因素冗余导致的预测精度下降,对比分析了6种集成机器学习模型的性能,发现梯度提升决策树回归模型性能最好。利用梯度提升决策树进行特征重要性排序,选出显著影响因素;然后通过计算偏依赖量来评估各影响因素与最大负荷之间的非线性关系;最后,运用长短期记忆预测模型对各个因素的组合进行验证。结果表明,利用梯度提升决策树可以有效捕捉最大负荷与各因素之间的非线性关系,且经过因素选择和考虑温度累积效应后,负荷预测准确度得到显著提高。 展开更多
关键词 新型电力系统 负荷预测 梯度提升决策树 长短期记忆 非线性影响
下载PDF
基于盈余公告漂移的LGBM多因子量化策略
8
作者 陈怡君 李欣雨 +1 位作者 王潇逸 惠永昌 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第3期313-322,共10页
在资本市场波动加剧的时代,挖掘有效因子与市场信息,构建合适的投资组合策略,可以实现对风险的控制和获取稳定且持续的超额收益率.选取2018—2022年第1季度中国沪深两市A股上市股票的业绩报告作为研究对象,以公司盈余公告后的1~12周作... 在资本市场波动加剧的时代,挖掘有效因子与市场信息,构建合适的投资组合策略,可以实现对风险的控制和获取稳定且持续的超额收益率.选取2018—2022年第1季度中国沪深两市A股上市股票的业绩报告作为研究对象,以公司盈余公告后的1~12周作为时间窗口,通过研究盈余公告后的股价漂移(post-earnings-announcement drift,PEAD)选取市场异象的代理变量预期外盈余因子与其他5个相关市场异象因子,并使用信息系数(information coefficient,IC)、信息比率(information ratio,IR)和双重排序法进行有效因子的筛选和检验.考虑到本次量化选股是低数据量、低频次、特征值高有效性的分类任务,采用基于轻量梯度提升树的多因子量化策略构建投资组合预测股票的收益率,并与传统量化策略(简单打分法、基于预期外盈余的单因子模型、IC值加权的多因子选股模型)、基于其他机器学习模型(支持向量回归(support vector regression,SVR)、人工神经网络(artificial neural network,ANN)与分布式梯度增强(extreme gradient boosting,XGBoost))的量化策略进行对比.实证结果表明,在基于A股市场第1季度PEAD效应的股票超额收益率预测中,轻量级梯度提升机(light gradient boosting machine,LGBM)机器学习多因子量化策略构建的投资组合在多空组合中实现的年均收益率达到21.633%,超过基准年化收益率20.184%.LGBM多因子量化策略构建的投资组合在A股市场表现优异,较其他量化策略有显著提升且更为稳定,可更好地控制组合风险并获取更高的超额收益. 展开更多
关键词 数字经济 量化投资 多因子选股 轻量梯度提升树 盈余公告后漂移 异象因子
下载PDF
大规模电力工程数据价值深度挖掘算法设计研究
9
作者 薛礼月 陆瑜峰 王琼 《电子设计工程》 2024年第10期125-129,共5页
针对传统电力工程数据处理方法中存在的不可追溯且不易统一管理等问题,文中基于数据挖掘的思想提出了一种电力工程数据价值分析预测模型。该模型采用Boosting算法将多个预测树结构组合形成极端梯度提升树模型,从而实现对非线性数据的深... 针对传统电力工程数据处理方法中存在的不可追溯且不易统一管理等问题,文中基于数据挖掘的思想提出了一种电力工程数据价值分析预测模型。该模型采用Boosting算法将多个预测树结构组合形成极端梯度提升树模型,从而实现对非线性数据的深入分析,且经过多次迭代后,可以使训练准确度与学习效果得到显著提升。通过采用改进的双向长短时记忆网络,增强了模型处理时序性数据的能力。同时还使用误差倒数法将两个算法模型相结合,使其具有更高的预测精度。在实验测试中,所提算法的预测结果更贴近实际值,且其MAPE及RMSE测试指标分别为0.201%和0.039%,在所有对比算法中均为最优,可以对电力工程数据价值进行准确的分析和预测。 展开更多
关键词 数据挖掘 极端梯度提升树 长短时记忆网络 误差倒数法 数据预测
下载PDF
基于极端梯度提升树模型的工程项目安全管理研究
10
作者 陈华伟 谭琳 于强 《科技创新与应用》 2024年第1期119-122,共4页
工程项目安全管理是建筑工程项目核心内容,部分建筑企业对效益的过分追求,导致工程项目经常出现事故。深入研究工程项目安全管理,有利于提高工程质量降低事故发生的概率。如何对项目安全进行管理,如何掌握项目实施过程中出现的各种风险... 工程项目安全管理是建筑工程项目核心内容,部分建筑企业对效益的过分追求,导致工程项目经常出现事故。深入研究工程项目安全管理,有利于提高工程质量降低事故发生的概率。如何对项目安全进行管理,如何掌握项目实施过程中出现的各种风险因素,成为每一个项目管理者目前亟待解决的问题。该文通过运用极端梯度提升树模型对工程项目安全管理进行研究,建立安全管理模型并确立安全等级,为工程管理者对安全管理的决策提供依据。 展开更多
关键词 工程项目 安全管理 安全指标 极端梯度提升树 建筑工程
下载PDF
基于GBDT算法的游戏销量预测模型研究 被引量:5
11
作者 徐英卓 郭博 王六鹏 《智能计算机与应用》 2023年第1期182-185,共4页
随着网络游戏的快速兴起,精确的游戏销量预测具有较高的商业价值,能够明确各方投资方向,提高收益,形成合作共赢。本文以影响游戏销量的特征数据为样本,建立基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法的游戏销量预... 随着网络游戏的快速兴起,精确的游戏销量预测具有较高的商业价值,能够明确各方投资方向,提高收益,形成合作共赢。本文以影响游戏销量的特征数据为样本,建立基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法的游戏销量预测模型;并将GBDT模型预测结果与决策树、线性回归、极端随机树进行对比分析。分析表明,本文所建立的游戏销量预测模型较其它预测模型具有较高的拟合优度,预测效果更好,且在预测阶段的计算速度快,在分布稠密的数据集上,泛化能力和表达能力较好。 展开更多
关键词 游戏销量 预测 梯度提升决策树
下载PDF
基于机器学习的星载短波红外CO_(2)柱浓度估算 被引量:5
12
作者 李静波 张莹 盖荣丽 《中国环境科学》 EI CAS CSCD 北大核心 2023年第4期1499-1509,共11页
利用OCO-2卫星遥感数据、全球碳柱总量观测网(TCCON)站观测数据、NDVI归一化植被指数数据、ERA5大气数据,采用决策树和集成学习(XGBoost、普通随机森林、极端随机森林、梯度提升)对二CO_(2)平均柱浓度进行预测.通过相关性分析、特征选... 利用OCO-2卫星遥感数据、全球碳柱总量观测网(TCCON)站观测数据、NDVI归一化植被指数数据、ERA5大气数据,采用决策树和集成学习(XGBoost、普通随机森林、极端随机森林、梯度提升)对二CO_(2)平均柱浓度进行预测.通过相关性分析、特征选择与特征提取,建立模型预测CO_(2)平均柱浓度,再与TCCON站点的地基观测数据进行比对.通过分析不同模型(决策树、XGBoost、普通随机森林、极端随机森林、梯度提升)预测的结果,发现使用极端随机森林回归模型预测CO_(2)平均柱浓度的精度最高,R^(2)、均方根误差(RMSE)、平均绝对误差(MAE)、平均相对误差(MRE)分别为:0.953、0.492×10^(-6)、0.260×10^(-6)、0.063%,其余模型次之,因此对极端随机森林回归模型的预测性能随自身参数的影响进行了分析,结果表明,在误差允许的范围内(±2×10^(-6)),极端随机森林回归模型和梯度提升回归模型预测的准确率一样,都为98.10%.由于CO_(2)的背景浓度较高,而边界层内CO_(2)浓度的空间差异相对较小,因此需要进一步缩小误差的范围,在±1×10^(-6)误差范围内,极端随机森林回归模型和梯度提升预测的准确率分别为91.82%和90.51%.所以采用极端随机森林算法预测CO_(2)柱浓度的结果更好,精度更高,符合CO_(2)预测的精度要求. 展开更多
关键词 二氧化碳平均柱浓度 集成学习 极端随机森林 梯度提升 决策树 XGBoost 短波红外
下载PDF
降维降噪处理对番茄早疫病潜育期高光谱识别效果的影响 被引量:2
13
作者 胡政 张艳 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第3期744-752,共9页
番茄早疫病感染性强、破坏性大,潜育期症前特征的检测识别是番茄早疫病监测预警和科学防治的关键。在实验室以离体番茄叶片作为研究对象,利用高光谱图像监测番茄叶片早疫病的病程演变情况,结合可见光图像和光谱特征进行数据分析。实验发... 番茄早疫病感染性强、破坏性大,潜育期症前特征的检测识别是番茄早疫病监测预警和科学防治的关键。在实验室以离体番茄叶片作为研究对象,利用高光谱图像监测番茄叶片早疫病的病程演变情况,结合可见光图像和光谱特征进行数据分析。实验发现,番茄叶片感染早疫病后其近红外光谱平均值和红边反射率随着时间不断降低,且在接种36 h时已出现潜育期病症信息。选择接种36 h的光谱数据作为番茄早疫病潜育期的建模数据,分别利用了主成分(PCA)变换、多元散射校正(MSC)对建模数据进行光谱降维或降噪处理,进而建立梯度提升决策树(GBDT)和支持向量机(SVM)识别模型,并导入数据进行训练识别。讨论了PCA和MSC的预处理方法对梯度提升决策树(GBDT)和支持向量机(SVM)模型识别效果的影响;进一步讨论常见核函数对SVM识别模型的影响,优选出预处理方法和识别模型的组合算法。结果发现,PCA-GBDT、PCA-SVM(高斯核)、PCA-SVM(线性核)、MSC-GBDT、MSC-SVM(多项式核)这几类组合算法准确率均为95%以上,能很好的实现番茄早疫病潜育期的光谱识别;其中MSC-GBDT的识别召回率和准确率最好,而PCA-SVM(高斯核)识别效率最高。研究表明,通过降噪处理后的番茄早疫病潜育期高光谱数据减少了噪声、更加符合真实的分布、具有较大的可信数据量,配合简单的识别模型会导致识别能力不足,而配合复杂的识别模型可达到一个较可靠的测试结果;通过降维算法能使番茄早疫病潜育期高光谱数据的维度降低、数据量减少;降维后的特征能够表达出病变信息,配合简单识别模型时识别效果好,而配合过于复杂的识别模型会导致识别模型的过拟合。 展开更多
关键词 番茄早疫病 潜育期 高光谱成像 预处理 支持向量 梯度提升决策树
下载PDF
基于模型混合的智能交易行为异常检测
14
作者 张耐 张晨亮 +2 位作者 柳永翔 陈聪 黄艳婷 《计算机工程与科学》 CSCD 北大核心 2023年第9期1639-1647,共9页
作为智能金融的重要体现之一,基于交易软件的智能化交易在国内金融市场方兴未艾,显著提升了金融交易效率。然而,智能交易软件类型丰富,其涉及的交易策略设计思路和算法复杂多样,造成交易存在异常、不合规风险。目前,对于智能交易行为的... 作为智能金融的重要体现之一,基于交易软件的智能化交易在国内金融市场方兴未艾,显著提升了金融交易效率。然而,智能交易软件类型丰富,其涉及的交易策略设计思路和算法复杂多样,造成交易存在异常、不合规风险。目前,对于智能交易行为的异常检测工作尚未充分展开。为此,针对交易数据类型的复杂性和专业性,提出了融合深度学习隐式表征学习和规则树模型显式规则学习的思路,对交易数据涉及的时序性和合规性分别进行建模。为验证所提模型的有效性,在股票、期货等多种类型数据上将其和一些代表性的基线模型进行了对比,实验结果表明该模型能够取得最佳性能。此外,对混合模型进行了进一步分析,测试了不同特征对于异常检测效果的影响。 展开更多
关键词 安全性评估 异常检测 深度学习 梯度提升树
下载PDF
我国产业结构升级与经济高质量发展关系研究
15
作者 张学清 王亦飞 +1 位作者 刘旭梅 李芳 《山东工商学院学报》 2023年第4期45-54,共10页
通过搜集2012—2021年的时间序列数据,选取描述产业结构变动和高质量发展的指标采用灰色关联度模型对后疫情时期产业结构变化和高质量发展的关联度进行分析并采用梯度提升回归树方法对接下来我国经济高质量发展水平做出预测。最终得出... 通过搜集2012—2021年的时间序列数据,选取描述产业结构变动和高质量发展的指标采用灰色关联度模型对后疫情时期产业结构变化和高质量发展的关联度进行分析并采用梯度提升回归树方法对接下来我国经济高质量发展水平做出预测。最终得出相关结论:(1)中国经济高质量发展各项指数总体趋好发展,产业结构方面第二产业和第三产业是经济的主要推动力,疫情对第三产业的冲击较为严重;(2)疫情期间的产业结构变化使经济发展稳定性变差,生产效率变低。创新点在于改变现有研究中只用描述性方法测算产业结构和高质量发展关联度的方法,选取模型来定量描述二者之间的关系。 展开更多
关键词 灰色关联分析 熵值法 产业结构 经济高质量发展 梯度提升回归树
下载PDF
机器学习方法在舟山渔场主要经济蟹类生物量估算中的应用
16
作者 杨春蕙 栗小东 +1 位作者 刘琦 王迎宾 《海洋科学》 CAS CSCD 北大核心 2023年第9期61-70,共10页
扫海面积法因其操作简单、计算方便,被广泛应用于渔业生物量评估工作中。但该方法需假设资源均匀分布,若要提高生物量评估的准确性,则须增加站位数量,进而增加经费预算。本研究基于2006年8月和2007年1月、5月、11月在舟山渔场海域开展... 扫海面积法因其操作简单、计算方便,被广泛应用于渔业生物量评估工作中。但该方法需假设资源均匀分布,若要提高生物量评估的准确性,则须增加站位数量,进而增加经费预算。本研究基于2006年8月和2007年1月、5月、11月在舟山渔场海域开展渔业资源底拖网调查所获得的多种经济蟹类数据资料,模拟分析扫海面积法与机器学习模型(随机森林(RF)、梯度提升回归树模型(GBRT)、极限梯度提升(XGBoost))对舟山渔场海域三疣梭子蟹(Portunus trituberculatus)、双斑鲟(Charybdis bimaculata)、日本鲟(Charybdis japonica)、细点圆趾蟹(Ovalipes punctatus)4种主要经济蟹类生物量的对比评估效果。结果显示,随着投入站点数目的减少,在数据不集中、波动较大的秋、冬季节XGBoost方法对生物量的评估效果明显优于扫海面积法,误差降低7.49%~21.34%;而在较为均匀的春、夏两季,扫海面积法与机器学习方法两者结果的差异不显著(P<0.05)。本研究以几种经济蟹类为例,探索使用机器学习方法评估其生物量,达到了提高评估准确性并节省资源调查成本的效果,可在其他渔业资源种类生物量评估中推广应用。 展开更多
关键词 资源评估 扫海面积法 随机森林 梯度提升回归树 极限梯度提升回归
下载PDF
基于梯度提升回归树模型的烟草产量预测方法
17
作者 李明钊 李熠胥 王佳 《云南化工》 CAS 2023年第9期109-111,共3页
烟草作为我国重要经济作物之一,其利税为国家和地方财政收入作出了积极贡献。基于我国近年来烟草产量的历史数据,建立梯度提升回归树模型,对烟草产量进行了预测。首先,根据梯度提升思想建立梯度提升回归树模型;然后,根据烟草产量与年份... 烟草作为我国重要经济作物之一,其利税为国家和地方财政收入作出了积极贡献。基于我国近年来烟草产量的历史数据,建立梯度提升回归树模型,对烟草产量进行了预测。首先,根据梯度提升思想建立梯度提升回归树模型;然后,根据烟草产量与年份、月份及上年同期产量间的关联,设置独立因子;最后,借助2017~2021年全国烟草产量的真实数据,对2022年同期产量进行预测分析,并与2022年全国烟草产量的真实数值比较,以验证梯度回归树模型预测的有效性。 展开更多
关键词 梯度提升回归树 烟草 产量预测
下载PDF
典型微地形区输电线路覆冰厚度影响因子分析
18
作者 吴建蓉 何锦强 +4 位作者 李昊 文屹 龚博 张厚荣 曾华荣 《电气应用》 2023年第11期26-33,I0006,I0007,共10页
导线覆冰是架空电力线路的主要自然荷载之一,由于典型微地形的影响造成局部地区的气象要素突变,在冬季形成严重的覆冰过载现象,导致线路跳闸、受损甚至倒塔,威胁电网的安全运行。以毕节市为例,研究提取区域易覆冰微地形方法,收集历史覆... 导线覆冰是架空电力线路的主要自然荷载之一,由于典型微地形的影响造成局部地区的气象要素突变,在冬季形成严重的覆冰过载现象,导致线路跳闸、受损甚至倒塔,威胁电网的安全运行。以毕节市为例,研究提取区域易覆冰微地形方法,收集历史覆冰观测样本,采用随机森林(Random Forest,RF)和梯度提升树(Gradient Boosting Decision Tree,GBDT)机器学习模型,分析不同易覆冰微地形区输电线路的覆冰影响因子。 展开更多
关键词 导线覆冰 气象因子 地理因子 梯度提升树
下载PDF
基于数据挖掘技术的交通流预测模型 被引量:4
19
作者 邓晶 张倩 《计算机系统应用》 2019年第7期114-120,共7页
本文针对交通数据挖掘领域的交通流预测问题进行研究和实现.主要对数据挖掘技术应用于交通流数据的特征选择和交通流预测模型的建立提出算法.在对采样数据进行清洗后,以分类与回归决策树作为基学习器,采用梯度提升决策树进行回归拟合,... 本文针对交通数据挖掘领域的交通流预测问题进行研究和实现.主要对数据挖掘技术应用于交通流数据的特征选择和交通流预测模型的建立提出算法.在对采样数据进行清洗后,以分类与回归决策树作为基学习器,采用梯度提升决策树进行回归拟合,计算出交通数据的特征重要度.并以此重要度作为自适应特征选择的依据.其次,采用聚类算法对选取后的特征数据进行聚类分析,缩小样本大小的同时,同类数据更加相似.最后,以实时数据匹配相应聚类作为训练数据集,使用经过人工鱼群算法优化参数后的支持向量机进行交通流预测.本文结尾通过实验数据论证本文所提出的算法和模型. 展开更多
关键词 数据挖掘 交通流预测 特征选择 梯度提升决策树 支持向量机 人工鱼群算法
下载PDF
交通流数据自适应特征选择算法 被引量:1
20
作者 邓晶 张倩 《计算机技术与发展》 2019年第12期76-80,共5页
在交通流数据挖掘领域中,交通流预测占据着相当重要的地位。特别的,由于交通流数据具有数据量大、维度高、非线性等特征,对预测数据训练集的选取更加关键。文中以包含多影响因子的交通流数据为研究对象,综合考虑了交通流量、天气以及日... 在交通流数据挖掘领域中,交通流预测占据着相当重要的地位。特别的,由于交通流数据具有数据量大、维度高、非线性等特征,对预测数据训练集的选取更加关键。文中以包含多影响因子的交通流数据为研究对象,综合考虑了交通流量、天气以及日期属性等交通数据特征。数据的特征较多,维度较高。基于此,在对数据进行合适的数据清洗后,提出并实现了一种梯度提升决策树的自适应选择方法,对应用于动态交通流预测模型的数据集进行特征选择。以分类和回归决策树作为基学习器,采用梯度提升决策树算法进行回归拟合。通过迭代过程中每棵决策树产生的基尼指数和分裂特征属性的次数来计算特征重要度,并采用二次下降法对特征进行自适应选择,实现对交通流数据重要特征的自动选取。最后,通过实验数据论证了提出的算法和模型。 展开更多
关键词 特征选择 梯度提升决策树 分类与回归决策树 特征重要度 二次下降法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部