期刊文献+
共找到468篇文章
< 1 2 24 >
每页显示 20 50 100
A Design of Stack Data Cache in IW
1
作者 滕至阳 袁全生 《Journal of Southeast University(English Edition)》 EI CAS 1998年第1期8-11,共4页
A stack data cache is designed according to the features of intelligent workstation(IW) in A1 type intelligent network. Its page fault rate is up to 10 -3 , and the overhead of page replacement is only half of th... A stack data cache is designed according to the features of intelligent workstation(IW) in A1 type intelligent network. Its page fault rate is up to 10 -3 , and the overhead of page replacement is only half of the normal. Stack data cache is suitable for IWs inference engine especially. 展开更多
关键词 stack data cache intelligent workstation
下载PDF
基于组合时域特征提取和Stacking集成学习的燃煤锅炉NO_(x)排放浓度预测
2
作者 唐振浩 隋梦璇 曹生现 《中国电机工程学报》 EI CSCD 北大核心 2024年第16期6551-6564,I0022,共15页
为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with ada... 为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise analysis,CEEMDAN)和统计学计算数据标准差、偏度等特征的方法进行组合时域特征提取以构建重构数据;其次,考虑到重构数据中存在的冗余变量对模型的精度有所影响,利用遗传算法(genetic algorithm,GA)对重构数据进行特征降维;最后,为充分发挥各个模型的优势以提高模型的预测精度,构建以极限学习机(extreme learning machines,ELM)、深度神经网络(deep neural networks,DNN)、多层感知器(multilayer perceptron,MLP)、极限梯度提升算法(extreme gradient boosting,XGBoost)为基模型和以回声状态网络(echo state network,ESN)为元模型的Stacking集成学习NOx排放浓度预测模型。实验结果表明:该预测模型在不同数据集下都有着不错的预测效果,预测误差均小于2%,能够对锅炉NOx排放浓度实现精准预测。 展开更多
关键词 NO_(x)排放浓度 时序特征 时域特征 数据重构 stacking集成学习
下载PDF
基于Stacking集成学习的热轧带钢凸度诊断模型
3
作者 张殿华 李贺 +3 位作者 武文腾 霍光帆 孙杰 彭文 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第10期3673-3682,共10页
在热连轧生产过程中,凸度是重要的质量指标,过程数据的非平衡性限制了数据驱动模型的预测效果,为提高模型的预测精度,提出一种融合SMOTE和Stacking集成算法的热轧带钢凸度诊断模型。首先,采用SMOTE过采样方法处理凸度相关数据集,降低数... 在热连轧生产过程中,凸度是重要的质量指标,过程数据的非平衡性限制了数据驱动模型的预测效果,为提高模型的预测精度,提出一种融合SMOTE和Stacking集成算法的热轧带钢凸度诊断模型。首先,采用SMOTE过采样方法处理凸度相关数据集,降低数据非平衡分布导致的影响;然后,构建以轻量级梯度提升机(LightGBM)、支持向量机(SVM)、K近邻(KNN)和随机森林(RF)为基学习器,逻辑回归(LR)为元学习器的Stacking集成模型,最后,使用某2160 mm热轧带钢实际生产数据进行模型验证。研究结果表明,诊断模型的准确率、少数类召回率、平衡F分数、几何平均值和ROC曲线下面积分别为0.9580、0.9595、0.9573、0.9589和0.9579,与XGBoost、LightGBM、KNN、SVM和随机森林模型对比,预测效果最优,证明了Stacking集成算法能够有效增强诊断模型的泛化能力,具有优良的诊断性能。 展开更多
关键词 带钢凸度诊断 stacking集成模型 非平衡数据 SMOTE
下载PDF
基于Stacking集成学习的学生成绩预测方法
4
作者 高艺璐 刘鸿雁 +1 位作者 姚明海 李劲松 《电子设计工程》 2024年第24期63-67,共5页
成绩预测是指通过数据建模的方式来预测学习者未来的学习趋势。但现有研究中大多是基于单一算法构建成绩预测模型,忽略了不同方法的优势与适用领域。因此,基于Stacking集成学习的方法,构建组合模型对大学生的学业成绩进行预测,使学习者... 成绩预测是指通过数据建模的方式来预测学习者未来的学习趋势。但现有研究中大多是基于单一算法构建成绩预测模型,忽略了不同方法的优势与适用领域。因此,基于Stacking集成学习的方法,构建组合模型对大学生的学业成绩进行预测,使学习者及早意识到学业危机。以某高校信息与计算科学专业学生的成绩为研究对象进行大量的随机实验。实验结果表明,在测试样本占比10%~60%的情况下,组合模型的MAE值均小于基于单一算法构建的成绩预测模型。该方法可以从数据空间、数据结构等方面对学生的学习成绩进行全方位多角度分析,提升学生学习动机。 展开更多
关键词 教育数据挖掘 组合模型 stackING 成绩预测 高等教育
下载PDF
基于Stacking多模型融合的极端天气短期风电功率预测方法
5
作者 郑颖颖 李鑫 +1 位作者 陈延旭 赵永宁 《高电压技术》 EI CAS CSCD 北大核心 2024年第9期3871-3882,共12页
为了解决极端天气下样本稀缺和单一模型预测精度不高的问题,提出一种基于Stacking多模型融合的极端天气短期风电功率预测方法。首先,提取极端事件的原始数据,通过考虑格兰杰因果的最大相关-最小冗余(maximal relevance minimal redundan... 为了解决极端天气下样本稀缺和单一模型预测精度不高的问题,提出一种基于Stacking多模型融合的极端天气短期风电功率预测方法。首先,提取极端事件的原始数据,通过考虑格兰杰因果的最大相关-最小冗余(maximal relevance minimal redundancy, mRMR)特征选择策略降低数据特征冗余和复杂性;其次,针对极端天气数据稀缺的问题,采用捕捉数据时间动态特性的时间序列生成对抗网络(time-seriesgenerativeadversarialnetwork,TimeGAN)算法进行扩充;最后,考虑到各单一模型的差异性及优势性,构建以卷积神经网络、长短期记忆网络、极端梯度提升树、K最近邻算法、支持向量机为基学习器,以轻量梯度提升机为元学习器的Stacking集成模型对未来3d的风电功率进行预测。实验结果表明,所提方法能够有效提升极端天气下的短期风电功率预测精度,与其他预测模型相比,其归一化平均绝对误差和均方根误差分别改善了2.48%和3.47%。 展开更多
关键词 风电功率预测 数据扩充 m RMR特征选择 stacking集成学习 TimeGAN 极端天气
下载PDF
基于Stacking和孤立森林的虚假数据注入攻击防御策略
6
作者 王旭 何宇 袁梦薇 《智能计算机与应用》 2024年第7期222-226,共5页
针对电力信息物理系统受到虚假数据注入攻击后无法安全稳定运行的问题,本文提出了一种基于Stacking和孤立森林的两阶段数据清洗方法。首先,由多异质学习器组成的Stacking分类模型对实时量测数据样本进行异常检测,判断当前时刻量测样本... 针对电力信息物理系统受到虚假数据注入攻击后无法安全稳定运行的问题,本文提出了一种基于Stacking和孤立森林的两阶段数据清洗方法。首先,由多异质学习器组成的Stacking分类模型对实时量测数据样本进行异常检测,判断当前时刻量测样本中是否存在虚假数据;其次,虚假数据的量测样本与基于负荷预测和潮流计算生成的当前时刻伪量测数据作差,得到量测误差向量,将量测误差向量输入孤立森林异常检测模型中进行二次辨识,定位受攻击的量测位置,并由伪量测数据进行替换修正;最后,通过IEEE-33节点测试系统仿真实验验证本文所提方法的有效性。 展开更多
关键词 虚假数据注入 数据清洗 stackING 孤立森林
下载PDF
基于改进的Stacking模型的教师分数预测
7
作者 杨雪亭 赵霞 王钊 《河北省科学院学报》 CAS 2024年第3期36-42,48,共8页
针对单个模型泛化能力弱的问题,提出了基于改进的Stacking模型的教师分数预测模型。首先用LightGBM进行特征选择,再对目标值进行Box-Cox转换,最后利用基于Stacking的回归模型,集成了AdaBoost(自适应增强)、RF(随机森林)、XGBoost(极限... 针对单个模型泛化能力弱的问题,提出了基于改进的Stacking模型的教师分数预测模型。首先用LightGBM进行特征选择,再对目标值进行Box-Cox转换,最后利用基于Stacking的回归模型,集成了AdaBoost(自适应增强)、RF(随机森林)、XGBoost(极限梯度提升)、KRR(核岭回归)四种算法,再用Stacking模型与单个学习器Ridge(岭回归)加权组合预测教师分数。结果显示,在教师分数数据集上改进后的算法均方根误差为9.715,较回归算法AdaBoost降低了0.227,较传统Stacking融合模型降低了0.161,该模型有效地提高了预测准确率。 展开更多
关键词 教育数据挖掘 学生评教 stacking集成学习 特征选择
下载PDF
基于分时数据与优化Stacking模型的光伏电站辐照度预测
8
作者 杨家豪 张莲 +2 位作者 王士彬 杨玉洁 梁法政 《分布式能源》 2024年第5期11-21,共11页
为提高复杂天气条件下地表太阳辐射的预报能力,提出了一种基于分时预测与模型融合的预测方法。首先,通过补充天文辐射特征以反映太阳辐射强度的周期性,并结合天气分类方法引入辐照度衰减系数,对天文辐射进行修正,从而增强了相关性。其次... 为提高复杂天气条件下地表太阳辐射的预报能力,提出了一种基于分时预测与模型融合的预测方法。首先,通过补充天文辐射特征以反映太阳辐射强度的周期性,并结合天气分类方法引入辐照度衰减系数,对天文辐射进行修正,从而增强了相关性。其次,对数据进行了相关性分析,结果显示地表辐照度主要与天文辐射高度密切相关,而其他气象因素的相关性较低。因此,将数据集按时间节点划分为若干子集,以改变数据分布,从而提升其他关键特征之间的相关性。鉴于不同的数据集使用单一模型进行预测可能导致结果差异,为此采用Stacking算法来提高模型的泛化能力。同时,通过引入交叉验证和叠加高斯噪声的数据增广技术,实现对Stacking模型的优化。实验结果表明,优化后的Stacking模型能够有效提升泛化能力并降低过拟合风险;所提方法能有效识别复杂天气下地表辐照度的随机性,其准确率和合格率分别达到了95.8%和96.7%,相比传统预测方法提高了4%~19%。 展开更多
关键词 地表太阳辐射 特征扩充 stacking模型 数据增广 分时预测
下载PDF
基于动态Stacked-GBDT算法的数据资源价值评估方法研究 被引量:5
9
作者 沈俊鑫 赵雪杉 《科技管理研究》 CSSCI 北大核心 2023年第1期53-61,共9页
针对现有的数据资源价值评估与定价方法主观性强、定量标准缺乏的问题,提出基于模型堆叠集成GBDT(Stacked-GBDT)算法的数据资源价值评估方法。首先,基于敏感性分析,从数据自身和市场两个维度归纳并建立了数据资源价值评估指标体系;然后... 针对现有的数据资源价值评估与定价方法主观性强、定量标准缺乏的问题,提出基于模型堆叠集成GBDT(Stacked-GBDT)算法的数据资源价值评估方法。首先,基于敏感性分析,从数据自身和市场两个维度归纳并建立了数据资源价值评估指标体系;然后,基于GBDT机器学习算法与Stacking集成学习算法,提出了基于StackedGBDT的数据资源价值评估算法,并与Random Forest和XGBoost算法进行对比以验证所提方法的正确性及有效性;最后,应用Stacked-GBDT模型对数据集进行动态定价。结果表明,Stacked-GBDT算法构建的数据资源价值评估模型可为数据价值测算及动态定价提供精确可靠的依据与支撑。 展开更多
关键词 数据资源 动态stacking 数据价值评估 机器学习 集成学习
下载PDF
基于数据挖掘的专业可信回答者个性化推荐——以Stack Overflow问答社区为例 被引量:4
10
作者 刘迎春 朱旭 +1 位作者 谢年春 李佳 《现代教育技术》 CSSCI 北大核心 2019年第5期78-84,共7页
针对问答社区中问题不能得到及时、有效解答的现状,文章以Stack Overflow问答社区为例,首先介绍了问答社区数据的采集与预处理情况;然后,通过挖掘学习者信息,得到专业可信回答者、高信誉回答者和徽章回答者三种潜在回答者;最后,实施了... 针对问答社区中问题不能得到及时、有效解答的现状,文章以Stack Overflow问答社区为例,首先介绍了问答社区数据的采集与预处理情况;然后,通过挖掘学习者信息,得到专业可信回答者、高信誉回答者和徽章回答者三种潜在回答者;最后,实施了三种回答者推荐并对比了推荐性能。实验结果表明,与高信誉回答者推荐和徽章回答者推荐相比,考虑回答质量和专业相关性的专业可信回答者推荐具有更高的准确率和召回率,其推荐性能更优。实施基于数据挖掘的专业可信回答者个性化推荐,能有效缓解问答社区的信息过载问题,有助于建设更高效的网络学习社区环境。 展开更多
关键词 专业可信度 回答者推荐 数据挖掘 stack Overflow问答社区
下载PDF
基于混合采样和Stacking集成的电信用户网别预测 被引量:1
11
作者 卢光跃 闫真光 +1 位作者 吕少卿 吴洋 《西安邮电大学学报》 2019年第4期1-5,共5页
为了准确识别潜在换网电信用户,建立一种电信用户网别更换预测模型。根据用户历史数据生成网别更换标签,确定其多数类和少数类样本。利用具有噪声的密度聚类欠采样方法对多数类样本进行聚类,删除聚类后的噪声样本和各簇的边界样本,并选... 为了准确识别潜在换网电信用户,建立一种电信用户网别更换预测模型。根据用户历史数据生成网别更换标签,确定其多数类和少数类样本。利用具有噪声的密度聚类欠采样方法对多数类样本进行聚类,删除聚类后的噪声样本和各簇的边界样本,并选择各簇核心样本点进行随机欠采样;结合人工合成少数类过采样方法对少数类样本进行过采样。将构成混合采样后的平衡样本集合,输入到两层的Stacking集成学习算法中训练,得出分类结果。实验结果表明,该模型具有较好的数据集均衡性能,且预测准确率高,能够更好地识别潜在的网别更换用户。 展开更多
关键词 网别预测 不平衡数据 DBSCAN 混合采样 stackING
下载PDF
基于Stacking多算法融合模型的数据资源定价方法训练流程如下 被引量:4
12
作者 沈俊鑫 赵雪杉 《情报理论与实践》 CSSCI 北大核心 2023年第1期179-186,共8页
[目的/意义]针对现有数据资源定价标准模糊、交易规则缺失、买卖双方信息不对称的问题,提出基于Stacking多算法融合模型的数据资源定价方法。[方法/过程]首先,基于四分位法及Box-Cox方法对样本数据进行预处理,剔除异常数据的同时调整数... [目的/意义]针对现有数据资源定价标准模糊、交易规则缺失、买卖双方信息不对称的问题,提出基于Stacking多算法融合模型的数据资源定价方法。[方法/过程]首先,基于四分位法及Box-Cox方法对样本数据进行预处理,剔除异常数据的同时调整数据分布,并基于Lasso算法以均方根误差最小为目标完成特征筛选;其次,基于Pearson系数选取最优算法组合,构建基于Stacking集成学习融合多种机器学习算法的数据资源价格预测模型;最后,以国信优易数据平台交易数据为样本进行算例分析。[结果/结论]相较于单算法模型及其他集成算法模型,XGBoost、SVR、KNN、MLP融合模型的预测精度及性能均明显提升;实现了数据资源自身和市场的双向反馈平衡,形成闭环的价值链,为数据资源定价提供参考。 展开更多
关键词 数据资源 价格预测 集成学习 多算法融合 stacking算法
下载PDF
基于Stacking融合框架的随钻方位伽马预测
13
作者 李娜 沈楠 段友祥 《计算机与数字工程》 2023年第3期589-594,共6页
由于实时随钻传输速率等问题的影响,方位伽马信息不足,增加了后续地层分析的工作的难度。针对上述问题,提出了一种新的预测方法:通过Stacking融合模型框架建立一种随钻方位伽马预测模型,该模型以随机森林、消去树、支持向量机、K近邻、... 由于实时随钻传输速率等问题的影响,方位伽马信息不足,增加了后续地层分析的工作的难度。针对上述问题,提出了一种新的预测方法:通过Stacking融合模型框架建立一种随钻方位伽马预测模型,该模型以随机森林、消去树、支持向量机、K近邻、长短期记忆网络为基学习器,以GBDT为元学习器,对随钻方位伽马数据进行预测。实验表明,该方法预测效果优于样条插值及单一学习器,能够有效提升方位伽马数据预测的精度,在实际生产中有良好的应用。 展开更多
关键词 随钻测井 机器学习 stackING 集成学习 数据预测
下载PDF
代价敏感的KPCA-Stacking不均衡数据分类算法 被引量:4
14
作者 曹婷婷 张忠林 《计算机工程与科学》 CSCD 北大核心 2021年第3期525-533,共9页
代价敏感学习是解决不均衡数据分类问题的一个重要策略,数据特征的非线性也给分类带来一定困难,针对此问题,结合代价敏感学习思想与核主成分分析KPCA提出一种代价敏感的Stacking集成算法KPCA-Stacking。首先对原始数据集采用自适应综合... 代价敏感学习是解决不均衡数据分类问题的一个重要策略,数据特征的非线性也给分类带来一定困难,针对此问题,结合代价敏感学习思想与核主成分分析KPCA提出一种代价敏感的Stacking集成算法KPCA-Stacking。首先对原始数据集采用自适应综合采样方法(ADASYN)进行过采样并进行KPCA降维处理;其次将KNN、LDA、SVM、RF按照贝叶斯风险最小化原理转化为代价敏感算法作为Stacking集成学习框架的初级学习器,逻辑回归作为元学习器。在5个公共数据集上对比J48决策树等10种算法,结果表明代价敏感的KPCA-Stacking算法在少数类识别率上有一定提升,比单个模型的整体分类性能更优。 展开更多
关键词 不均衡数据 代价敏感 KPCA stackING ADASYN过采样 分类
下载PDF
基于加权Stacking集成学习的Tor匿名流量识别方法 被引量:7
15
作者 王曦锐 芦天亮 +1 位作者 张建岭 丁锰 《信息网络安全》 CSCD 北大核心 2021年第12期118-125,共8页
Tor网络常被犯罪分子用来从事各类违法活动,因此对Tor流量进行高效识别对网络监管和打击犯罪有着重要意义。文章针对真实环境中Tor流量稀疏及识别准确率不高的问题,基于集成学习思想,提出一种加权Stacking模型的Tor流量识别方法。基于... Tor网络常被犯罪分子用来从事各类违法活动,因此对Tor流量进行高效识别对网络监管和打击犯罪有着重要意义。文章针对真实环境中Tor流量稀疏及识别准确率不高的问题,基于集成学习思想,提出一种加权Stacking模型的Tor流量识别方法。基于数据流层面提取流量的时间相关性特征,文章计算信息增益筛选最大的前14个特征构成输入数据集,对KNN、SVM和XGBoost进行不同的加权改进并作基学习器,XGBoost作为元学习器构建两层Stacking模型。在公开数据集上与10种其他算法对比,实验结果表明,文章提出的识别模型在准确率上优于大部分算法并且拥有较低的漏报率,更符合真实网络环境中Tor流量识别的要求。 展开更多
关键词 匿名网络 TOR 不平衡数据 stackING
下载PDF
基于CheerIO的MEAN Stack气象数据网络爬虫研究 被引量:6
16
作者 胡戎 冯仲科 蒋君志伟 《农业机械学报》 EI CAS CSCD 北大核心 2016年第6期275-282,共8页
为全面、即时搜集分散于互联网上游离的气象数据,满足各行业、各领域、各学科科研部门的数据需求,提出使用Google MEAN Stack全栈技术开发基于Cheer IO的高效定向爬虫,充分利用Node.js高性能I/O的特性,实现气象信息的快速搜集。同时将... 为全面、即时搜集分散于互联网上游离的气象数据,满足各行业、各领域、各学科科研部门的数据需求,提出使用Google MEAN Stack全栈技术开发基于Cheer IO的高效定向爬虫,充分利用Node.js高性能I/O的特性,实现气象信息的快速搜集。同时将技术栈与地理信息系统技术、数据可视化技术以及云计算技术相结合,通过地理信息系统的数据存储、查询、自动制图、统计分析等功能对信息进行分析和处理,在阿里云平台上构建了一个能抓取并存储海量数据、提供实时气象数据的应用系统,提供便捷的检索、查询功能,有较强的实用性。本文结合气象数据爬虫的解决方案,对MEAN Stack数据爬虫的开发框架、项目架构以及爬虫核心技术(抓取目标策略、网页分析算法、多线程并发运算等)进行了深入分析研究与实现。 展开更多
关键词 CheerIO MEAN stack 定向爬虫 大气气象数据
下载PDF
基于多源数据和Stacking-SHAP方法的山地丘陵区土地覆被分类 被引量:1
17
作者 周亚男 陈绘 刘洪斌 《农业工程学报》 EI CAS CSCD 北大核心 2022年第23期213-222,共10页
山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数... 山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数字高程图中提取遥感、气候、土壤和地形四类特征变量,设计多种变量组合方案,结合Stacking算法,探讨不同类型变量在山区地物识别中的效用,并对比Stacking最佳方案与支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和极端梯度回归(eXtreme Gradient Boosting,XGBoost)算法的分类精度,评价Stacking方法在山区地物信息提取中的性能。同时,引入SHAP方法,量化Stacking模型中各特征变量的重要性。结果表明:在仅以遥感变量为基础方案时,山区土地覆被分类精度最低;在分别加入气候、土壤和地形变量后,总体精度、Kappa系数和F1分数均有所提高,其中旱地、水田和园地分类精度的提升幅度较大。基于Stacking算法结合所有类型特征变量的方案达到了最佳的分类精度,其总体精度、Kappa系数和F1分数分别为96.61%、0.96和94.81%,分类精度优于相同特征下的SVM、RF和XGBoost。SHAP方法可量化Stacking模型中特征变量的全局以及局部重要性,明确各变量对不同地物类型识别的相对贡献,为山区土地覆被分类的变量选择及优化提供有价值的信息。该研究可为机器学习协助复杂景观地区土地覆被制图研究提供技术支持和理论参考。 展开更多
关键词 遥感 多源数据 土地覆被分类 stacking算法 SHAP方法 山地丘陵区
下载PDF
基于Stacking策略的稳定性分类器组合模型研究 被引量:10
18
作者 吴挡平 张忠林 曹婷婷 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1045-1049,共5页
针对Bagging、AdaBoost等通用的集成算法对于稳定性分类算法集成效果不是很好的问题,提出了基于Stacking策略的稳定性分类器组合算法.该算法通过构造一个两层的叠加式框架结构,融合数据降维技术处理两层分类器的输入特征,对4种稳定性分... 针对Bagging、AdaBoost等通用的集成算法对于稳定性分类算法集成效果不是很好的问题,提出了基于Stacking策略的稳定性分类器组合算法.该算法通过构造一个两层的叠加式框架结构,融合数据降维技术处理两层分类器的输入特征,对4种稳定性分类器(LDA、GLM、SVM、KNN)进行组合学习.利用UCI数据集测试算法的性能.实验结果表明:相比一些集成算法(RF、Bagging、C50、AdaBoost),基于Stacking策略稳定性分类器组合模型可以获得更高的分类准确率.同时也为二分类的分类模型提供了一个可行的参考方法. 展开更多
关键词 stacking方法 稳定性分类器 分类精度 数据降维技术 集成算法
下载PDF
基于Stacking算法实现信贷不平衡数据分类 被引量:1
19
作者 郑利沙 黄浩 《数据挖掘》 2020年第4期254-260,共7页
随着大数据技术在应用层面的日渐普及,机器学习、深度学习相关算法在金融风控行业的应用得到了积极的探索。本文基于开源的信用卡数据(该数据具有样本比例极度不平衡的特点),比较不同采样方法对类别不平衡数据分类结果的影响,并应用集... 随着大数据技术在应用层面的日渐普及,机器学习、深度学习相关算法在金融风控行业的应用得到了积极的探索。本文基于开源的信用卡数据(该数据具有样本比例极度不平衡的特点),比较不同采样方法对类别不平衡数据分类结果的影响,并应用集成学习算法Stacking融合多个基分类器训练数据,得到更为稳健的分类模型,有效避免了过拟合现象的发生。 展开更多
关键词 样本不平衡数据 集成学习 stackING
下载PDF
计及机理机制的Stacking集成光伏发电预测 被引量:4
20
作者 李智 丁津津 +2 位作者 陈凡 伍骏杰 樊磊 《科学技术与工程》 北大核心 2023年第19期8212-8217,共6页
准确地光伏预测对电力调度、容量分析和机组组合至关重要。现有的数据驱动预测算法在计算速度和预测精度上有一定的提升,但未能考虑光伏发电的内在机理,存在泛化的风险。针对上述问题,提出了一种基于Stacking框架的机理模型和数据驱动... 准确地光伏预测对电力调度、容量分析和机组组合至关重要。现有的数据驱动预测算法在计算速度和预测精度上有一定的提升,但未能考虑光伏发电的内在机理,存在泛化的风险。针对上述问题,提出了一种基于Stacking框架的机理模型和数据驱动结合的预测模型。其中,光伏发电机理模型将嵌入Stacking框架一层预测结构,构成基于长短期记忆神经网络(long short-term memory,LSTM)、极度梯度提升树(extreme gradient boosting,XGBoost)和机理模型的并行预测学习器。机理模型将光伏发电限制在一个合理的范围内,作为数据驱动模型的预测约束。所提出的模型能够从机理模型中提取有用的固有信息,并利用数据分析的能力提取历史数据中的非线性关系。基于安徽省某地区实际数据分析,所提模型相比传统数据驱动方法具有更高的精度。 展开更多
关键词 光伏功率预测 数据驱动 机理模型 stacking集成框架
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部