期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
支持在线学习的增量式极端随机森林分类器 被引量:55
1
作者 王爱平 万国伟 +1 位作者 程志全 李思昆 《软件学报》 EI CSCD 北大核心 2011年第9期2059-2074,共16页
提出了一种增量式极端随机森林分类器(incremental extremely random forest,简称IERF),用于处理数据流,特别是小样本数据流的在线学习问题.IERF算法中新到达的样本将被存储到相应的叶节点,并通过Gini系数来确定是否对当前叶节点进行分... 提出了一种增量式极端随机森林分类器(incremental extremely random forest,简称IERF),用于处理数据流,特别是小样本数据流的在线学习问题.IERF算法中新到达的样本将被存储到相应的叶节点,并通过Gini系数来确定是否对当前叶节点进行分裂扩展,在给定有限数量,甚至是少量样本的情况下,IERF算法能够快速高效地完成分类器的增量构造.UCI数据集的实验证明,提出的IERF算法具有与离线批量学习的极端随机森林(extremely random forest,简称ERF)算法相当甚至更优的性能,在适度规模的样本集上,性能优于贪婪决策树重构算法和其他几种主要的增量学习算法.最后,提出的IERF算法被应用于解决视频在线跟踪(包含多目标跟踪)问题,基于多个真实视频数据的实验充分验证了算法的有效性和稳定性. 展开更多
关键词 在线学习 增量学习 极端随机森林分类器
下载PDF
基于极端随机森林的大型风电机组发电机故障检测 被引量:5
2
作者 陈宇韬 唐明珠 +2 位作者 吴华伟 赵琪 匡子杰 《湖南电力》 2019年第6期45-51,共7页
针对风电机组海量运行数据中故障检测率低和实时性差的问题,提出基于极端随机森林的大型风电机组发电机故障检测方法。该方法先利用Pearson相关性分析剔除线性相关性极弱的变量和非主要特征中的冗余变量,降低样本维度。利用最大信息系... 针对风电机组海量运行数据中故障检测率低和实时性差的问题,提出基于极端随机森林的大型风电机组发电机故障检测方法。该方法先利用Pearson相关性分析剔除线性相关性极弱的变量和非主要特征中的冗余变量,降低样本维度。利用最大信息系数获取主要特征参数的相关系数,消除冗余变量,从而提高计算效率和故障检测精度。将基于极端随机森林的分类方法用于大型双馈风力发电机的故障检测。实验结果表明,与经典随机森林方法相比,在风电机组发电机海量数据集上,该方法具有更低的漏报率、误报率和更好的实时性。 展开更多
关键词 极端随机森林 Pearson相关性分析 最大信息系数 故障检测 发电机 风力发电机组
下载PDF
基于IBOA-ERF的风力发电机齿轮箱故障检测
3
作者 刘国旭 周广凯 赵竞一 《沈阳工程学院学报(自然科学版)》 2024年第2期15-25,37,共12页
针对风力发电机齿轮箱故障检测模型参数优化难度大的问题,提出一种基于改进的蝶形优化算法的极端随机森林故障检测模型。将故障检测模型虚警率与漏警率的代数和构造为适应度函数,改进个体初始位置和位置更新策略。引入混沌映射策略代替... 针对风力发电机齿轮箱故障检测模型参数优化难度大的问题,提出一种基于改进的蝶形优化算法的极端随机森林故障检测模型。将故障检测模型虚警率与漏警率的代数和构造为适应度函数,改进个体初始位置和位置更新策略。引入混沌映射策略代替原有的种群初始化方法,增强初始种群分布的随机性。提出一种自适应惯性权重因子,结合鸽群优化算法的地标算子更新种群位置迭代方程,加快收敛速度,提高蝴蝶优化算法的多样性和鲁棒性。采用局部搜索阶段和全局搜索阶段的动态切换方法,实现全局搜索与局部搜索的动态平衡,避免陷入局部最优。建立极端随机森林故障检测模型,利用改进的蝶形优化算法获取最优参数,实现所提模型在高维数据下具有良好的鲁棒性和泛化性的快速响应。与其他优化算法相比,所提风力发电机组齿轮箱故障检测方法具有较低的误报率和漏报率。 展开更多
关键词 故障检测 蝴蝶优化算法 极端随机森林 风力发电机 齿轮箱
下载PDF
基于机器学习的星载短波红外CO_(2)柱浓度估算 被引量:4
4
作者 李静波 张莹 盖荣丽 《中国环境科学》 EI CAS CSCD 北大核心 2023年第4期1499-1509,共11页
利用OCO-2卫星遥感数据、全球碳柱总量观测网(TCCON)站观测数据、NDVI归一化植被指数数据、ERA5大气数据,采用决策树和集成学习(XGBoost、普通随机森林、极端随机森林、梯度提升)对二CO_(2)平均柱浓度进行预测.通过相关性分析、特征选... 利用OCO-2卫星遥感数据、全球碳柱总量观测网(TCCON)站观测数据、NDVI归一化植被指数数据、ERA5大气数据,采用决策树和集成学习(XGBoost、普通随机森林、极端随机森林、梯度提升)对二CO_(2)平均柱浓度进行预测.通过相关性分析、特征选择与特征提取,建立模型预测CO_(2)平均柱浓度,再与TCCON站点的地基观测数据进行比对.通过分析不同模型(决策树、XGBoost、普通随机森林、极端随机森林、梯度提升)预测的结果,发现使用极端随机森林回归模型预测CO_(2)平均柱浓度的精度最高,R^(2)、均方根误差(RMSE)、平均绝对误差(MAE)、平均相对误差(MRE)分别为:0.953、0.492×10^(-6)、0.260×10^(-6)、0.063%,其余模型次之,因此对极端随机森林回归模型的预测性能随自身参数的影响进行了分析,结果表明,在误差允许的范围内(±2×10^(-6)),极端随机森林回归模型和梯度提升回归模型预测的准确率一样,都为98.10%.由于CO_(2)的背景浓度较高,而边界层内CO_(2)浓度的空间差异相对较小,因此需要进一步缩小误差的范围,在±1×10^(-6)误差范围内,极端随机森林回归模型和梯度提升预测的准确率分别为91.82%和90.51%.所以采用极端随机森林算法预测CO_(2)柱浓度的结果更好,精度更高,符合CO_(2)预测的精度要求. 展开更多
关键词 二氧化碳平均柱浓度 集成学习 极端随机森林 梯度提升 决策树 XGBoost 短波红外
下载PDF
基于奇异值分解与卡尔曼滤波修正多位置NWP的短期风电功率预测 被引量:2
5
作者 王丽婕 刘田梦 +3 位作者 王勃 郝颖 王铮 张元鹏 《太阳能学报》 EI CAS CSCD 北大核心 2022年第12期392-398,共7页
考虑到数值天气预报网格点位置和系统误差对短期风电功率预测精度的影响,提出一种基于奇异值分解与卡尔曼滤波修正多位置数值天气预报的短期风电功率预测模型。首先通过奇异值分解对多位置数值天气预报数据进行特征提取与降维处理;然后... 考虑到数值天气预报网格点位置和系统误差对短期风电功率预测精度的影响,提出一种基于奇异值分解与卡尔曼滤波修正多位置数值天气预报的短期风电功率预测模型。首先通过奇异值分解对多位置数值天气预报数据进行特征提取与降维处理;然后使用卡尔曼滤波方法修正数值天气预报风速数据,降低数值天气预报的系统误差;最后基于极端随机森林算法,利用修正的数值天气预报数据搭建短期风电功率预测模型。通过对某风电场进行仿真,并与单位置、未降维、未修正模型比较,结果表明降维修正模型的预测效果最好,平均误差和均方根误差分别为7.94%和9.96%。 展开更多
关键词 风电功率预测 数值天气预报 奇异值分解 卡尔曼滤波 极端随机森林
下载PDF
基于在线增量学习的实时人脸跟踪算法 被引量:1
6
作者 包芳 张炎凯 王士同 《计算机应用与软件》 CSCD 2016年第5期270-273,297,共5页
提出基于在线增量式极端随机森林分类器的实时人脸跟踪算法。算法用在线极端随机森林分类器实现基于检测的跟踪,并结合动态目标框架和P-N学习矫正检测的错误。实验结果表明,该算法能够在不确定背景下对任意人脸实现较长时间段内的稳定... 提出基于在线增量式极端随机森林分类器的实时人脸跟踪算法。算法用在线极端随机森林分类器实现基于检测的跟踪,并结合动态目标框架和P-N学习矫正检测的错误。实验结果表明,该算法能够在不确定背景下对任意人脸实现较长时间段内的稳定快速的实时跟踪,并能有效排除背景等的干扰,效果较好。 展开更多
关键词 在线增量学习 极端随机森林 P-N学习 动态目标框架 实时人脸跟踪
下载PDF
基于机器学习训练金属离子吸附能预测模型的研究 被引量:2
7
作者 张瑞鸿 魏鑫 +1 位作者 卢占会 艾玥洁 《无机材料学报》 SCIE EI CAS CSCD 北大核心 2021年第11期1178-1184,共7页
本研究通过密度泛函理论对氧化石墨烯和金属离子的吸附行为进行理论模拟。基于机器学习方法训练预测模型的过程中,缺失值采用推荐系统中广泛使用的奇异值分解方法处理,并用梯度提升机解释了影响吸附能的重要因素。结果发现吸附体系中存... 本研究通过密度泛函理论对氧化石墨烯和金属离子的吸附行为进行理论模拟。基于机器学习方法训练预测模型的过程中,缺失值采用推荐系统中广泛使用的奇异值分解方法处理,并用梯度提升机解释了影响吸附能的重要因素。结果发现吸附体系中存在九种特征可为吸附能提供90%的累积重要性,分别为离子半径、零点振动能量、密立根电荷、沸点、偶极矩、原子量、摩尔定容热容、自旋多重度和键长。定量评估了六种回归方法的预测精度,包括支持向量回归、岭回归、随机森林、极端随机森林、极端梯度提升和轻梯度提升机。结果表明,机器学习方法可提供足够的吸附能预测准确性,其中极端随机森林方法表现出最优的预测性能,均方误差仅为0.075。该模型用于香兰素吸附金属离子的测试,验证了基于机器学习训练金属离子吸附能预测模型的可行性,但仍需进一步提高其泛化能力。本研究基于机器学习预测吸附能,简化预测过程、节省计算时间,可为吸附去除金属离子的理论和实验研究提供参考。 展开更多
关键词 机器学习 密度泛函理论 吸附能 金属离子 极端随机森林
下载PDF
基于图像识别的高铁接触网紧固件开口销故障分类方法 被引量:2
8
作者 王健 罗隆福 +2 位作者 邹津海 朱胜蓝 叶威 《电气化铁道》 2020年第2期45-49,共5页
针对高铁接触网紧固件开口销缺失、松脱和安装不规范等现象,基于图像识别理论提出一种开口销故障等级划分方案和基于机器学习的开口销分类方法。在分类阶段,首先采用SSD算法对接触网4C系统的回图进行开口销定位与识别,并采用Deeplabv3+... 针对高铁接触网紧固件开口销缺失、松脱和安装不规范等现象,基于图像识别理论提出一种开口销故障等级划分方案和基于机器学习的开口销分类方法。在分类阶段,首先采用SSD算法对接触网4C系统的回图进行开口销定位与识别,并采用Deeplabv3+进行语义分割,最后采用SURF特征检测器对语义分割图片提取关键点,再利用视觉词袋模型BOVW生成视觉码本,利用视觉码本对极端随机森林ERF进行训练并生成模型。极端随机森林通过网格搜索和交叉验证(Gridsearch+CV)实现参数调优,使用ERF模型对开口销图片分类。采用该方法对实际线路的图片进行实验检测,准确率达到了93.2%,且节省人力,能有效保障高铁的供电安全。 展开更多
关键词 图像识别 开口销故障分类 语义分割 极端随机森林 SURF算法
下载PDF
基于集成学习的房租预测研究
9
作者 马涛 刘宁宁 《金融》 2019年第6期586-594,共9页
住房租赁市场的快速发展使得人们对房屋租赁信息的需求不断增加,对房屋租金关注持续变高。租房市场供给两端一直存在着信息不对称的问题,房租是由诸多方面因素共同决定的,而现有的基于单一算法的房租预测模型,其预测精度往往受模型性能... 住房租赁市场的快速发展使得人们对房屋租赁信息的需求不断增加,对房屋租金关注持续变高。租房市场供给两端一直存在着信息不对称的问题,房租是由诸多方面因素共同决定的,而现有的基于单一算法的房租预测模型,其预测精度往往受模型性能好坏、噪声、以及过度拟合风险等因素影响。本文基于堆叠集成策略,融合Random Forest Regressor、Extra Trees Regressor、LightGBM三个基模型,建立了集成学习的房租预测模型。研究结果表明,本方法预测精度明显优于任一单一预测模型,提高了预测的准确性和稳定性,证实了该模型在房租预测上的有效性。 展开更多
关键词 集成学习 房租预测 随机森林 极端随机森林
下载PDF
基于网格搜索优化ERF模型的风电机组异常状态预警 被引量:4
10
作者 马良玉 赵尚羽 +1 位作者 孙佳明 於世磊 《热能动力工程》 CAS CSCD 北大核心 2022年第2期160-166,共7页
提出一种基于网格搜索优化(GS)极端随机森林(ERF)模型的风电机组性能预测及异常状态预警方法。首先,采用离散度分析法清洗噪声和异常工况数据,以获取建模用正常运行状态数据。其次,通过分析风机运行与控制原理,选取与转速和功率具有较... 提出一种基于网格搜索优化(GS)极端随机森林(ERF)模型的风电机组性能预测及异常状态预警方法。首先,采用离散度分析法清洗噪声和异常工况数据,以获取建模用正常运行状态数据。其次,通过分析风机运行与控制原理,选取与转速和功率具有较高相关度的特征参数作为模型输入,完成预测模型训练和验证,并对比ERF模型与其它几种模型的建模效果。最后,基于滑动窗口算法确定窗宽为10 min,增量为1 min,计算窗内数据的平均绝对误差作为状态指标,采用非参数估计确定发电机转速阈值为33.78,有功功率阈值为55.07。借助某风电机组真实历史运行数据和故障样本,验证异常状态预警方法,结果表明,该方法能够对即将发生的故障进行检测,预警时间比实际故障时间有效提前。 展开更多
关键词 风电机组 极端随机森林 异常工况预警 滑动窗口 网格搜索
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部