期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
基于K折交叉验证的SVM隧道围岩分级判别 被引量:22
1
作者 汪学清 刘爽 +1 位作者 李秋燕 马凯彬 《矿冶工程》 CAS CSCD 北大核心 2021年第6期126-128,133,共4页
针对隧道施工期间围岩分级因样本数较少存在分类结果可靠性较低的问题,建立基于K折交叉验证的支持向量机判别模型。依据TSP303系统确定判别指标并建立判别指标体系;根据围岩勘测情况,将围岩分为4个等级,并作为输出变量;选取40组样本数... 针对隧道施工期间围岩分级因样本数较少存在分类结果可靠性较低的问题,建立基于K折交叉验证的支持向量机判别模型。依据TSP303系统确定判别指标并建立判别指标体系;根据围岩勘测情况,将围岩分为4个等级,并作为输出变量;选取40组样本数据训练模型、10组样本数据测试模型,结果表明,10组样本中仅1组样品判别错误,准确率达到90%。研究成果为隧道围岩的分级判别提供了新方法。 展开更多
关键词 隧道围岩 围岩分级 分级判别 k折交叉验证 支持向量机
下载PDF
基于K折交叉验证Beta分布的AUC度量的置信区间 被引量:12
2
作者 王钰 赵晓艳 +1 位作者 杨杏丽 李济洪 《系统科学与数学》 CSCD 北大核心 2020年第9期1564-1577,共14页
在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是... 在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是,这些对称置信区间往往表现出低的置信度或长的区间长度,从而容易导致激进的(liberal)统计推断结果.通过对AUC度量的理论分析,发现AUC度量的真实分布实际上是非对称的,此时简单使用对称分布去近似它显然是不合适的.因此,针对二类分类问题,本文提出了一种新的基于K折交叉验证Beta分布的AUC度量的非对称置信区间,在模拟和真实数据实验上验证了提出的置信区间相对于传统的基于K折交叉验证t分布的对称置信区间的优越性. 展开更多
关键词 AUC度量 置信区间 BETA分布 k折交叉验证
原文传递
基于正则化KL距离的交叉验证折数K的选择 被引量:5
3
作者 褚荣燕 王钰 +1 位作者 杨杏丽 李济洪 《计算机技术与发展》 2021年第3期52-57,共6页
在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不... 在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不是这样。因此,可以通过度量训练集和测试集的分布一致性来进行K折交叉验证折数K的选择。直观地,KL(Kullback-Leibler)距离是一种合适的度量方法,因为它度量了两个分布之间的差异。然而直接基于KL距离进行K的选择时,从多个数据实验结果发现随着K的增加KL距离也在增大,显然这是不合适的。为此,提出了一种基于正则化KL距离的K折交叉验证折数K的选择准则,通过最小化此正则KL距离来选择合适的折数K。进一步多个真实数据实验验证了提出准则的有效性和合理性。 展开更多
关键词 k折交叉验证 k的选择 kL(kullback-Leibler)距离 正则化 机器学习
下载PDF
基于异质聚类与Stacking的双集成光伏发电功率预测 被引量:6
4
作者 武新章 王泽宇 +3 位作者 代伟 赵子巍 郭苏杭 张冬冬 《电网技术》 EI CSCD 北大核心 2023年第1期275-283,共9页
光伏功率预测是实现能源优化分配与电网稳定运行的关键基础。然而传统方法中数据预处理不精细以及预测算法对数据挖掘不到位的问题,往往致使准确率不足。针对上述问题,该文提出基于聚类集成和预测集成的双集成光伏功率预测方法,以异质... 光伏功率预测是实现能源优化分配与电网稳定运行的关键基础。然而传统方法中数据预处理不精细以及预测算法对数据挖掘不到位的问题,往往致使准确率不足。针对上述问题,该文提出基于聚类集成和预测集成的双集成光伏功率预测方法,以异质集成的方式提升了气象分类和功率预测的精度。首先,基于重标记法和投影法,构建了融合Kmeans、高斯混合模型(gaussian mixture model, GMM)、AGNES(agglomerative nesting)和BIRCH(balanced iterative reducing and clustering using hierarchies)4种异质算法的聚类集成框架,并依据滑动时间窗口筛选离群日,建立典型气象模型。其次,基于Stacking集成学习框架,在采用k折交叉验证法规避过拟合的基础上,构建由门控循环单元(gated recurrent unit,GRU)、随机森林(random forest,RF)、XGBoost和Light GBM组成的预测集成模型,深度挖掘光伏数据的潜在规律。最后以澳大利亚某光伏电站为例进行仿真,结果表明双集成功率预测的准确性比传统模型有较大提升,证明了聚类集成和预测集成的有效性。 展开更多
关键词 光伏功率预测 聚类集成 异质集成 STACkING k折交叉验证法
下载PDF
基于交叉验证的集成学习误差分析 被引量:4
5
作者 路佳佳 《计算机系统应用》 2023年第1期302-309,共8页
目前关于集成学习的泛化性能的研究已取得很大成功,但是关于集成学习的误差分析还需要进一步研究.考虑交叉验证在统计机器学习中对于模型性能评估有重要应用,为此,应用组块3×2交叉验证和k折交叉验证方法为每个样本点进行赋予权重... 目前关于集成学习的泛化性能的研究已取得很大成功,但是关于集成学习的误差分析还需要进一步研究.考虑交叉验证在统计机器学习中对于模型性能评估有重要应用,为此,应用组块3×2交叉验证和k折交叉验证方法为每个样本点进行赋予权重的预测值的集成,并进行误差分析.在模拟数据和真实数据上进行实验,结果表明基于组块3×2交叉验证的集成学习预测误差小于单个学习器的预测误差,并且集成学习的方差比单个学习器方差小.与基于k折交叉验证的集成学习方法相比,基于组块3×2交叉验证的泛化误差小于基于k折交叉验证的泛化误差,说明基于组块3×2交叉验证的集成学习模型稳定性好. 展开更多
关键词 k折交叉验证 组块3×2交叉验证 集成学习 回归算法 模拟实验 预测模型
下载PDF
基于DCNN的ZPW-2000A无绝缘轨道电路故障诊断研究
6
作者 林俊亭 牛鹏远 《电子测量与仪器学报》 CSCD 北大核心 2024年第6期171-180,共10页
针对ZPW-2000A无绝缘轨道电路故障发生的多样性和不确定性导致的故障诊断效率低的问题,从故障特征提取和故障分类的角度出发,提出一种基于深度卷积神经网络(DCNN)的轨道电路故障诊断方法。通过故障分析总结出12种轨道电路故障状态,并将... 针对ZPW-2000A无绝缘轨道电路故障发生的多样性和不确定性导致的故障诊断效率低的问题,从故障特征提取和故障分类的角度出发,提出一种基于深度卷积神经网络(DCNN)的轨道电路故障诊断方法。通过故障分析总结出12种轨道电路故障状态,并将不同故障状态下的轨道电路监测数据进行标准化处理,作为DCNN模型的输入。模型采用卷积-池化结构提取轨道电路的关键特征并滤除冗余特征。BP神经网络作为模型的全连接层,并结合Softmax函数进行故障分类。通过k折交叉验证法优化模型结构,确定最佳模型。实验结果表明,采用4层卷积-池化层结构的轨道电路故障诊断模型在诊断准确率方面达到了98.48%,较同为最优模型的长短期记忆网络(LSTM)模型、深度前馈网络(DFN)模型、双向长短时记忆网络模型(BiLSTM)与CNN-LSTM组合模型分别提升了6.06%,6.06%,3.33%与2.27%,训练收敛速度分别快了大约1250、4250、1250与1450次,且训练时的损失波动更小。本研究提升了轨道电路故障诊断效率,为轨道电路的故障诊断任务提供了一种新的有效方法。 展开更多
关键词 无绝缘轨道电路 深度卷积神经网络 BP神经网络 k折交叉验证 故障诊断
下载PDF
基于时频域融合和ECA-1DCNN的航空串联故障电弧检测
7
作者 闫锋 苏忠允 《科学技术与工程》 北大核心 2024年第5期1937-1945,共9页
为了快速准确地检测航空交流线路中出现的串联故障电弧,提出了一种基于时频域融合和加入高效注意力机制(efficient channel attention, ECA)的一维卷积神经网络(one-dimensional convolutional neural network, 1DCNN)的故障检测算法。... 为了快速准确地检测航空交流线路中出现的串联故障电弧,提出了一种基于时频域融合和加入高效注意力机制(efficient channel attention, ECA)的一维卷积神经网络(one-dimensional convolutional neural network, 1DCNN)的故障检测算法。首先,搭建航空交流电弧故障实验平台,负载选择多类型、多参数值进行电流信号的采集;其次,为了保留更多的故障信息,分析其特征频段,经过大量数据验证,航空串联电弧在发生时,1 000~4 000 Hz分量具有一定的占比,因此将原始信号与特征频段进行融合,融合后的一维数据作为模型输入;最后,搭建ECA-1DCNN检测模型,进行训练,并通过K折交叉验证模型的有效性,得到测试集平均准确率为97.96%。该方法网络层数较少,计算快速,避免了复杂时频域计算过程,较为智能,对航空串联电弧检测装置的研究提供了理论参考。 展开更多
关键词 串联电弧 高效注意力机制 特征频段 一维卷积神经网络 k折交叉验证
下载PDF
基于多异学习器融合Stacking集成学习的窃电检测 被引量:12
8
作者 游文霞 李清清 +3 位作者 杨楠 申坤 李文武 吴泽黎 《电力系统自动化》 EI CSCD 北大核心 2022年第24期178-186,共9页
针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5... 针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5种窃电方法模拟6种窃电行为模式;其次,采用合成少数类过采样技术(SMOTE)对不平衡的用电数据进行处理,并利用K折交叉验证法对平衡后的训练集进行划分以缓解因重复学习造成的过拟合;然后,使用评价指标和多样性度量优选模型的不同初级学习器和元学习器,构建融合不同学习器优势和差异的Stacking集成学习窃电检测模型;最后,算例对比分析结果表明所提窃电检测模型能有效解决用电数据类别不平衡,充分发挥不同学习器的优势,评价指标良好。 展开更多
关键词 Stacking结合策略 集成学习 窃电检测 合成少数类过采样技术 k折交叉验证
下载PDF
基于深度神经网络的船舶系泊受灾预报研究
9
作者 张庆丰 陈明 +1 位作者 麻云平 李楷 《应用科技》 CAS 2024年第3期15-22,共8页
为避免船舶系泊于码头时遭受恶劣海况而发生的缆绳断裂等问题,通过深度神经网络建立了系泊受灾预测模型,来快速获得系泊船舶所有系泊缆绳的受力。模型输入特征数量为11个,涵盖风、浪、流、涌、船舶吃水及船舶系泊方式等基本参数,输出特... 为避免船舶系泊于码头时遭受恶劣海况而发生的缆绳断裂等问题,通过深度神经网络建立了系泊受灾预测模型,来快速获得系泊船舶所有系泊缆绳的受力。模型输入特征数量为11个,涵盖风、浪、流、涌、船舶吃水及船舶系泊方式等基本参数,输出特征为系泊系统中所有缆绳的受力。对模型的测试结果表明,相比于径向基神经网络,模型具有较高的预测精度,每组测试工况下的平均相对误差不超过10%。可将该模型用于在恶劣海况来临前对系泊系统的安全评估和风险分析,有助于相关人员及时采取应对措施,从而保证系泊系统的稳定性与可靠性。 展开更多
关键词 码头系泊 缆绳受力 非线性回归预测 深度神经网络 批正则化 k折交叉验证 径向基神经网络 安全评估
下载PDF
基于真实世界数据研究注射用伏立康唑致急性肾损伤的危险因素建立预测模型及验证
10
作者 王书波 焦婷婷 +2 位作者 董洪亮 王百聆 李辉 《中国药物警戒》 2024年第5期567-571,579,共6页
目的 基于真实世界数据,分析注射用伏立康唑发生急性肾损伤(AKI)的危险因素,建立预测模型并进行内部验证和外部验证,为临床安全用药提供参考。方法 收集2020年1月1日至2023年6月30日在某院注射用伏立康唑治疗≥3 d,且年龄≥18岁患者的... 目的 基于真实世界数据,分析注射用伏立康唑发生急性肾损伤(AKI)的危险因素,建立预测模型并进行内部验证和外部验证,为临床安全用药提供参考。方法 收集2020年1月1日至2023年6月30日在某院注射用伏立康唑治疗≥3 d,且年龄≥18岁患者的病历资料。其中2023年1月1日之前出院的患者作为建模组,之后的患者作为验证组。提取患者的基本信息、实验检查指标、临床诊断、联合用药等数据。根据是否发生AKI将患者分为AKI组和非AKI组。采用多因素Logistic回归法分析注射用伏立康唑致AKI的危险因素,并建立预测模型。通过受试者工作特征(ROC)、ROC曲线下面积(AUC)及Hosmer-Lemeshow检验(H-L检验)评估区分度和校准度,并进行内部验证和外部数据验证检验该模型的价值。结果 共625例(男性371例,女性254例)患者纳入研究。其中建模组489例(男性296例,女性193例),发生AKI 87例;验证组136例(男性75例,女性61例),发生AKI 32例。建模组多因素Logistic回归分析显示血流感染、肾脏疾病、心血管疾病、使用利尿剂是发生AKI危险因素,肌酐清除率(CrCl)和血清白蛋白(Alb)是保护因素。用上述影响因素建立Logistic回归方程,经变换后得到预测因子Y=0.735X_(1)+0.707X_(2)+0.701X_(3)+0.683X_(4)-0.062 X_(5)-0.008X_(6)。X_(1)~X_(6)分别表示使用利尿剂、心血管疾病、肾脏疾病、血流感染、Alb、CrCl。经ROC曲线分析验证,模型组AUC为0.750(95%CI:0.692~0.808,P<0.0 01),H-L检验χ^(2)值为7.535,P=0.480;验证组AUC为0.821(95%CI:0.749~0.893,P<0.001),H-L检验χ^(2)值为13.924,P=0.084,提示该模型具有较好的区分度。模型的约登指数最大值为0.389,对应ROC曲线切点最佳值为-0.976,敏感度为56.3%,特异度为82.6%。k折交叉验证提示该模型的准确率较好(Accuracy=0.823),一致性较低(Kappa=0.191)。结论 CrCl、Alb、血流感染、肾脏疾病、心血管疾病、利尿剂是注射用伏立康唑发生AKI的独立影响因素。基于这6个变量建立AKI的预测模型具有一定的区分度,可在一定程度上辅助临床治疗决策,有利于临床安全用药。 展开更多
关键词 伏立康唑 注射用 急性肾损伤 危险因素 真实世界数据 LOGISTIC回归 k折交叉验证 预测模型
下载PDF
具有趋势项的残差自回归移动平均模型的修正预测
11
作者 谢飞 武新乾 《应用数学进展》 2024年第3期1027-1035,共9页
为了研究新数据产生背景下时序模型的预测问题,本文针对含多项式趋势项的残差ARMA模型探讨了无需重新拟合的不变模型修正预测法。采用K折交叉验证,并以平均RMSE作为评价指标,确定最佳的多项式拟合次数。基于最小二乘法和线性时间序列建... 为了研究新数据产生背景下时序模型的预测问题,本文针对含多项式趋势项的残差ARMA模型探讨了无需重新拟合的不变模型修正预测法。采用K折交叉验证,并以平均RMSE作为评价指标,确定最佳的多项式拟合次数。基于最小二乘法和线性时间序列建模方法进行了数值模拟和实证分析。结果显示,与需要重新拟合的改变模型修正预测法相比,无需重新拟合的不变模型修正预测法具有一定的优越性,计算成本小,且优于传统的未修正预测法,可以看作是一种简单易行的修正预测方法。 展开更多
关键词 k折交叉验证 ARMA 修正预测
下载PDF
基于天气数据对空气质量预测的改进KNN算法 被引量:2
12
作者 郑茂波 孟佳俊 鲁越 《科技创新与应用》 2020年第34期37-38,41,共3页
基于天气数据进行空气质量预测,首先收集成都市A区2018年4月1日到2018年6月3日64天24个天气属性,然后对天气属性进行筛选、数据处理;接着,建立KNN分类模型,利用k折交叉验证和多数表决原则对64个样本进行分类;最后在传统KNN分类模型的基... 基于天气数据进行空气质量预测,首先收集成都市A区2018年4月1日到2018年6月3日64天24个天气属性,然后对天气属性进行筛选、数据处理;接着,建立KNN分类模型,利用k折交叉验证和多数表决原则对64个样本进行分类;最后在传统KNN分类模型的基础上,使用反距离加权建模,结果表明模型有较好的泛化能力和预测效果。 展开更多
关键词 天气数据 空气质量 k折交叉验证 反距离加权 kNN算法
下载PDF
基于Extra Tree Classifier的水质安全建模预测
13
作者 杨丽佳 陈新房 +1 位作者 赵晗清 汪世伟 《电脑与电信》 2024年第6期57-61,共5页
随着工业化和城市化的快速发展,水质安全问题日益受到关注。本研究利用一个包含7999条数据记录的水质分析数据集,涵盖多种化学物质浓度测量值与安全阈值,以及“是否安全”分类变量,运用Extr aTree Classifier模型进行水质安全建模预测... 随着工业化和城市化的快速发展,水质安全问题日益受到关注。本研究利用一个包含7999条数据记录的水质分析数据集,涵盖多种化学物质浓度测量值与安全阈值,以及“是否安全”分类变量,运用Extr aTree Classifier模型进行水质安全建模预测及数据分析。本研究目的在于提供一个可靠的模型,以帮助决策者和相关部门更好地监测和维护水质安全,从而保障公众健康和环境可持续发展。 展开更多
关键词 水质安全 Lazy Predict Extra Tree Classifier k折交叉验证 机器学习
下载PDF
基于RF-SA-SDCNN的涡扇发动机剩余寿命预测
14
作者 肖亮 曾云 《农业装备与车辆工程》 2024年第3期153-158,共6页
针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算... 针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算法对多元传感器信号进行重要性特征提取;然后,搭建基于随机森林算法和自注意机制与堆叠膨胀卷积神经网络相结合的预测模型,自注意机制通过对特征赋予不同权重分配加强贡献度,堆叠膨胀卷积通过扩大模型感受野提取时序特征用于回归分析,并利用GridSearch优化算法和StratifiedKFold交叉验证方法优化模型提升模型预测精度;最后,采用CMAPSS数据集验证验证所提方法的有效性。结果表明,所提方法可有效提高涡扇发动机剩余寿命预测精度。 展开更多
关键词 随机森林算法 自注意机制 堆叠神经网络 GridSearch k折交叉验证 指数平滑
下载PDF
基于机器学习技术的返乡发展人群预测模型研究与应用
15
作者 杜昭 谢国城 +1 位作者 陈静旋 张伟斌 《电信科学》 北大核心 2024年第5期131-140,共10页
随着经济的发展和一线城市生活压力的增大,越来越多的人迁移城市以及返回家乡发展,为了高效服务用户和提升用户产品使用体验,提出基于LightGBM、CatBoost等算法来预测返乡发展人群,并进行了异构模型融合。通过模型对比,所提融合模型有... 随着经济的发展和一线城市生活压力的增大,越来越多的人迁移城市以及返回家乡发展,为了高效服务用户和提升用户产品使用体验,提出基于LightGBM、CatBoost等算法来预测返乡发展人群,并进行了异构模型融合。通过模型对比,所提融合模型有更好的效果,可以为服务和产品提供依据,减少流失优化感知,提高市场保有率。 展开更多
关键词 LightGBM 特征工程 kNN k折交叉验证
下载PDF
基于机器学习模型的节理岩体UCS预测方法
16
作者 王海波 黄林冲 +1 位作者 林越翔 马建军 《人民长江》 北大核心 2024年第S01期192-197,202,共7页
节理岩体力学性能研判不明会对地下工程建设安全造成极大隐患,规范中对含节理岩体的力学性能判断多以粗略的定性分级为主,未给出明确的力学性能量化表征方法;而传统回归分析方法难以综合考量节理形貌多维度特性,岩体力学性能预判精度低... 节理岩体力学性能研判不明会对地下工程建设安全造成极大隐患,规范中对含节理岩体的力学性能判断多以粗略的定性分级为主,未给出明确的力学性能量化表征方法;而传统回归分析方法难以综合考量节理形貌多维度特性,岩体力学性能预判精度低。为探寻含节理岩体力学性质智慧量化预测方法,从含单节理岩体入手,广泛调研并收集了130组含单节理岩体单轴抗压强度(UCS),并采用节理倾角θ、节理贯通率k量化节理形貌特征,以弹性模量E及抗压强度σ表征岩石强度,开展基于机器学习的含单节理岩体力学性质智慧预测方法研究。为充分论证机器学习算法在岩体性能预测方面的适用性,引入神经网络、随机森林、支持向量机等多种机器学习算法,并采用分布统计、灰色关联分析等手段遴选关键控制指标,进一步结合k折交叉验证法训练映射网络,在此基础上比较了多种机器学习算法及传统回归分析模型的预测性能。研究结果表明:①统计分析与灰色关联度分析可高效筛选指标组合;②k折交叉验证和多指标评价能有效减少机器学习模型的偶然误差;③整体上特征数量与预测效果成正比,其中支持向量机、随机森林分别为全参量预测和局部参量预测的最佳表现模型;④机器学习模型比经验、半经验得出的传统多元非线性回归模型预测效果更佳,充分展现了其在岩石力学性能智慧判别与预测中的巨大潜力。 展开更多
关键词 节理岩体 单轴抗压强度 统计分析 灰色关联分析 k折交叉验证 机器学习
下载PDF
基于DBSCAN-ML的液压风力发电机故障诊断研究
17
作者 宾世杨 李利强 +1 位作者 程乐 陈浩武 《机床与液压》 北大核心 2024年第14期227-235,共9页
传统风力发电机对于系统故障的解决方案是有限和预先确定的,而具有大量传感器数据的故障预测诊断可以有效预防可能发生的系统故障,从而降低设备维护成本。为此,提出一种基于DBSCAN-ML的风力发电机故障诊断策略。基于密度的应用噪声算法... 传统风力发电机对于系统故障的解决方案是有限和预先确定的,而具有大量传感器数据的故障预测诊断可以有效预防可能发生的系统故障,从而降低设备维护成本。为此,提出一种基于DBSCAN-ML的风力发电机故障诊断策略。基于密度的应用噪声算法空间聚类(DBSCAN)从正常状态数据中分类出异常状态的风力机数据,然后采用决策树和随机森林算法2种机器学习(ML)算法构建预测模型,最后使用K折交叉验证进行测试。通过广西31台风力发电机组数据对此故障诊断方案进行案例验证。结果表明:DBSCAN算法可以有效分离异常状态数据,且决策树预测模型和随机森林模型可以分别获得92.7%和92.1%的准确率,通过数据挖掘和建模可以检测风力发电机组的故障,并可以预测部件的维护需求。 展开更多
关键词 风力发电机 基于密度的应用噪声算法空间聚类(DBSCAN) 机器学习(ML) 决策树 随机森林 k折交叉验证 故障诊断
下载PDF
样本标签污染条件下的雷达辐射源个体识别技术
18
作者 段可欣 闫文君 +2 位作者 凌青 王艳艳 王艺卉 《海军航空大学学报》 2024年第2期189-198,260,共11页
针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,... 针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,再使用K折交叉实验对这些标签异常的样本进行预测投票,将得票数多的标签作为错误标签纠正的结果。经过清洗的数据集再通过卷积神经网络进行训练,得到1个较为理想的辐射源个体识别的网络模型,保证了在样本污染条件下,辐射源个体识别网络仍能具有较好的识别率。文章所提方法的识别率相比未经处理的数据集的识别率在标签错误率小于30%时平均提高3.3%;在标签错误率大于30%时,也能使个体识别率达到90%左右,验证了文章所提方法在对错误标签的识别和纠正上可以取得较好的效果。 展开更多
关键词 辐射源个体识别 错误标签 密度峰值聚类 k折交叉实验 卷积神经网络
下载PDF
基于Stacking集成学习模型的气态亚硝酸预测 被引量:7
19
作者 唐科 秦敏 +7 位作者 赵星 段俊 方武 梁帅西 孟凡昊 叶凯迪 张鹤露 谢品华 《中国环境科学》 EI CAS CSCD 北大核心 2020年第2期582-590,共9页
建立了基于Stacking集成学习下气态亚硝酸(HONO)预测模型.利用非相干宽带腔增强吸收光谱(IBBCEAS)系统获得的北京城区HONO的浓度,结合HONO的来源,选取了O3、CO、SO2、NO、NO2、NOy、温度(T)、相对湿度(RH)、风速(WS)、j(HONO)、j(NO2)、... 建立了基于Stacking集成学习下气态亚硝酸(HONO)预测模型.利用非相干宽带腔增强吸收光谱(IBBCEAS)系统获得的北京城区HONO的浓度,结合HONO的来源,选取了O3、CO、SO2、NO、NO2、NOy、温度(T)、相对湿度(RH)、风速(WS)、j(HONO)、j(NO2)、j(O1D)作为特征数据,通过对HONO的平均日变化分析,将测量时间按小时转换为新特征.分别以极端梯度提升(XGBoost)、轻量化梯度促进机(LightGBM)以及随机森林(RF)算法构建基模型,采用5折交叉验证的方式划分训练集,将基模型输出的结果作为新特征集,并将新特征集作为第二层线性回归模型的输入,通过对这两层中的模型进行训练,最终得到Stacking集成学习HONO预测模型.通过对模型的特征重要度分析和计算夜间交通直接排放所占的贡献,表明CO是模型预测中重要的影响因子,说明机动车的直接排放是该区域冬季时期HONO的重要来源.利用测试集分别对单模型和融合后模型的预测性能进行评估,3个单模型的预测结果与测量值的相关系数都达到了0.91以上,其中Stacking融合后的模型性能最好,相关系数达到了0.94,平均绝对误差和均方根误差分别为0.307×10-9和0.453×10-9,结果表明基于Stacking集成学习方式下HONO预测模型的可解释性和推广性. 展开更多
关键词 STACkING k折交叉验证 集成 气态亚硝酸 预测
下载PDF
基于核函数及参数优化的KPLS质量预测研究 被引量:2
20
作者 陈路 郑丹 童楚东 《电子技术应用》 2021年第12期100-104,共5页
核偏最小二乘(KPLS)在工业过程监测和质量预测中得到了广泛的应用,核函数和核参数的选取对KPLS质量预测结果有重要影响。然而,如何选择核函数类型和核参数一直是该方法应用的瓶颈。针对以上问题,提出一种改进遗传算法的核函数优化方法... 核偏最小二乘(KPLS)在工业过程监测和质量预测中得到了广泛的应用,核函数和核参数的选取对KPLS质量预测结果有重要影响。然而,如何选择核函数类型和核参数一直是该方法应用的瓶颈。针对以上问题,提出一种改进遗传算法的核函数优化方法。该方法将核的种类及核参数作为优化的决策变量,以均方根误差为目标,分别从编码方案、遗传策略、适应度函数优化、交叉和变异算法等方面进行设计,以保证核函数种类的多样性,利用2折交叉验证法对训练结果进行验证。以田纳西-伊斯曼过程(TE)与MATLAB结合进行仿真实验,仿真结果表明,该方法能寻找到最优核函数以及其核参数,具有很好的稳定性和一致性。 展开更多
关键词 核偏最小二乘 遗传算法 质量预测 k折交叉验证
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部