期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于ECOC平衡随机森林的雷达降水粒子分类
1
作者 李海 田众 钱君 《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1599-1606,共8页
针对数据不平衡情况下的降水粒子分类问题,提出了一种基于纠错输出码(error correcting output code,ECOC)平衡随机森林的双偏振气象雷达降水粒子分类方法。首先,将多类别降水粒子数据集编码为多个二分类数据集;然后,对二分类数据集进... 针对数据不平衡情况下的降水粒子分类问题,提出了一种基于纠错输出码(error correcting output code,ECOC)平衡随机森林的双偏振气象雷达降水粒子分类方法。首先,将多类别降水粒子数据集编码为多个二分类数据集;然后,对二分类数据集进行有放回的平衡重采样,构建多棵分类回归树;最后,利用所有的分类回归树联合进行降水粒子分类。对实测数据的处理结果表明,所提方法能够在保证总体准确率较高的情况下,大幅提高少数类的分类效果。 展开更多
关键词 双偏振气象雷达 降水粒子分类 数据不平衡 纠错输出码 平衡随机森林
下载PDF
基于概率校准平衡随机森林算法的轨道电路故障诊断方法
2
作者 李言曼 李绍斌 +1 位作者 屈金燕 刘留 《现代电子技术》 2023年第13期176-182,共7页
传统的轨道电路故障分析方法大多假设不同类别的数据样本数量是相似或相等的,然而在实际采集到的监测数据中,正常工作的样本数据占绝大部分,故障数据只占少部分,这种数据不平衡特性会影响学习模型的分类性能,从而不能给出准确的故障诊... 传统的轨道电路故障分析方法大多假设不同类别的数据样本数量是相似或相等的,然而在实际采集到的监测数据中,正常工作的样本数据占绝大部分,故障数据只占少部分,这种数据不平衡特性会影响学习模型的分类性能,从而不能给出准确的故障诊断结果。因此文中提出基于概率校准平衡随机森林算法的轨道电路故障分析方法,以减少数据不平衡对轨道电路故障诊断准确度的影响。实验结果表明:经过概率校准后的平衡随机森林算法对实际监测数据具有更好的分析诊断能力;与XGBoost、LightGBM等算法相比,PC-BRF在ZPW-2000二分类数据集以及在25 Hz轨道电路多分类数据集上的分类综合性能更优,能对轨道电路故障不平衡数据进行有效分析,提高现场监测数据的利用率。 展开更多
关键词 轨道电路 故障诊断 概率校准 平衡随机森林算法 数据挖掘 评价指标 实验验证
下载PDF
类间数据不均衡条件下基于平衡随机森林的轴向柱塞泵故障诊断方法 被引量:4
3
作者 姜万录 马歆宇 +1 位作者 岳毅 赵亚鹏 《液压与气动》 北大核心 2022年第3期45-54,共10页
针对轴向柱塞泵实际故障诊断中采集到的故障类数据远少于正常类数据的情况,为提升故障分类精确率,提出了一种基于平衡随机森林(Balanced Random Forest,BRF)的轴向柱塞泵故障诊断方法。BRF算法是随机森林(Random Forest,RF)的改进算法,... 针对轴向柱塞泵实际故障诊断中采集到的故障类数据远少于正常类数据的情况,为提升故障分类精确率,提出了一种基于平衡随机森林(Balanced Random Forest,BRF)的轴向柱塞泵故障诊断方法。BRF算法是随机森林(Random Forest,RF)的改进算法,将欠采样方法与RF结合,强化了RF处理非均衡数据的能力。通过开源的UCI数据集对该算法的性能进行了测试,相较于RF以及合成少数类过采样(Synthetic Minority Over-sampling Technique,SMOTE)与RF的组合算法SMOTE-RF,BRF算法在少数类分类精确率方面有所提升。最后,将BRF算法应用于轴向柱塞泵的故障诊断中。结果表明,在类间数据不均衡的条件下,相较于RF及SMOTE-RF算法,BRF算法能够取得更高的故障分类精确率。 展开更多
关键词 轴向柱塞泵 故障诊断 非均衡数据 平衡随机森林 多分类
下载PDF
基于随机森林算法的脓毒症患者院内死亡风险预测研究
4
作者 李丽娟 曹晓均 +2 位作者 陈飞燕 樊慧峰 刘广建 《中国医疗设备》 2023年第12期29-34,共6页
目的基于脓毒症患者院内死亡预测中因机器学习样本类别不平衡导致敏感度过低的问题,构建一种新的基于平衡随机森林(Balanced Random Forest,BRF)算法的预测模型。方法从MIMIC-Ⅲ公开数据库中获取符合脓毒症(Sepsis-3.0)标准患者的17个... 目的基于脓毒症患者院内死亡预测中因机器学习样本类别不平衡导致敏感度过低的问题,构建一种新的基于平衡随机森林(Balanced Random Forest,BRF)算法的预测模型。方法从MIMIC-Ⅲ公开数据库中获取符合脓毒症(Sepsis-3.0)标准患者的17个时间序列变量数据,截取入住ICU后最初48 h的数据,计算出17个变量的714个统计特征,将其用于模型构建和性能评估。利用曲线下面积(Area Under Curve,AUC)和修正的几何平均值(Adjusted Geometric-Mean,AGM)进行超参调优。除BRF算法模型外,还与传统的逻辑回归和随机森林(Random Forest,RF)算法模型性能进行比较。结果最终筛选出10270例有ICU住院经历的脓毒症患者,院内总体死亡率为18.04%。各种模型性能测试结果表明,基于样本类别不平衡的机器学习模型的预测敏感度显著提高,其中RF-AGM模型最低,为0.1826(95%CI:0.1351~0.2322),BRF-AGM模型提高到0.7110(95%CI:0.6537~0.7677),利用新的预测模型,将会发现更多面临死亡的患者并及时给予救治。BRF-AGM模型的AUC、AGM和特异性分别达到了0.7994(95%CI:0.7696~0.8288)、0.7282(95%CI:0.7046~0.7519)和0.7349(95%CI:0.7101~0.7590)。结论BRF-AGM模型在ICU脓毒症患者死亡预测方面具有巨大应用潜力,可以避免临床医生延误治疗患者,这对改善患者预后具有重要意义,但BRF-AGM模型的临床效用还需要前瞻性多中心研究来进一步评估。 展开更多
关键词 样品类别不平衡 院内死亡 预测模型 平衡随机森林 脓毒症
下载PDF
花生黄曲霉毒素平衡取样-随机森林风险预警模型的应用研究
5
作者 郭灿 岳晓凤 +3 位作者 白艺珍 张良晓 张奇 李培武 《中国农业科学》 CAS CSCD 北大核心 2022年第17期3426-3436,I0001-I0013,共24页
【目的】花生极易受到黄曲霉毒素污染,本研究拟在前期创建的花生黄曲霉毒素平衡取样-随机森林预测预警模型基础上,通过系统性应用研究,明确模型主要技术参数与实际应用效果,为预测评估我国产后花生黄曲霉毒素风险提供关键技术支撑。【... 【目的】花生极易受到黄曲霉毒素污染,本研究拟在前期创建的花生黄曲霉毒素平衡取样-随机森林预测预警模型基础上,通过系统性应用研究,明确模型主要技术参数与实际应用效果,为预测评估我国产后花生黄曲霉毒素风险提供关键技术支撑。【方法】利用前期建立的花生黄曲霉毒素平衡取样-随机森林风险预警模型,选择1个地理变量(纬度)和3个气候变量(收获前一个月8:00—20:00降水量、平均气压和日平均气温)作为模型数据的关键输入参数,预测2019和2020年我国花生主产区153个主产市(县)黄曲霉毒素污染风险。采用免疫亲和层析-高效液相色谱-荧光检测法,测定上述产区共2164份花生的黄曲霉毒素含量,获得这些产区花生黄曲霉毒素污染数据。根据模型预测风险与实际测定结果,计算模型应用的准确率、精准率、灵敏度和假阳性率,明确应用效果。【结果】累计预测的153个市(县)中,共预测出125个低风险区,其中116个与实际测定评估结果相吻合,有9个实测评估高风险产区被预测误判为低风险产区(假阴性)。共预测出28个花生黄曲霉毒素污染高风险产区,其中15个与实际测定评估结果相吻合,有13个实测评估低风险产区被预测误判为高风险产区(假阳性)。该模型预测结果的总体准确率达到85.61%,假阴性率为8.49%,假阳性率为5.88%。【结论】花生黄曲霉毒素平衡取样-随机森林风险预警模型能够较好地预测出我国产后花生黄曲霉毒素污染风险,为科学指导我国产后花生收储与利用,减少黄曲霉毒素污染损失和保障农产品质量安全提供技术支撑。 展开更多
关键词 花生 黄曲霉毒素 平衡取样-随机森林 预警模型 分类矩阵
下载PDF
一种面向非均衡分类的随机森林算法 被引量:3
6
作者 沈智勇 苏翀 +1 位作者 周扬 沈智威 《计算机与现代化》 2018年第12期56-60,66,共6页
随机森林算法是一种简单、有效的集成学习算法。它通过自助法和随机化特征子集的方式增加了集成分类的多样性,进而构建出比Bagging和Boosting更精确的集成分类器。然而,当面对非均衡分类问题时,其建树所使用采用的分裂指标——Gini指数... 随机森林算法是一种简单、有效的集成学习算法。它通过自助法和随机化特征子集的方式增加了集成分类的多样性,进而构建出比Bagging和Boosting更精确的集成分类器。然而,当面对非均衡分类问题时,其建树所使用采用的分裂指标——Gini指数被证明对类分布敏感,这在一定程度上降低了随机森林的分类精度。本文提出一种使用K-L距离作为分裂指标的随机森林。实验采用ROC曲线下面积(AUC)作为分类性能评价指标,通过在低度非均衡数据集和高度非均衡数据集上分别与随机森林、平衡随机森林以及基于Hellinger决策树的Bagging集成分类器相比,K-L随机森林不仅在70%以上的实验数据集上优于其他分类器,而且其平均AUC值也优于其他分类器,分别为0. 938、0. 937。上述实验结果表明:使用K-L距离作为分裂指标可以有效提高随机森林处理非均衡分类问题的分类性能。 展开更多
关键词 非均衡分类 K-L距离 随机森林 平衡随机森林 BAGGING
下载PDF
基于蚁群算法优化随机森林模型的汽车保险欺诈识别研究 被引量:14
7
作者 闫春 李亚琪 孙海棠 《保险研究》 CSSCI 北大核心 2017年第6期114-127,共14页
汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,... 汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。 展开更多
关键词 汽车保险欺诈 平衡随机森林 蚁群优化算法 启发式信息
原文传递
航空发动机适航知识库构建方法研究 被引量:3
8
作者 赵芷晴 顾宏斌 潘湑 《航空计算技术》 2012年第1期100-103,共4页
针对航空发动机适航领域知识重用、共享性差的问题,分析该领域知识特点;采用改进重采样和BRF方法进行知识获取;提出产生式规则、框架网络和面向对象的混合知识表示模型。与数据库软件的有效集成,创建智能知识库系统,实现了知识的查询和... 针对航空发动机适航领域知识重用、共享性差的问题,分析该领域知识特点;采用改进重采样和BRF方法进行知识获取;提出产生式规则、框架网络和面向对象的混合知识表示模型。与数据库软件的有效集成,创建智能知识库系统,实现了知识的查询和维护。 展开更多
关键词 知识库 产生式规则 框架网络 面向对象表示法 重采样 平衡随机森林
下载PDF
一种基于SSA-BRF的网络入侵检测方法 被引量:7
9
作者 魏明军 张鑫楠 +1 位作者 刘亚志 周太宇 《河北大学学报(自然科学版)》 CAS 北大核心 2022年第5期552-560,共9页
针对随机森林(random forest,RF)超参数的选择会对RF的分类结果产生较大影响的问题,提出一种基于麻雀搜索算法(sparrow search algorithm,SSA)的RF超参数寻优方法,利用该方法帮助RF寻找一组优秀的超参数.并针对RF较难准确识别出少数类... 针对随机森林(random forest,RF)超参数的选择会对RF的分类结果产生较大影响的问题,提出一种基于麻雀搜索算法(sparrow search algorithm,SSA)的RF超参数寻优方法,利用该方法帮助RF寻找一组优秀的超参数.并针对RF较难准确识别出少数类数据的问题,利用平衡随机森林(balanced random forest,BRF)来提高模型对少数类的召回率.综合SSA和BRF构建SSA-BRF模型,并在CIC-IDS-2017数据集对模型的分类效果进行验证.实验结果表明,SSA-BRF相较于RF在准确率、宏召回率和宏F 1分数上分别提升了9.57%、26.62%和0.17,该模型在一定程度上可以提高网络入侵检测系统的性能. 展开更多
关键词 麻雀搜索算法 超参数寻优 平衡随机森林 平衡数据分类 CIC-IDS-2017
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部