期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种采用渐进学习模式的SBS-CLearning分类算法 被引量:3
1
作者 申彦 朱玉全 宋新平 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第6期696-703,共8页
针对Learn++. NSE算法中多个基分类器之间相互独立、未利用前阶段学习结果辅助后续阶段学习而准确率较低的问题,借鉴人类的学习过程,优化Learn++. NSE算法内部的学习机制,转变基分类器的独立学习为渐进学习,提出了一种采用渐进学习模式... 针对Learn++. NSE算法中多个基分类器之间相互独立、未利用前阶段学习结果辅助后续阶段学习而准确率较低的问题,借鉴人类的学习过程,优化Learn++. NSE算法内部的学习机制,转变基分类器的独立学习为渐进学习,提出了一种采用渐进学习模式的SBS-CLearning分类算法.分析了Learn++. NSE算法的不足.给出了SBS-CLearning算法的步骤,该算法在前阶段基分类器的基础之上先增量学习,再完成最终的加权集成.在测试数据集上对比分析了Learn++. NSE与SBSCLearning的分类准确率.试验结果表明:SBS-CLearning算法吸收了增量学习与集成学习的优势,相比Learn++. NSE提高了分类准确率.针对SEA人工数据集,SBS-CLearning,Learn++. NSE的平均分类准确率分别为0. 982,0. 976.针对旋转棋盘真实数据集,在Constant,Sinusoidal,Pulse环境下,SBS-CLearning的平均分类准确率分别为0. 624,0. 655,0. 662,而Learn++. NSE分别为0. 593,0. 633,0. 629. 展开更多
关键词 大数据挖掘 分类算法 集成学习 增量学习 概念漂移
下载PDF
基于Spark的分布式时序分类学习模型
2
作者 申彦 敬露艺 张士翔 《计算机工程与设计》 北大核心 2023年第4期1042-1049,共8页
LearnNSE算法保留了所有基分类器进行集成,基分类器权重调整较慢,对长期累积大数据的分类学习效率不高,且仅关注累积大数据,缺乏对短时间内突发产生大数据的关注,为此在所提PFLearnNSE-Pruned-Age算法基础上,研究一种基于Spark的分布式... LearnNSE算法保留了所有基分类器进行集成,基分类器权重调整较慢,对长期累积大数据的分类学习效率不高,且仅关注累积大数据,缺乏对短时间内突发产生大数据的关注,为此在所提PFLearnNSE-Pruned-Age算法基础上,研究一种基于Spark的分布式时序分类学习模型DSCLM-spark。实验结果表明,DSCLM-spark能够取得非常接近、在许多场景下甚至优于LearnNSE的准确率,进一步提高集成分类学习的效率,兼顾短时产生及长时间累积的大数据,适用于对分类挖掘实时性要求较高的场合。 展开更多
关键词 分类算法 大数据挖掘 集成学习 增量学习 非稳定环境 分布式系统 计算机集群
下载PDF
数据挖掘C4.5算法的编程设计与增量学习改进 被引量:3
3
作者 程龙 蔡远文 《计算技术与自动化》 2009年第4期83-87,共5页
从数据结构与算法效率的优化方面考虑,采用面向对象的方法对数据挖掘C4.5算法进行编程设计;针对C4.5算法存在的不具备增量学习能力的缺陷,提出一种改进的增量学习方法,与现有方法相比较,运算量更小,速度更快。
关键词 数据挖掘 分类 C4.5算法 增量学习
下载PDF
基于滑动窗口的快速Learn++.NSE
4
作者 申彦 朱玉全 宋新平 《模式识别与人工智能》 EI CSCD 北大核心 2017年第12期1083-1090,共8页
Learn++.NSE集成的单个基分类器需根据其在所有历经环境中的分类错误率加权计算投票权重,学习效率有待提高.因此,文中采用滑动窗口技术优化权重的计算过程,提出基于滑动窗口的快速Learn++.NSE算法(SWLearn++.NSE).该算法仅考虑使用单个... Learn++.NSE集成的单个基分类器需根据其在所有历经环境中的分类错误率加权计算投票权重,学习效率有待提高.因此,文中采用滑动窗口技术优化权重的计算过程,提出基于滑动窗口的快速Learn++.NSE算法(SWLearn++.NSE).该算法仅考虑使用单个基分类器近期窗口内的分类准确率计算投票权重,提高集成学习的效率.实验表明,相比Learn++.NSE,在取得同等分类准确率的情况下,文中算法分类学习的效率更高. 展开更多
关键词 分类算法 大数据挖掘 集成学习 增量学习
下载PDF
基于动态分类器集成系统的卷烟感官质量预测方法 被引量:2
5
作者 童珂凡 张忠良 +2 位作者 雒兴刚 曾鸣 汤建国 《计算机应用与软件》 北大核心 2020年第1期66-70,81,共6页
集成学习是一种可以有效改善分类系统性能的数据挖掘方法。采用动态分类器集成选择算法对卷烟感官质量进行智能评估。产生包含多个基分类器的分类器池;根据基分类器在被测样本邻域内的表现选择满足要求的分类器;采用被选择的分类器产生... 集成学习是一种可以有效改善分类系统性能的数据挖掘方法。采用动态分类器集成选择算法对卷烟感官质量进行智能评估。产生包含多个基分类器的分类器池;根据基分类器在被测样本邻域内的表现选择满足要求的分类器;采用被选择的分类器产生最终的预测结果。为了验证该方法的有效性,采用国内某烟草公司提供的卷烟感官评估历史数据集进行了实验比较分析。实验结果表明,与其他方法相比,该方法获得的效果明显改善。 展开更多
关键词 集成学习 分类算法 动态选择 卷烟感官评估 数据挖掘
下载PDF
一种适用于多类不平衡数据集的模糊关联分类方法 被引量:7
6
作者 霍纬纲 高小霞 《控制与决策》 EI CSCD 北大核心 2012年第12期1833-1838,共6页
提出一种适用于多类不平衡分布情形下的模糊关联分类方法,该方法以最小化AdaBoost.M1W集成学习迭代过程中训练样本的加权分类错误率和子分类器中模糊关联分类规则数目及规则中所含模糊项的数目为遗传优化目标,实现了AdaBoost.M1W和模糊... 提出一种适用于多类不平衡分布情形下的模糊关联分类方法,该方法以最小化AdaBoost.M1W集成学习迭代过程中训练样本的加权分类错误率和子分类器中模糊关联分类规则数目及规则中所含模糊项的数目为遗传优化目标,实现了AdaBoost.M1W和模糊关联分类建模过程的较好融合.通过5个多类不平衡UCI标准数据集和现有的针对不平衡分类问题的数据预处理方法实验对比结果,表明了所提出的方法能显著提高多类不平衡情形下的模糊关联分类模型的分类性能. 展开更多
关键词 模糊关联分类 多类不平衡分类 遗传算法 集成学习 数据挖掘
原文传递
一种基于高斯过采样的集成学习算法 被引量:4
7
作者 张忠良 陈愉予 +1 位作者 唐佳怡 雒兴刚 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2021年第2期513-523,共11页
在数据挖掘研究领域,分类任务广泛存在着数据分布不均衡问题,例如制造状态检测,医疗诊断,金融服务,等等.SMOTE是处理不均衡数据分类问题的常用技术,与Boosting算法相结合可进一步提升分类系统性能,但是这种集成学习容易导致基分类器多... 在数据挖掘研究领域,分类任务广泛存在着数据分布不均衡问题,例如制造状态检测,医疗诊断,金融服务,等等.SMOTE是处理不均衡数据分类问题的常用技术,与Boosting算法相结合可进一步提升分类系统性能,但是这种集成学习容易导致基分类器多样性缺失.基于此,本文提出了一种基于高斯过程SMOTE过采样的Boosting集成学习算法(Gaussian-based smote in boosting,GSMOTEBoost).该算法在Boosting集成框架下构建不均衡学习模型,为了提高分类系统的鲁棒性,采用基于高斯过程SMOTE过采样技术来增加基分类器训练样本的多样性,从而提高基分类器之间的差异.为了验证算法的有效性,以常用的处理不均衡分类问题的算法作为对比方法,采用KEEL数据库里的20个标准数据集对算法进行测试,以G-mean,F-measure以及AUC作为算法的评价指标,利用统计检验手段对实验结果进行分析.实验结果表明,相对于其他算法,本文提出的GSMOTEBoost具有显著的优势. 展开更多
关键词 不均衡数据 分类算法 SMOTE 集成学习 数据挖掘
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部