期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
Data streams classification with ensemble model based on decision-feedback
1
作者 LIU Jing XU Guo-sheng +2 位作者 ZHENG Shi-hui XIAO Da GU Li-ze 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2014年第1期79-85,共7页
The main challenges of data streams classification include infinite length, concept-drifting, arrival of novel classes and lack of labeled instances. Most existing techniques address only some of them and ignore other... The main challenges of data streams classification include infinite length, concept-drifting, arrival of novel classes and lack of labeled instances. Most existing techniques address only some of them and ignore others. So an ensemble classification model based on decision-feedback(ECM-BDF) is presented in this paper to address all these challenges. Firstly, a data stream is divided into sequential chunks and a classification model is trained from each labeled data chunk. To address the infinite length and concept-drifting problem, a fixed number of such models constitute an ensemble model E and subsequent labeled chunks are used to update E. To deal with the appearance of novel classes and limited labeled instances problem, the model incorporates a novel class detection mechanism to detect the arrival of a novel class without training E with labeled instances of that class. Meanwhile, unsupervised models are trained from unlabeled instances to provide useful constraints for E. An extended ensemble model Ex can be acquired with the constraints as feedback information, and then unlabeled instances can be classified more accurately by satisfying the maximum consensus of Ex. Experimental results demonstrate that the proposed ECM-BDF outperforms traditional techniques in classifying data streams with limited labeled data. 展开更多
关键词 ensemble classification novel class concept drifting decision-feedback
原文传递
一种面向不平衡数据流的集成分类算法 被引量:4
2
作者 孙艳歌 王志海 白洋 《小型微型计算机系统》 CSCD 北大核心 2018年第6期1178-1183,共6页
大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可能会随着时间发生变化,即概念漂移.本文针对数据流中的概念漂移和类不平衡问题,提出了一种基于集成的不平... 大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可能会随着时间发生变化,即概念漂移.本文针对数据流中的概念漂移和类不平衡问题,提出了一种基于集成的不平衡数据流分类算法.在分类之前加入采样方法应对类不平衡问题,并采取有效的基分类器更新和加权策略应对概念漂移现象,从而提高分类器的性能.针对本文所提出的算法,和几种经典学习算法,在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明本文所提出的算法,其整体分类性能优于其他算法,更能适应存在概念漂移和类不平衡的数据流环境. 展开更多
关键词 数据流 概念漂移 集成分类 类不平衡
下载PDF
概念漂移数据流中可探测新颖类别的分类算法 被引量:2
3
作者 谢益均 缪裕青 +2 位作者 邵其武 高韩 文益民 《桂林电子科技大学学报》 2015年第6期459-465,共7页
针对可探测新颖类别的框架将数据流分成固定大小的数据块,导致新颖类别探测的准确率较低和处理速率较慢,且均假定数据对象所有属性具有相同的权重不符合实际情况的问题,提出一种在概念漂移数据流中探测新颖类别的分类算法(DNCS)。该算... 针对可探测新颖类别的框架将数据流分成固定大小的数据块,导致新颖类别探测的准确率较低和处理速率较慢,且均假定数据对象所有属性具有相同的权重不符合实际情况的问题,提出一种在概念漂移数据流中探测新颖类别的分类算法(DNCS)。该算法通过周期检测滑动窗口中的数据分布,依据其变化动态调整数据块大小,以此更新分类模型,以适应新的数据变化。该算法框架使用基于属性权重的聚类算法作为探测新颖类别的基本步骤。实验结果表明,该算法具有更高的新颖类别探测精度和处理速率。 展开更多
关键词 数据流 集成分类器 概念漂移 新颖类别探测
下载PDF
面向概念漂移且不平衡数据流的G-mean加权分类方法 被引量:6
4
作者 梁斌 李光辉 代成龙 《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2844-2857,共14页
数据流中的概念漂移和类别不平衡问题会严重影响数据流分类算法的性能和稳定性.针对二分类数据流中概念漂移和类别不平衡的问题,在基于数据块的集成分类方法上引入成员分类器权重的在线更新机制,结合重采样和自适应滑动窗口技术,提出了... 数据流中的概念漂移和类别不平衡问题会严重影响数据流分类算法的性能和稳定性.针对二分类数据流中概念漂移和类别不平衡的问题,在基于数据块的集成分类方法上引入成员分类器权重的在线更新机制,结合重采样和自适应滑动窗口技术,提出了一种基于G-mean加权的不平衡数据流在线分类方法(online G-mean update ensemble for imbalance learning,OGUEIL).该方法基于集成学习框架,利用时间衰减因子增量计算成员分类器最近若干实例上的G-mean性能,并确定成员分类器权重,每到达一个新实例,在线更新所有成员分类器及其权重,并对少类实例进行随机过采样.同时,OGUEIL会周期性地根据当前数据构造类别平衡数据集训练新的候选分类器,并选择性地添加至集成框架中.在真实和人工数据集上的结果表明,所提方法的综合性能优于其他同类方法. 展开更多
关键词 数据流 概念漂移 集成学习 类别不平衡 分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部