-
题名基于McDiarmid界的概念漂移数据流分类算法
- 1
-
-
作者
梁斌
李光辉
-
机构
江南大学人工智能与计算机学院
物联网技术应用教育部工程研究中心
-
出处
《计算机科学与探索》
CSCD
北大核心
2021年第10期1990-2001,共12页
-
基金
国家自然科学基金(61472368)
无锡市国际科技研发合作项目(CZE02H1706)。
-
文摘
数据流中的概念漂移会导致已有的分类模型性能显著下降。目前处理概念漂移的数据流分类算法大都只针对单一类型的概念漂移(如突变型、渐变型或重复型等),难以同时适应不同场景。为此,提出了一种新的适于多类型概念漂移的数据流分类算法。该算法通过双层窗口保存当前最新的分类结果,根据模糊集隶属度函数对窗口中数据分配权重并计算加权错误率,然后利用McDiarmid界分析当前窗口和过去窗口内错误率的差异δ,根据δ是否具有显著性检测概念漂移。检测到漂移后,使用半参数对数似然算法检验当前概念是否为过去概念的重现,进而决定是否复用旧分类器。实验结果表明,与以往同类算法相比,所提算法在漂移检测延迟、误报率、分类准确率和运行时间等指标上均有一定优势。
-
关键词
概念漂移
隶属度
双层模糊窗口
mcdiarmid界
重复概念
-
Keywords
concept drift
membership degree
double fuzzy window
mcdiarmid bound
recurring concept
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-