-
题名基于核极限学习机的多标签数据流半监督在线分类方法
- 1
-
-
作者
王雨晨
邱士远
李培培
胡学钢
-
机构
合肥工业大学计算机与信息学院
合肥工业大学大数据知识工程教育部重点实验室
合肥综合性国家科学中心大健康研究院健康大数据与群体医学研究所
合肥工业大学安徽省工业安全与应急技术重点实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2024年第8期741-754,共14页
-
基金
国家自然科学基金项目(No.62376085,62076085,62120106008)
合肥综合性国家科学中心大健康研究院健康大数据与群体医学研究所专项资金项目(No.JKS20230030)资助。
-
文摘
实际应用中涌现的大量流数据具有高速到达、海量、动态变化等特点,同时,这些数据流常含有多个标签且只有少量数据被标记,从而带来多标签数据环境下的概念漂移与标签缺失问题.为此,文中提出基于核极限学习机的多标签数据流半监督在线分类方法.首先,针对多标签数据流的标签缺失问题,根据滑动窗口将数据流划分为k块,对每块数据构造特征相似性矩阵和标签相似性矩阵,并加入核极限学习机的训练中.同时为了适应流数据的特点,设计增量式更新机制,构建半监督在线核极限学习机.然后,为了适应数据流中的概念漂移问题,采用基于时间戳丢弃更新的机制,预先设定数据规模,当数据到达指定规模后,丢弃最旧的无标签数据,将新的数据加入更新.最后,在10个多标签数据集上的实验表明,文中方法对标签缺失和概念漂移问题具有较强的适应能力,并能保持较优的分类效果.
-
关键词
数据流分类
半监督分类
多标签分类
核极限学习机
概念漂移
-
Keywords
Data Stream Classification
Semi-supervised Classification
Multi-label Classification
Kernel Extreme Learning Machine
Concept Drift
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-