-
题名面向贯序不均衡数据的混合采样极限学习机
被引量:3
- 1
-
-
作者
毛文涛
王金婉
何玲
袁培燕
-
机构
河南师范大学计算机与信息工程学院
智慧商务与物联网技术河南省工程实验室
-
出处
《计算机应用》
CSCD
北大核心
2015年第8期2221-2226,共6页
-
基金
国家自然科学基金资助项目(U1204609)
中国博士后科学基金资助项目(2014M550508)
+1 种基金
河南省高校科技创新人才资助计划项目(15HASTIT022)
河南省高校青年骨干教师资助计划项目(2014GGJS-046)
-
文摘
针对现有机器学习算法难以有效提高贯序不均衡数据分类问题中少类样本分类精度的问题,提出一种基于混合采样策略的在线贯序极限学习机。该算法可在提高少类样本分类精度的前提下,减少多类样本的分类精度损失,主要包括离线和在线两个阶段:离线阶段采用均衡采样策略,利用主曲线分别构建多类和少类样本的可信区域,在不改变样本分布特性的前提下,利用可信区域扩充少类样本和削减多类样本,进而得到均衡的离线样本集,建立初始模型;在线阶段仅对贯序到达的多类数据进行欠采样,根据样本重要度挑选最具价值的多类样本,进而动态更新网络权值。通过理论分析证明所提算法在理论上存在损失信息上界。采用UCI标准数据集和实际的澳门空气污染预报数据进行仿真实验,结果表明,与现有在线贯序极限学习机(OS-ELM)、极限学习机(ELM)和元认知在线贯序极限学习机(MCOS-ELM)算法相比,所提算法对少类样本的预测精度更高,且数值稳定性良好。
-
关键词
极限学习机
在线贯序数据
不均衡分类
主曲线
-
Keywords
Extreme Learning Machine (ELM)
online sequential data
imbalanced data classification
principal curve
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-