-
题名基于改进SMOTE的不平衡数据挖掘方法研究
被引量:31
- 1
-
-
作者
杨智明
乔立岩
彭喜元
-
机构
哈尔滨工业大学自动化测试与控制系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2007年第B12期22-26,共5页
-
文摘
少类样本合成过采样技术(SMOTE)是一种新型的过采样方法,能够有效地处理不平衡数据分类问题,但SMOTE在产生合成样本的过程中,存在一定的盲目性.因此本文提出一种改进的过采样方法一自适应SMOTE,根据样本集内部分布特性,自适应调整SMOTE方法中近邻选择策略,控制合成样本的质量.算法分析和仿真结果表明,文中提出的方法在不影响计算复杂度的前提下,有效地提高了分类算法的整体分类准确率。
-
关键词
不平衡数据集
少类样本合成过采样技术
自适应SMOTE
合成样本
近邻选择策略
-
Keywords
imbalanced dataset
SMOTE
adaptive SMOTE
synthetic data
neighbor selective strategy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
S512.103.7
[农业科学—作物学]
-
-
题名针对不平衡数据集的Bagging改进算法
被引量:12
- 2
-
-
作者
李明方
张化祥
-
机构
山东师范大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第30期40-42,共3页
-
基金
山东省高新技术自主创新工程专项计划(No.2007ZZ17)
山东省自然科学基金No.Y2007G16
+1 种基金
山东省科技攻关计划No.2008GG10001015
山东省电子发展基金(No.2008B0026)~~
-
文摘
传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例的权重进行调整。混淆矩阵和ROC曲线表明改进算法达到了既能保证整体的分类准确率,又能提高少数类分类精度的目的。
-
关键词
不平衡类
少类样本合成过采样技术(SMOTE)
BAGGING算法
权重
受试者工作特征曲线(ROC)
-
Keywords
imbalance dataset; Synthetic Minority Over-sampling Technique(SMOTE); Bagging; weights; Receiver Operating Characteristic(ROC) curve;
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主曲线的不均衡在线贯序极限学习机研究
- 3
-
-
作者
王金婉
毛文涛
王礼云
何玲
-
机构
河南师范大学计算机与信息工程学院
河南省高校"计算智能与数据挖掘"工程技术研究中心
-
出处
《计算机科学》
CSCD
北大核心
2016年第3期62-67,共6页
-
基金
国家自然科学基金(U1204609)
河南省基础与前沿技术研究计划项目(132300410430)资助
-
文摘
针对现有机器学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出了一种基于主曲线的不均衡在线贯序极限学习机。该方法的核心思路是根据在线贯序数据的分布特性,均衡各类别样本,以减少少类样本合成过程中的盲目性,主要包括离线和在线两个阶段。离线阶段采用主曲线分别建立各类别样本的分布模型,利用少类样本合成过采样算法对少类样本过采样,并根据各样本点到对应主曲线的投影距离分别为其设定相应大小的隶属度,最后根据隶属区间削减多类和少类虚拟样本,进而建立初始模型。在线阶段对贯序到达的少类样本过采样,并根据隶属区间均衡贯序样本,进而动态更新网络权值。通过理论分析证明了所提算法在理论上存在损失信息上界。采用UCI标准数据集和实际澳门气象数据进行仿真实验,结果表明,与现有典型算法相比,该算法对少类样本的预测精度更高,数值稳定性更好。
-
关键词
在线贯序极限学习机
不均衡数据
主曲线
少类样本合成过采样
-
Keywords
Online sequential extreme learning machine
Imbalanced data
Principal curve
Synthetic minority over-sampling
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于支持向量机的指纹图像质量分类方法
被引量:4
- 4
-
-
作者
张宇
尹义龙
骆功庆
-
机构
山东大学计算机科学与技术学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2009年第1期129-135,共7页
-
基金
国家自然科学基金项目(No.60403010)
山东省优秀中青年科学家科研奖励基金项目(No.2006BS01008)
+1 种基金
山东省科技攻关项目(No.2005GG3201089)
山东省高新技术自主创新工程专项项目(No.2007ZCB01030)资助
-
文摘
指纹图像的质量测量与评价,在指纹图像分割、增强及指纹匹配等环节都有重要应用.同时,指纹图像的质量分类,对指纹识别算法的适用性研究也有重要意义.本文提出一种基于支持向量机的指纹图像质量分类方法.该方法选择梯度、Gabor特征、方向对比度等指标,利用支持向量机有效实现指纹图像质量分类.并采用少类样本合成过采样技术(SMOTE)降低指纹图像质量好坏的类别不平衡问题对分类的影响.理论分析和实验结果都表明该方法能够较为有效地提高指纹图像质量分类的正确率.
-
关键词
指纹
图像质量
质量分类
支持向量机
少类样本合成过采样技术(SMOTE)
-
Keywords
Fingerprint, Image Quality, Quality Classification Minority Over Sampling Technique (SMOTE) , Support Vector Machine, Synthetic
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-