摘要
针对传统过采样算法在合成新样本时,造成的原始数据分布改变、噪声样本生成以及合成样本高度相似等问题,提出一种基于多维高斯云模型的过采样方法.首先采用DPC对少数类样本进行聚类,增加少数类的分类区域,排除噪声干扰,然后根据密度与距离计算各个簇的采样权重,最后利用多维逆向云发生器计算每个簇的云模型特征,并根据特征、采样权重和多维正向云发生器合成所需的样本,实现对少数类的过采样.通过与K-means SMOTE和ADASYN等算法在UCI数据集上的对比实验,表明该方法能有效提升少数类的分类结果.
出处
《周口师范学院学报》
CAS
2020年第2期104-107,共4页
Journal of Zhoukou Normal University