-
题名跨类别样本迁移框架下的不平衡分类方法
- 1
-
-
作者
于海波
刘婧
李强伟
高欣
谭煌
陈天阳
-
机构
中国电力科学研究院有限公司计量研究所
北京邮电大学人工智能学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第16期143-158,共16页
-
基金
国家电网有限公司科技项目(5700-202227226A-1-1-ZN)。
-
文摘
对于不平衡分类问题,实现类别交叠区域中样本数目和分布的平衡是缓解后续决策偏移的关键,而现有的不平衡分类方法往往只从少数类样本生成新样本来达到样本数目的平衡,没有充分利用多数类样本丰富的信息。特别是在少数类样本绝对数量过少的情况下,仅利用原始少数类样本信息无法有效平衡交叠区域样本的分布。提出了一种跨类别样本迁移框架下的不平衡分类方法。在变分自编码器(variational autoencoder,VAE)隐编码采样过程中嵌入由全连接层构建的映射网络,在VAE充分学习不同类别样本的共性和特性的基础上,在隐编码先验约束和跨域一致性约束下对多数类样本的隐编码进行映射转换,使转换前后隐编码共享相同的分布空间,并通过VAE中解码器实现多数类样本向少数类样本的迁移。同时融入生成对抗机制,对原始样本和新样本以及转换前后的隐编码进行判别对抗,进一步提升迁移样本的可靠性。在此基础上,分别对新生成样本与原始不同类别样本的距离进行加权约束,并筛选得到更加靠近交叠区域的样本,使该区域不同类别样本的数目和分布更加平衡。在16个公共数据集上的实验结果表明,在F1测量值和G-均值上该方法显著优于10种典型的不平衡分类方法,特别是在11个不平衡比例较高、少数类样本绝对数量过少的公共数据集中,该方法性能提升更加显著。
-
关键词
不平衡分类
跨类别样本迁移框架
变分自编码器
映射网络
生成对抗机制
加权欧式距离约束
-
Keywords
imbalanced classification
cross-class sample migration framework
variational autoencoders
mapping network
generative countermeasure mechanism
weighted Euclidean distance constraint
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-