期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于样本分布的类别均衡化方法
1
作者 李国和 陈桂婷 +3 位作者 郑艺峰 洪云峰 周晓明 潘雪玲 《计算机工程与设计》 北大核心 2023年第9期2626-2633,共8页
为解决样本类别不均衡问题,提出基于样本分布的类别均衡化算法。采用单类支持向量机和近邻法学习多数类样本,净化类别不清的分布边界;采用密度聚簇算法对少数类样本聚簇,根据每个类簇的权重决定每个类簇生成的样本数,平衡类簇间的样本数... 为解决样本类别不均衡问题,提出基于样本分布的类别均衡化算法。采用单类支持向量机和近邻法学习多数类样本,净化类别不清的分布边界;采用密度聚簇算法对少数类样本聚簇,根据每个类簇的权重决定每个类簇生成的样本数,平衡类簇间的样本数量;根据每个簇的边界样本与非边界样本数量比值,确定每个样本权重,采用SMOTE合成少数类样本。采用UCI数据集实验对比和地震数据分析应用,验证了算法在不同分类模型均可提高分类精度。 展开更多
关键词 不均衡数据 过采样 单类支持向量机 密度聚类 样本类别均衡化 样本分布 分类
下载PDF
面向分类模型学习的样本类别均衡化方法
2
作者 李国和 刘顺欣 +3 位作者 张予杰 郑艺峰 洪云峰 周晓明 《计算机应用与软件》 北大核心 2022年第10期230-237,共8页
过采样方法是解决数据类别不均衡的有效方法之一,现有的过采样方法容易使样本具有高相似性导致过拟合。针对该问题,提出一种基于高斯混合模型和Jensen-Shannon散度的过采样方法(GJ-RSMOTE)。利用高斯混合模型对少数类样本进行聚类,通过... 过采样方法是解决数据类别不均衡的有效方法之一,现有的过采样方法容易使样本具有高相似性导致过拟合。针对该问题,提出一种基于高斯混合模型和Jensen-Shannon散度的过采样方法(GJ-RSMOTE)。利用高斯混合模型对少数类样本进行聚类,通过簇的稀疏度计算各簇的采样数量以及采用超球体插值方法扩大生成样本的范围,避免了生成样本过拟合,通过Jensen-Shannon散度控制最终生成样本的数量。实验结果表明,GJ-RSMOTE可实现样本类别均衡性,可有效提高分类模型的识别精度。 展开更多
关键词 不均衡数据 过采样 高斯混合模型 Jensen-Shannon散度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部