期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向分类模型学习的样本类别均衡化方法
1
作者
李国和
刘顺欣
+3 位作者
张予杰
郑艺峰
洪云峰
周晓明
《计算机应用与软件》
北大核心
2022年第10期230-237,共8页
过采样方法是解决数据类别不均衡的有效方法之一,现有的过采样方法容易使样本具有高相似性导致过拟合。针对该问题,提出一种基于高斯混合模型和Jensen-Shannon散度的过采样方法(GJ-RSMOTE)。利用高斯混合模型对少数类样本进行聚类,通过...
过采样方法是解决数据类别不均衡的有效方法之一,现有的过采样方法容易使样本具有高相似性导致过拟合。针对该问题,提出一种基于高斯混合模型和Jensen-Shannon散度的过采样方法(GJ-RSMOTE)。利用高斯混合模型对少数类样本进行聚类,通过簇的稀疏度计算各簇的采样数量以及采用超球体插值方法扩大生成样本的范围,避免了生成样本过拟合,通过Jensen-Shannon散度控制最终生成样本的数量。实验结果表明,GJ-RSMOTE可实现样本类别均衡性,可有效提高分类模型的识别精度。
展开更多
关键词
不均衡数据
过采样
高斯混合模型
Jensen-Shannon散度
下载PDF
职称材料
题名
面向分类模型学习的样本类别均衡化方法
1
作者
李国和
刘顺欣
张予杰
郑艺峰
洪云峰
周晓明
机构
中国石油大学(北京)石油数据挖掘北京市重点实验室
中国石油大学(北京)信息科学与工程学院
塔里木油田克拉油气开发部
中国反侵权假冒创新战略联盟
厦门瀚影物联网应用研究院
出处
《计算机应用与软件》
北大核心
2022年第10期230-237,共8页
基金
国家自然科学基金项目(60473125)
中国石油大学(北京)克拉玛依校区科研启动基金项目(RCYJ2016B-03-001)
福建省自然科学基金项目(2018J01546,2019J01748)。
文摘
过采样方法是解决数据类别不均衡的有效方法之一,现有的过采样方法容易使样本具有高相似性导致过拟合。针对该问题,提出一种基于高斯混合模型和Jensen-Shannon散度的过采样方法(GJ-RSMOTE)。利用高斯混合模型对少数类样本进行聚类,通过簇的稀疏度计算各簇的采样数量以及采用超球体插值方法扩大生成样本的范围,避免了生成样本过拟合,通过Jensen-Shannon散度控制最终生成样本的数量。实验结果表明,GJ-RSMOTE可实现样本类别均衡性,可有效提高分类模型的识别精度。
关键词
不均衡数据
过采样
高斯混合模型
Jensen-Shannon散度
Keywords
Imbalanced dataset
Oversampling
Gaussian mixture model
Jensen-Shannon
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向分类模型学习的样本类别均衡化方法
李国和
刘顺欣
张予杰
郑艺峰
洪云峰
周晓明
《计算机应用与软件》
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部