期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数据挖掘中平衡偏斜训练集的方法研究
被引量:
3
1
作者
李雄飞
李军
+2 位作者
屈成伟
刘丽娟
孙涛
《计算机研究与发展》
EI
CSCD
北大核心
2012年第2期346-353,共8页
分类是数据挖掘的重要任务之一.训练分类器的训练集可能是偏斜数据.传统分类算法处理偏斜训练集,通常会使少数类别样例的分类精度很低.已有的偏斜训练集平衡算法都是针对只有两种目标类的情况.为平衡拥有多种目标类的偏斜训练集,基于同...
分类是数据挖掘的重要任务之一.训练分类器的训练集可能是偏斜数据.传统分类算法处理偏斜训练集,通常会使少数类别样例的分类精度很低.已有的偏斜训练集平衡算法都是针对只有两种目标类的情况.为平衡拥有多种目标类的偏斜训练集,基于同类样例差异较小的思想给出SSGP算法,在同类样例附近增加少数类别样例,且使多种少数类别样例同速增加.并证明SSGP算法不会向数据集中添加噪声样例.为提高效率,用样例取模取代大量相异度计算.实验表明,只需执行一遍SSGP算法就能同时提高多种少数类别样例的分类精度.
展开更多
关键词
分
类
偏斜训练集
平衡算法
少数类别样例
模
下载PDF
职称材料
题名
数据挖掘中平衡偏斜训练集的方法研究
被引量:
3
1
作者
李雄飞
李军
屈成伟
刘丽娟
孙涛
机构
符号计算与知识工程教育部重点实验室(吉林大学)
长春理工大学应用数学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第2期346-353,共8页
基金
国家科技支撑计划基金项目(2006BAK01A33)
吉林省科技发展计划基金项目(20070321
20090704)
文摘
分类是数据挖掘的重要任务之一.训练分类器的训练集可能是偏斜数据.传统分类算法处理偏斜训练集,通常会使少数类别样例的分类精度很低.已有的偏斜训练集平衡算法都是针对只有两种目标类的情况.为平衡拥有多种目标类的偏斜训练集,基于同类样例差异较小的思想给出SSGP算法,在同类样例附近增加少数类别样例,且使多种少数类别样例同速增加.并证明SSGP算法不会向数据集中添加噪声样例.为提高效率,用样例取模取代大量相异度计算.实验表明,只需执行一遍SSGP算法就能同时提高多种少数类别样例的分类精度.
关键词
分
类
偏斜训练集
平衡算法
少数类别样例
模
Keywords
classification
skewed training data
balancing algorithm
minority class case
modulus
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
数据挖掘中平衡偏斜训练集的方法研究
李雄飞
李军
屈成伟
刘丽娟
孙涛
《计算机研究与发展》
EI
CSCD
北大核心
2012
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部