期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
数据挖掘中平衡偏斜训练集的方法研究 被引量:3
1
作者 李雄飞 李军 +2 位作者 屈成伟 刘丽娟 孙涛 《计算机研究与发展》 EI CSCD 北大核心 2012年第2期346-353,共8页
分类是数据挖掘的重要任务之一.训练分类器的训练集可能是偏斜数据.传统分类算法处理偏斜训练集,通常会使少数类别样例的分类精度很低.已有的偏斜训练集平衡算法都是针对只有两种目标类的情况.为平衡拥有多种目标类的偏斜训练集,基于同... 分类是数据挖掘的重要任务之一.训练分类器的训练集可能是偏斜数据.传统分类算法处理偏斜训练集,通常会使少数类别样例的分类精度很低.已有的偏斜训练集平衡算法都是针对只有两种目标类的情况.为平衡拥有多种目标类的偏斜训练集,基于同类样例差异较小的思想给出SSGP算法,在同类样例附近增加少数类别样例,且使多种少数类别样例同速增加.并证明SSGP算法不会向数据集中添加噪声样例.为提高效率,用样例取模取代大量相异度计算.实验表明,只需执行一遍SSGP算法就能同时提高多种少数类别样例的分类精度. 展开更多
关键词 偏斜训练集 平衡算法 少数类别样例
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部