期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合过抽样和欠抽样的不平衡数据重抽样方法
被引量:
15
1
作者
吴磊
房斌
+2 位作者
刁丽萍
陈静
谢娜娜
《计算机工程与应用》
CSCD
2013年第21期172-176,185,共6页
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多...
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。
展开更多
关键词
不平衡数据
重抽样
基于聚类的过抽样算法(
cbos
)
基于边界值的虚拟少数类向上采样算法(BSM)
可选择最
近邻算法(ENN)
Tomek
LINKS
预处理
下载PDF
职称材料
题名
融合过抽样和欠抽样的不平衡数据重抽样方法
被引量:
15
1
作者
吴磊
房斌
刁丽萍
陈静
谢娜娜
机构
重庆大学计算机学院
第三军医大学新桥医院健康管理科
出处
《计算机工程与应用》
CSCD
2013年第21期172-176,185,共6页
基金
中央高校基本科研业务费资助(No.CDJXS10182216)
文摘
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。
关键词
不平衡数据
重抽样
基于聚类的过抽样算法(
cbos
)
基于边界值的虚拟少数类向上采样算法(BSM)
可选择最
近邻算法(ENN)
Tomek
LINKS
预处理
Keywords
imbalanced datasets
resampling
cluster-based oversampling (cbos)
Borderline Synthetic Minority Over-samplingTechnique( BSM )
Edited Nearest Neighbor(ENN)
Tomek links
preprocess
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合过抽样和欠抽样的不平衡数据重抽样方法
吴磊
房斌
刁丽萍
陈静
谢娜娜
《计算机工程与应用》
CSCD
2013
15
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部