-
题名基于RSBoost算法的不平衡数据分类方法
被引量:21
- 1
-
-
作者
李克文
杨磊
刘文英
刘璐
刘洪太
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第9期249-252,267,共5页
-
基金
山东省自然科学基金(ZR2013FL034)资助
-
文摘
不平衡数据的分类问题在多个应用领域中普遍存在,已成为数据挖掘和机器学习领域的研究热点。提出了一种新的不平衡数据分类方法 RSBoost,以解决传统分类方法对于少数类识别率不高和分类效率低的问题。该方法采用SMOTE方法对少数类进行过采样处理,然后对整个数据集进行随机欠采样处理,以改善整个数据集的不平衡性,再将其与Boosting算法相结合来对数据进行分类。通过实验对比了5种方法在多个公共数据集上的分类效果和分类效率,结果表明该方法具有较高的分类识别率和分类效率。
-
关键词
不平衡数据
组合数据采样
BOOSTING
rsboost
-
Keywords
Imbalanced data, Mixed data sampling, Boosting, rsboost
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-