期刊文献+

基于最大平衡度的自适应随机抽样算法 被引量:1

Adaptive Random Sampling Algorithm Based on the Balance Maximization
下载PDF
导出
摘要 针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力. The problem on the classification algorithm of imbalanced datasets was analyzed. Common methods of balancing data, including improvement of datasets and the improved algorithm, were summarized. Then a novel algorithm called adaptive random sampling algorithm was put forward based on balance maximization. The classification effect of random forest algorithm was further optimized. Experiments show that the proposed algorithm performs well with the imbalanced data, the new data are fitted with the original data, and it could improve the ability of classifier to deal with the imbalanced data.
作者 董立岩 王越群 李永丽 朱琪 DONG Li-yan;WANG Yue-qun;LI Yong-H;ZHU Qi(College of Computer Science and Technology,Jilin University,Changchun 130012,China;School of Computer Science and Technology,Northeast Normal University,Changchun 130117,China)
出处 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第6期792-796,共5页 Journal of Northeastern University(Natural Science)
基金 国家自然科学基金资助项目(61272209)
关键词 非平衡数据集 最大平衡度 随机抽样 随机森林 数据预处理 imbalanced dataset balance maximization random sampling random forest data preprocessing
  • 相关文献

同被引文献1

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部