期刊文献+

不平衡数据的集成分类算法综述 被引量:72

Review on ensemble algorithms for imbalanced data classification
下载PDF
导出
摘要 集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。 Ensemble learning by integrating multiple base classifiers that trained different set can effectively improve the clas- sification accuracy. In the base classifier training process,imbalanced data set can be processed by either cost-sensitive or data sampling technology. Due to the advantages of ensemble learning in imbalanced data classification, ensemble algorithms for ira- balanced data classification have been widely research. This paper surveyed the state of the art of imbalanced data ensemble classification algorithms, including the mechanisms and features of major existing learning algorithms, their advantages and dis- advantages, highlighted the open research issues and future research directions.
出处 《计算机应用研究》 CSCD 北大核心 2014年第5期1287-1291,共5页 Application Research of Computers
基金 新疆自治区高校科研计划资助项目(XJEDU2012S28) 国家教育部人文社会科学研究青年基金资助项目(11YJC870014) 新疆师范大学重点实验室基金资助项目(WLYQ2012108) 国家自然科学基金资助项目(61163045)
关键词 不平衡数据 集成学习 分类 代价敏感 数据采样 imbalanced data ensemble learning classification cost-sensitive data sampling
  • 相关文献

参考文献43

二级参考文献226

  • 1涂承胜,陆玉昌.Boosting视角[J].计算机科学,2005,32(5):140-143. 被引量:2
  • 2侯志远,周政尹,汤可宗,高尚.基于自适应蚁群算法的分布式分类规则挖掘算法[J].科学技术与工程,2007,7(2):199-202. 被引量:1
  • 3刘波,潘久辉.基于蚁群优化的分类算法的研究[J].计算机应用与软件,2007,24(4):50-53. 被引量:11
  • 4凌晓峰,SHENG Victor S..代价敏感分类器的比较研究(英文)[J].计算机学报,2007,30(8):1203-1212. 被引量:35
  • 5陈斌,冯爱民,陈松灿,李斌.基于单簇聚类的数据描述[J].计算机学报,2007,30(8):1325-1332. 被引量:18
  • 6Freund Y, Iyer R, Schapire R E, et al. An Efficient Boosting Al-gorithm for Combining Preferences//Proc of the International Con-ference on Machine Learning. Madison, USA, 1998:170-178.
  • 7Herschtal A, Raskutti B. Optimizing Area under the ROC Curve Using Gradient Descent//Proc of the 21 st International Conference on Machine Learning. Banff, Canada, 2004:49-56.
  • 8Rakotomamonjy A. Optimizing AUC with Support Vector Machine (SVM) // Proc of the European Conference on Artificial Intelli-gence Workshop on ROC Analysis and Artificial Intelligence. Valen-cia, Spain, 2004:71-80.
  • 9Rakotomamonjy A. Quadratic Programming fur AUC Optimization // Proc of the 2nd International Conference on Modelling, Computa-tion and Optimization in Information Systems and Management Sci-ences. Metz, France, 2004:603-610.
  • 10Fawcett T. An Introduction to ROC Analysis. Pattern Recognition Letters, 2006, 27(8) : 861-874.

共引文献258

同被引文献508

引证文献72

二级引证文献349

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部