期刊文献+

基于改进Adaboost软件缺陷数据特征选择方法 被引量:1

Feature selection method based on improved Adaboost for software defect prediction data
下载PDF
导出
摘要 传统的Adaboost算法在处理软件缺陷数据时,面临两个问题:Adaboost未能考虑软件缺陷数据为不平衡数据,即无缺陷的样本数远远超过有缺陷的样本数;通过Adaboost选择出来的软件特征之间存在较大的相关性,这些特征会影响分类效果,影响预测结果。为此提出一种基于互信息及改进的Adaboost的集成算法MAboost。在NASA数据集上的实验结果表明,该算法对于软件缺陷数据具有较好的特征选择能力。 The traditional Adaboost algorithm of feature selection faces two problems in handling software defect prediction datasets,the first one is that imbalanced data namely samples of a class vastly outnumber the other class and the other is that high correlation among the selected features.In this situation,a feature selection method MAboost(mutual information and improved Adaboost based)was proposed to optimize the process.And the well-known NASA dataset was used for an empirical study to verify the competiveness of MAboost.
作者 李克文 邹晶杰 LIKe-wen ZOU Jing-jie(College of Computer and Communication Engineering, China University of Petroleum (East China), Qingdao 266580,Chin)
出处 《计算机工程与设计》 北大核心 2017年第11期3018-3022,3124,共6页 Computer Engineering and Design
基金 山东省自然科学基金项目(ZR2013FL034)
关键词 ADABOOST 特征选择 软件缺陷 不平衡数据 互信息 Adaboost feature selection software defect imbalanced data mutual information
  • 相关文献

参考文献3

二级参考文献32

共引文献427

同被引文献10

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部