-
题名面向软件缺陷个数预测的混合式特征选择方法
被引量:2
- 1
-
-
作者
马子逸
马传香
刘瑞奇
余啸
-
机构
湖北大学计算机与信息工程学院
湖北省教育信息化工程研究中心
武汉大学国际软件学院
武汉大学计算机学院软件工程国家重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第2期487-492,502,共7页
-
基金
湖北大学精品课程(013665
150145)
-
文摘
针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的混合式特征选择方法——HFSNFP。首先,利用Relief F算法计算每个特征与缺陷个数之间的相关性,选出相关性最高的m个特征;然后,基于特征之间的关联性利用谱聚类对这m个特征进行聚类;最后,利用基于包裹式特征选择思想从每个簇中依次挑选最相关的特征形成最终的特征子集。实验结果表明,相比于已有的五种过滤式特征选择方法,HFSNFP方法在提高预测率的同时降低了误报率,且G-measure与RMSE度量值更佳;相比于已有的两种包裹式特征选择方法,HFSNFP方法在保证缺陷个数预测性能的同时可以显著降低特征选择的时间。
-
关键词
软件缺陷个数预测
特征选择
谱聚类
包裹式特征选择
-
Keywords
number of software faults prediction
feature selection
spectral clustering
wrapper-based feature selection
-
分类号
TP311.53
[自动化与计算机技术—计算机软件与理论]
-
-
题名回归算法对软件缺陷个数预测模型性能的影响
被引量:1
- 2
-
-
作者
付忠旺
肖蓉
余啸
谷懿
-
机构
湖北大学计算机与信息工程学院
软件工程国家重点实验室(武汉大学)
湖北省教育信息化工程技术研究中心
-
出处
《计算机应用》
CSCD
北大核心
2018年第3期824-828,858,共6页
-
文摘
针对已有研究在评价软件缺陷个数预测模型性能时没有考虑到软件缺陷数据集存在数据不平衡的问题而采用了评估回归模型的不合适的评价指标的问题,提出以平均缺陷百分比作为评价指标,讨论不同回归算法对软件缺陷个数预测模型性能的影响程度。利用PROMISE提供的6个开源数据集,分析了10个回归算法对软件缺陷个数预测模型预测结果的影响以及各种回归算法之间的差异。研究结果表明:使用不同的回归算法建立的软件缺陷个数预测模型具有不同的预测效果,其中梯度Boosting回归算法和贝叶斯岭回归算法预测效果更好。
-
关键词
软件缺陷个数预测
数据不平衡
回归算法
-
Keywords
defect number prediction
imbalanced data distribution
regression algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-