-
题名类不平衡稀疏重构度量学习软件缺陷预测
被引量:3
- 1
-
-
作者
史作婷
吴迪
荆晓远
吴飞
-
机构
南京邮电大学计算机学院
武汉大学计算机学院软件工程国家重点实验室
南京邮电大学自动化学院
-
出处
《计算机技术与发展》
2018年第6期125-128,136,共5页
-
基金
国家自然科学基金(61272273)
-
文摘
软件缺陷预测是提升软件质量的重要手段。为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中。但是,软件缺陷预测数据通常存在类别分布不平衡的问题,这会影响预测效果。针对这个问题,提出了类不平衡稀疏重构距离度量学习软件缺陷预测方法。该方法首先在度量学习中加入代价敏感因素,学习距离度量特征矩阵并解决软件缺陷预测中分类错误代价不同的问题。其次,通过在目标函数中加入权重来进一步提高小类样本距离度量学习的准确性。最后,为了解决预测阶段数据集的类别不平衡问题,采用了改进加权KNN算法预测测试样本标签。在NASA软件缺陷预测标准数据集上的实验结果证明了该方法能提高召回率与F-measure值,改善分类性能。
-
关键词
软件缺陷预测
类不平衡
改进加权knn
度量学习
-
Keywords
software defect prediction
class-imbalance
IWknn
metric learning
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-