期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
软件缺陷数据集的数据质量优化
1
作者 李冰 《信息工程大学学报》 2022年第1期87-92,共6页
数据集的质量对软件缺陷预测模型的效果至关重要。针对传统数据集特征过多导致的学习速度较慢以及缺陷样本远少于无缺陷样本的类不平衡问题,提出一种基于主成分分析法(Principal Component Analysis,PCA)和数据加权增广的数据集优化方法... 数据集的质量对软件缺陷预测模型的效果至关重要。针对传统数据集特征过多导致的学习速度较慢以及缺陷样本远少于无缺陷样本的类不平衡问题,提出一种基于主成分分析法(Principal Component Analysis,PCA)和数据加权增广的数据集优化方法:通过PCA方法对数据进行降维,有效去除了冗余数据,减少模型的学习时间,提高检测效率;通过数据加权增广方法,增加了有缺陷类在样本中所占的比例,有效提高了缺陷样本的识别率。 展开更多
关键词 软件缺陷数据集 数据优化 主成分分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部