基于二次学习的半监督字典学习软件缺陷预测被引量：3

Twice Learning Based Semi-supervised Dictionary Learning for Software Defect Prediction

下载PDF

导出

摘要当软件历史仓库中有标记训练样本较少时,有效的预测模型难以构建.针对此问题,文中提出基于二次学习的半监督字典学习软件缺陷预测方法.在第一阶段的学习中,利用稀疏表示分类器将大量无标记样本通过概率软标记标注扩充至有标记训练样本集中.再在扩充后的训练集上进行第二阶段的鉴别字典学习,最后在学得的字典上预测缺陷倾向性.在NASA MDP和PROMISE AR数据集上的实验验证文中方法的优越性. When the previous defect labels of modules in software history warehouse are limited, building an effective prediction model becomes a challenging problem. Aiming at this problem, a twice learning based semi-supervised learning algorithm for software defect prediction is proposed. In the first stage of learning, a large number of unlabeled samples are labeled with probability soft labels and extended to the labeled training dataset by using sparse representation classifier. Then, on this dataset discriminative dictionary learning is used for the second stage of learning. Finally, defect proneness prediction is conducted on the obtained dictionary. Experiments on the widely used NASA MDP and PROMISE AR datasets indicate the superiority of the proposed algorithm.

作者张志武荆晓远吴飞

机构地区南京邮电大学计算机学院武汉大学软件工程国家重点实验室南京邮电大学自动化学院

出处《模式识别与人工智能》 EI CSCD 北大核心 2017年第3期242-250,共9页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.61272273 61073113) 江苏省普通高校研究生科研创新计划项目(No.CXZZ12_0478)资助~~

关键词软件缺陷预测二次学习半监督学习字典学习 Software Defect Prediction, Twice Learning, Semi-supervised Learning, Dictionary Learning

分类号 TP311.53 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1何亮,宋擒豹,沈钧毅.基于Boosting的集成k-NN软件缺陷预测方法[J].模式识别与人工智能,2012,25(5):792-802. 被引量：7
2杨子旭,黎铭.二次回归学习及其在软件开发工作量预测上的应用[J].模式识别与人工智能,2015,28(1):59-64. 被引量：2

二级参考文献32

1Nikora A, Munson J. Developing Fault Predictors for Evolving Soft- ware Systems//Proc of the 9th International Software Metrics Sym- posium. Sydney, Australia, 2003:338-350.
2Nagappan N, Ball T. Static Analysis Tools as Early Indicators of Prerelease Defect Density// Proc of the 27th International Confer- ence on Software Engineering. St. Louis, USA, 2005:580-586.
3Menzies T, Greenwald J, Frank A. Data Mining Static Code Attrib- utes to Learn Defect Predictors. IEEE Trans on Software Engineer- ing, 2007, 33(1): 2-13.
4Lessmann S, Baesens B, Mues C, et al. Benchmarking Classifica- tion Models for Software Defect Prediction: A Proposed Framework and Novel Findings. IEEE Trans on Software Engineering, 2008, 34 (4) : 485-496.
5Khoshgoftaar T M, Seliya N. Analogy-Based Practical Classification Rules for Software Quality Estimation. Empirical Software Engineer-ing, 2003, 8(4) : 325-350.
6Emam K E, Benlarbi S, Goel N, et al. Comparing Case-Based Rea- soning Classifiers for Predicting High Risk Software Components. Journal of Systems and Software, 2001,55 (3) : 301-320.
7Turhan B, Bener A. Analysis of Naive Bayes' Assumptions on Soft- ware Fault Data: An Empirical Study. Data and Knowledge Engi- neering, 2009, 68(2) : 278-290.
8Khoshgoftaar T M, Allen E B, Hudepohl J P, et al. Application of Neural Networks to Software Quality Modeling of a Very Large Tele- communications System. IEEE Trans on Neural Networks, 1997, $ (4) : 902-909.
9Zheng Jun. Cost-Sensitive Boosting Neural Networks for Software Defect Prediction. Expert Systems with Applications, 2010, 37 (6) : 4537-4543.
10Selby R W, Porter A A. Learning from Examples: Generation and Evaluation of Decision Trees for Software Resource Analysis. IEEE Trans on Software Engineering, 1988, 14(12) : 1743-1757.

共引文献7

1王曙燕,黄炜青,孙家泽.基于改进GM(1,1)模型预测软件缺陷率[J].西安邮电大学学报,2015,20(6):69-73.
2张飞.改进PSO-ISVM算法的软件缺陷预测[J].计算机工程与应用,2016,52(11):17-21. 被引量：2
3杨杰,燕雪峰,张德平.基于Boosting的代价敏感软件缺陷预测方法[J].计算机科学,2017,44(8):176-180. 被引量：6
4贾晓琳,樊帅帅,罗雪,朱晓燕.应用非线性加权的集成学习软件缺陷序列预测算法[J].西安交通大学学报,2017,51(7):156-161. 被引量：6
5张肖,王黎明.一种半监督集成学习软件缺陷预测方法[J].小型微型计算机系统,2018,39(10):2138-2145. 被引量：7
6杨晓琴.基于改进蝙蝠算法的软件缺陷预测模型[J].计算机技术与发展,2018,28(12):74-78. 被引量：3
7杨江,张磊,王继民,季昌政,孔德锋,王幸.基于数据融合的混凝土侵彻深度预测[J].兵器材料科学与工程,2020,43(4):40-45. 被引量：2

同被引文献14

1何智杰,张彬,金连文.高精度指针仪表自动读数识别方法[J].计算机辅助工程,2006,15(3):9-12. 被引量：35
2顾庆,唐宝,陈道蓄.一种面向测试需求部分覆盖的测试用例集约简技术[J].计算机学报,2011,34(5):879-888. 被引量：24
3游亮,卢炎生.测试用例集启发式约简算法分析与评价[J].计算机科学,2011,38(12):147-150. 被引量：8
4郭曦,张焕国.基于谓词抽象的测试用例约简生成方法[J].通信学报,2012,33(3):35-43. 被引量：10
5华丽,王成勇,谷琼,程虹.基于遗传蚁群算法的测试用例集约简[J].工程数学学报,2012,29(4):486-492. 被引量：8
6房桦,蒋涛,李红玉,罗浩,李健,杨国庆.一种适用于智能变电站巡检机器人的双针仪表读数的识别算法[J].山东电力技术,2013,40(3):9-13. 被引量：8
7李佳,盛业华,张卡,段平.变圆域罗盘特征图像匹配[J].光学精密工程,2014,22(5):1339-1346. 被引量：4
8傅艺绮,董威,尹良泽,杜雨晴.基于组合机器学习算法的软件缺陷预测模型[J].计算机研究与发展,2017,54(3):633-641. 被引量：24
9甘露,臧洌,李航.深度信念网软件缺陷预测模型[J].计算机科学,2017,44(4):229-233. 被引量：4
10李勇,黄志球,王勇,房丙午.数据驱动的软件缺陷预测研究综述[J].电子学报,2017,45(4):982-988. 被引量：16

引证文献3

1柴海燕,丁霞,王凯风,谢立鹏.基于三层知识模型的软件缺陷管理系统[J].计算机测量与控制,2020,28(1):127-129. 被引量：4
2王亚楠,宋晓宁.判别性双向协同表示的图像识别算法[J].计算机应用研究,2021,38(2):615-618.
3杨静.基于单目视觉的三角测量在仪器识别中的实现[J].计算机应用文摘,2023,39(1):83-86.

二级引证文献4

1李杨,林家泉.产品缺陷管理系统设计方法[J].工业控制计算机,2020,33(12):109-110. 被引量：1
2蒋梦星,张林莎,尹海静.检验标本条形码管理中缺陷发生的原因分析与管理对策[J].中医药管理杂志,2020,28(21):220-222. 被引量：1
3王振坤.基于ASP.NET的软件缺陷信息管理系统设计[J].信息与电脑,2021,33(19):158-160.
4顾滨兵,李军锋,朱佳良.基于软件、测试、缺陷“三域”铰链的软件测试新架构研究与应用[J].计算机测量与控制,2023,31(10):97-102.

1日本研发出安全芯片可能改写杀毒软件历史[J].电子商务,2006,7(12):86-86.
2江兵,管群.网络环境下基于可信的软件评估方法的研究[J].计算机工程与设计,2011,32(2):576-579. 被引量：1
3丁沂.基于软件历史信息的软件工程实践[J].数字技术与应用,2012,30(4):247-247. 被引量：2
4叶嘉毅.基于软件历史信息的软件工程实践[J].科技致富向导,2015,0(17):182-182.
5安全芯片可改写杀毒软件历史[J].北京电子,2007(3):16-16.
6日本研发安全芯片可改写杀毒软件历史[J].计算机安全,2006(12):36-36.
7孙伟松,孙小兵,李斌,杨辉.软件历史代码库词库自动构建技术及实现[J].中国科学技术大学学报,2017,47(1):80-86. 被引量：3
8李岚,胡学钢.基于回归分析的COCOMO模型改进[J].安徽建筑工业学院学报（自然科学版）,2010,18(6):77-79.
9陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：120
10姜跃.软件发展中一些新特点的探讨[J].大理学院学报（综合版）,1995,0(2):48-50.

模式识别与人工智能

2017年第3期

浏览历史

内容加载中请稍等...

基于二次学习的半监督字典学习软件缺陷预测被引量：3

参考文献2

二级参考文献32

共引文献7

同被引文献14

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于二次学习的半监督字典学习软件缺陷预测 被引量：3

参考文献2

二级参考文献32

共引文献7

同被引文献14

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于二次学习的半监督字典学习软件缺陷预测被引量：3