PU场景下基于迁移学习的软件缺陷预测被引量：1

Software defect prediction based on transfer learning in PU scenario

下载PDF

导出

摘要为降低软件缺陷预测对标注样本的需求,将软件缺陷预测问题模型化为PU场景下的迁移学习问题。不对要进行软件缺陷预测的目标领域样本标注类别,只对跨工程的源领域数据集标注部分正例样本,结合数据引力方法基于样本进行迁移学习,利用贝叶斯理论在源领域缺陷数据集和目标数据集上估算概率参数,构建软件缺陷预测算法TPAODE。实验结果表明,TPAODE算法比PNB和PTAN算法具有更好的缺陷预测性能,仅需标注少量正例样本的跨项目缺陷数据,即可具有较好的软件缺陷预测性能。 To reduce the requirement for labeled defect samples,the problem of software defect prediction was modeled into transfer learning problems in PU learning scenario.The target defect dataset was not labeled,while some of positive samples of source defect dataset were justly labeled,data gravity method was used to transfer cross-project defect samples into target dataset,and probability estimators were estimated based on source and target datasets,so as to construct the software defect prediction algorithm TPAODE.Experimental result shows that the TPAODE algorithm has better prediction performance than traditional PU learning methods PNB and PTAN.With only small amount of positive samples from cross-project defect dataset,the algorithm has excellent software defect prediction performance.

作者包振栋张阳刘斌

机构地区西北农林科技大学信息工程学院

出处《计算机工程与设计》北大核心 2018年第3期663-667,共5页 Computer Engineering and Design

基金国家自然科学基金项目(61602388) 中央高校基本科研业务费专项基金项目(2452015193 2452015194 2452016081)

关键词迁移学习实例迁移软件缺陷预测正例未标注学习贝叶斯算法 transfer learning instance transfer software defect prediction PU leaning Bayesian algorithms

分类号 TP311.5 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1黎铭,霍轩.半监督软件缺陷挖掘研究综述[J].数据采集与处理,2016,31(1):56-64. 被引量：6
2张荷,李梅,张阳,蔡晓妍.基于PU学习的软件故障检测研究[J].计算机应用研究,2015,32(11):3324-3327. 被引量：1

二级参考文献86

1聂林波,刘孟仁.软件缺陷分类的研究[J].计算机应用研究,2004,21(6):84-86. 被引量：39
2Guo Lan, Ma Yan, Cukic B, et al. Robust prediction of fault-proneness by random forests E C ]//Proc of the 15 th International Symposium on Software Reliability Engineering. [ S. 1. ] : IEEE Press, 2004 : 417- 428.
3Gondra I. Appi[ying machine learning to software fault-proneness pre- diction[J]. Journal of Systems and Software,2008,81 (2) :186- 195.
4Li Ming, Zhang Hongyu, Wu Rongxin, et al. Sample-based software de- fect prediction with active and semi-supervised learning [ J ]. Automa- ted Software Engineering,2012,19(2) :201-230.
5Lu Huihua, Cnkic B, Culp M. An iterative semi-supervised approach to software fau]tt prediction[ C ]//Proc of the 7th International Confe- rence on Predictive Models in Software Engineering. [ S. 1. ] : ACM Press,2011.
6Letouzey F, Denis F, Gilleron R. Learning from positive and unlabeled examples[ C ]//Proc of the 1 l tth International Conference on Algo- rithmic Learning Theory. [ S. 1. ] :Springer,2000:71-85.
7Chaula N V, Bowyer K W, Hall L O,et al. SMOTE:synthetic minority over-sampling 1Leehnique[ J]. Journal of Artificial Intelligence Re- search,2002,16(3) :321-357.
8Breiman L. Bagging predictors [ J ]. Machine Learning, 1996,24 (2) :123-140.
9Nasa/Wvu IV&V facility, metrics data program, available from [ EB/ OL]. (2007). http://mdp, ivv. nasa. gov.
10Li Rengqing, Wang Shihai. An empirical study for software fault- proneness prediction with ensemble learning models on imbalanced data sets [ J ]. Journal of Software,2014,9 (3) :697-704.

共引文献5

1李伟湋,郭鸿昌.基于邻域三支决策粗糙集模型的软件缺陷预测方法[J].数据采集与处理,2017,32(1):166-174. 被引量：5
2崔展齐,牟永敏,张志华,王伟光.基于函数调用序列模式挖掘的程序缺陷检测[J].计算机科学,2017,44(11):226-231. 被引量：2
3解铮,黎铭.基于代价敏感间隔分布优化的软件缺陷定位[J].软件学报,2017,28(11):3072-3079. 被引量：6
4崔展齐.基于函数调用序列模式和函数调用图的程序缺陷检测方法[J].湘潭大学自然科学学报,2018,40(2):71-75. 被引量：1
5国婷.差异化结构下排版软件运行缺陷优化预测仿真[J].计算机仿真,2020,37(5):341-344. 被引量：3

同被引文献8

1陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
2刘望舒,陈翔,顾庆,刘树龙,陈道蓄.一种面向软件缺陷预测的可容忍噪声的特征选择框架[J].计算机学报,2018,41(3):506-520. 被引量：18
3刘树毅,翟晔,刘东升.融合多策略特征筛选的跨项目软件缺陷预测[J].计算机工程与应用,2019,55(8):53-58. 被引量：7
4杨杰,范贵生,虞慧群.一种多源异构软件缺陷预测方法[J].小型微型计算机系统,2019,40(4):851-855. 被引量：8
5吴方君.静态软件缺陷预测研究进展[J].计算机科学与探索,2019,13(10):1621-1637. 被引量：13
6王舜,杜晔,韩臻.基于模块化Abstract-Refine算法框架的软件模型检测方法[J].电子学报,2020,48(5):997-1002. 被引量：1
7潘春霞,杨秋辉,谭武坤,邓惠心,伍佳.软件缺陷预测中的数据预处理方法[J].计算机应用,2020,40(11):3273-3279. 被引量：11
8哈清华,刘大有,陈媛,刘逻.基于迁移学习的跨公司航天软件缺陷预测[J].光学精密工程,2019,27(2):469-478. 被引量：5

引证文献1

1尤姗姗,刘雪娇.基于非线性集成深度学习的软件模块风险预测[J].计算机仿真,2021,38(11):305-308.

1杜晔,张田甜,黎妹红.基于信息密度贝叶斯算法的云平台入侵检测[J].系统仿真学报,2018,30(2):714-721. 被引量：8
2蒋林利,吴建生.层次K-均值聚类结合改进ITML的迁移度量学习方法[J].计算机应用研究,2017,34(12):3552-3555. 被引量：1
3刘建君.语义文本挖掘算法优化研究[J].山东工业技术,2018(7):242-242.
4林志强.数据挖掘技术在医院医保费用分析中的应用[J].电子技术与软件工程,2018(6):167-167. 被引量：3
5王惠.迁移学习研究综述[J].电脑知识与技术（过刊）,2017,23(11X):203-205. 被引量：19
6严浩军,张洁,许育敏,陈谦益,蒋若何.大数据技术在变电缺陷分析中的应用[J].中国高新区,2017,0(23):120-120. 被引量：1
7任俊,胡晓峰,李宁.基于SDA与SVR混合模型的迁移学习预测算法[J].计算机科学,2018,45(1):280-284. 被引量：7
8赵传档,晏晨鑫.海盗分金的博弈分析[J].科学中国人,2017(4Z):219-219.
9顾玮.基于贝叶斯算法的垃圾邮件过滤技术研究[J].办公自动化,2018,23(1):55-57.
10张水利,汪恒,李蓓茹,聂栋梁.融合贝叶斯和FSRM的相关反馈算法研究[J].网络新媒体技术,2018,7(1):22-26.

计算机工程与设计

2018年第3期

浏览历史

内容加载中请稍等...

PU场景下基于迁移学习的软件缺陷预测被引量：1

参考文献2

二级参考文献86

共引文献5

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

PU场景下基于迁移学习的软件缺陷预测 被引量：1

参考文献2

二级参考文献86

共引文献5

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

PU场景下基于迁移学习的软件缺陷预测被引量：1