基于均衡有偏支持向量机的软件缺陷预测被引量：1

Software Defect Prediction Based on Balanced and Biased Support Vector Machine

下载PDF

导出

摘要针对软件缺陷预测中的样本集数量少和分布不对称问题,提出一种基于均衡有偏支持向量机的软件缺陷预测方法。该方法通过标记样本集和未标记样本集进行半监督学习,在少量非对称的标记样本集上,利用有偏支持向量机进行泛化学习。在半监督学习的迭代过程中,采用重采样策略平衡样本集以消除大量不对称的未标记样本集对软件缺陷预测的性能影响。在基准数据集上的实验结果表明,该方法能够有效地对类别不均衡的样本集进行软件缺陷预测。 There are two important issues in software defect prediction.It is difficult to collect a large amount of labeled training data to learn a good model.The data set is always imbalanced,since the software system contains much fewer defective modules than non-defective modules.In order to solve out these two problems,this paper proposes a novel semi-supervised learning approach named Balanced and Biased Support Vector Machine（B2SVM）.The method exploits the abundant unlabeled samples to improve the prediction accuracy,as well as employs sampling technology to handle the class-imbalance problem during the Biased Support Vector Machine（BSVM） learning process.Experimental results on class-imbalance dataset show that this method can go on software defect prediction for class imbalance sample set.

作者李倩茹姚伟

机构地区西安通信学院指挥信息系统系四川大学信息安全研究所公安部第三研究所信息网络安全研发中心

出处《计算机工程》 CAS CSCD 2013年第8期87-91,共5页 Computer Engineering

关键词机器学习半监督学习软件缺陷预测有偏支持向量机重采样 machine learning semi-supervised learning software defect prediction Biased Support Vector Machine（BSVM） resampling

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献14

1王青,伍书剑,李明树.软件缺陷预测技术[J].软件学报,2008,19(7):1565-1580. 被引量：149
2Basili V R,Briand L C,Melo W L.A Validation of Objec-toriented Design Metrics as Quality Indicators[J].IEEETransactions on Software Engineering,1996,22(10):751-761.
3Khoshgoftaar T M,Yuan Xiaojing,Allen E B.BalancingMisclassification Rates in Classification-tree Models ofSoftware Quality[J].Empirical Software Engineering,2000,5(4):313-330.
4Khoshgoftaar T M,Allen E B.Neural Networks for SoftwareQuality Prediction[M]//Pedrycz W,Peters J F.ComputationalIntelligence in Software Engineering.Singapore:WorldScientific,1998:33-63.
5Pérez-Mi ana E,Gras J.Improving Fault Prediction UsingBayesian Networks for the Development of EmbeddedSoftware Applications[J].Software Testing,Verification&Reliability,2006,16(3):157-174.
6Xing Fei,Guo Ping,Lyu M R.A Novel Method for EarlySoftware Quality Prediction Based on Support VectorMachine[C]//Proceedings of the 16th IEEE InternationalSymposium on Software Reliability Engineering.Chicago,USA:IEEE Press,2005.
7Lessmann S,Baesens B,Mues C,et al.Benchmarking Classi-fication Models for Software Defect Prediction:A ProposedFramework and Novel Findings[J].IEEE Transactions onSoftware Engineering,2008,34(4):485-496.
8姜远,黎铭,周志华.Software Defect Detection with ROCUS[J].Journal of Computer Science & Technology,2011,26(2):328-342. 被引量：11
9Seliya N,Khoshgoftaar T M.Software Quality Estimationwith Limited Fault Data:A Semi-supervised LearningPerspective[J].Software Quality Journal,2007,15(3):327-344.
10Pelayo L,Dick S.Applying Novel Resampling Strategies toSoftware Defect Prediction[C]//Proceedings of AnnualMeeting of the North American Fuzzy Information ProcessingSociety.San Diego,USA:IEEE Press,2007:69-72.

二级参考文献73

1陈火旺,王戟,董威.高可信软件工程技术[J].电子学报,2003,31(z1):1933-1938. 被引量：115
2徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
3张文浩,曹健.软件缺陷预防过程与方法[J].计算机工程,2004,30(B12):23-24. 被引量：4
4胡玉鹏,陈治平,林亚平,李军义.贝叶斯缺陷分析模型及其在软件测试中的应用[J].计算机应用,2005,25(4):808-810. 被引量：3
5刘宏伟,杨孝宗,岳晓光,曲峰.一个NHPP类软件可靠性增长模型框架[J].计算机工程与科学,2005,27(4):1-2. 被引量：4
6陈莉,刘海红,盛昌,陈威.可靠性增长模型和正交缺陷分类的结合及在过程定性分析中的应用[J].科学技术与工程,2005,5(14):963-966. 被引量：1
7张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：121
8郭树行,兰雨晴,金茂忠.软件构件的可信保证研究[J].计算机科学,2007,34(5):243-246. 被引量：14
9郭树行,兰雨晴,金茂忠.基于目标的软件可信性需求规约方法研究[J].计算机工程,2007,33(11):37-38. 被引量：3
10Blum A, Mitchell T. Combining labeled and unlabeled data with co-training. In Proc. the 11th Annual Conference on Computational Learning Theory, Madison, USA, Jul.24-26,1998,pp.92-100.

共引文献175

1郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
2秦庆强,魏启国.结合软件开发过程的软件缺陷预测方法[J].计算机应用研究,2020,37(S02):210-213.
3左旭辉,李文泽.高效的小型软件项目的质量保障体系[J].计算机工程与设计,2009,30(9):2211-2212. 被引量：1
4吴超,许建平,陈丽容.基于生命周期的软件缺陷预测技术[J].计算机工程与设计,2009,30(12):2956-2959. 被引量：7
5李宁,李战怀.软件缺陷数据处理研究综述[J].计算机科学,2009,36(8):21-25. 被引量：11
6罗云锋,贲可荣.软件故障静态预测方法综述[J].计算机科学与探索,2009,3(5):449-459. 被引量：6
7王科欣,王胜利.基于贝叶斯网络技术的软件缺陷预测与故障诊断[J].微型电脑应用,2009(11):31-33. 被引量：5
8库燕,杨叶,李奇.基于COQUALMO的缺陷预测与校准工具的设计与实现[J].计算机工程与设计,2010,31(14):3185-3188.
9张垚,袁志海,江海燕.一种面向对象软件缺陷的早期预测方法[J].计算机技术与发展,2010,20(8):37-40. 被引量：5
10占济舟,周献中,赵佳宝,王建峰.基于失信因子的软件缺陷预测模型[J].中国管理科学,2010,18(6):89-96.

同被引文献9

1LOU DER-CHYUAN, LIU CHIANG-LUNG, LIN CHIN-LIN. Message estimation for universal steganalysis using multi-classifica- tion support vector machine [ J ]. Computer Standards & Interfaces,2009,31 (2) :420-427.
2姜远,黎铭,周志华.Software Defect Detection with ROCUS[J].Journal of Computer Science & Technology,2011,26(2):328-342. 被引量：11
3姜慧研,宗茂,刘相莹.基于ACO-SVM的软件缺陷预测模型的研究[J].计算机学报,2011,34(6):1148-1154. 被引量：44
4王涛,李伟华,刘尊,史豪斌.基于支持向量机的软件缺陷预测模型[J].西北工业大学学报,2011,29(6):864-870. 被引量：14
5王培,金聪.遗传优化支持向量机在软件缺陷预测中的应用[J].电子测量技术,2012,35(2):126-129. 被引量：10
6雷挺.基于缺陷分类和缺陷预测的软件缺陷预防[J].计算机工程与设计,2013,34(1):215-220. 被引量：3
7袁东锋,吕聪颖.改进蚁群算法在二次分配问题中的应用[J].计算机与现代化,2013(3):9-11. 被引量：2
8包祎,王涛,裘国永.应用直线集合分割的软件缺陷预测模型[J].计算机工程与应用,2013,49(14):34-38. 被引量：1
9吴晓萍,赵学靖,乔辉,刘东梅,王志.基于LASSO-SVM的软件缺陷预测模型研究[J].计算机应用研究,2013,30(9):2748-2751. 被引量：16

引证文献1

1杨泽辉,李琳,乔冰琴.基于改进蚁群算法在软件缺陷预测中的应用[J].太原科技大学学报,2016,37(1):17-21.

1夏飞,李志斌,孟宪明,丁斌.证据理论在相似图像识别中的应用[J].上海电力学院学报,2006,22(4):363-365. 被引量：3
2段丹青,陈松乔,杨卫平.基于SVM主动学习的入侵检测系统[J].计算机工程,2007,33(1):153-155. 被引量：19
3叶义坤.如何解决电子公文(用WPS2000排版)标点符号不对称问题[J].贵州农村金融,2004(4):39-40.
4郭秀才,白琳琳,张学峰.基于ISM形状模型的目标检测算法[J].计算机应用与软件,2014,31(4):219-222. 被引量：1
5王昌红.搞定Word文档左右空白不对称问题[J].电脑知识与技术（经验技巧）,2017,0(2):21-21.
6万建武,杨明,吉根林,陈银娟.一种面向人脸识别的加权代价敏感局部保持投影[J].软件学报,2013,24(5):1155-1164. 被引量：9
7任克强,李辉环,谢斌.基于DWT的双重数字音频盲水印算法[J].江西理工大学学报,2011,32(3):1-5. 被引量：1
8丁国强,孙泽宇.基于节点序列动态均衡策略算法[J].计算机测量与控制,2013,21(8):2155-2157. 被引量：1
9郭佑民,张宏林,胡广鹏.基于功率控制的无线传感器网络能耗平衡策略[J].兰州交通大学学报,2011,30(3):103-106. 被引量：1
10代永强,王联国.带记忆功能的混合蛙跳算法[J].计算机工程与设计,2011,32(9):3170-3173. 被引量：15

计算机工程

2013年第8期

浏览历史

内容加载中请稍等...

基于均衡有偏支持向量机的软件缺陷预测被引量：1

参考文献14

二级参考文献73

共引文献175

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于均衡有偏支持向量机的软件缺陷预测 被引量：1

参考文献14

二级参考文献73

共引文献175

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于均衡有偏支持向量机的软件缺陷预测被引量：1