基于模糊支持向量机的软件缺陷预测技术被引量：8

Software defect prediction technology based on fuzzy support vector machine

下载PDF

导出

摘要为克服软件缺陷预测中的类不平衡问题,提出机器学习模型GA-FSVM。去除软件数据集的冗余特征,使用模糊支持向量机作为分类器,针对软件缺陷预测问题提出相应的模糊隶属度函数,使其能适应数据集的类不平衡,应对数据集中的特异点,使用遗传算法进行参数调优,训练分类器。在NASA数据集上进行交叉验证的结果表明,和几种常见的算法相比,该方法能够提高有缺陷样本的F-measure值。 To solve the class imbalance problem in software defect prediction,a machine learning model GA-FSVM was proposed.The redundant features of software data sets were removed,and fuzzy support vector machine was used as classifier.In addition,the corresponding fuzzy membership functions for software defect prediction were proposed,which not only adapted to the data set of class imbalance,but also dealt with outliner in data set,and genetic algorithm was used for parameter tuning.The results of cross validation on NASA datasets show that the proposed method can improve the F-measure value of defective samples compared with several common algorithms.

作者程元启姚淑珍谭火彬李丹丹 CHENG Yuan-qi;YAO Shu-zhen;TAN Huo-bin;LI Dan-dan(School of Computer Science and Engineering,Beihang University,Beijing 100191,China;School of Software,Beihang University,Beijing 100191,China)

机构地区北京航空航天大学计算机学院北京航空航天大学软件学院

出处《计算机工程与设计》北大核心 2018年第9期2753-2757,共5页 Computer Engineering and Design

关键词软件缺陷预测模糊支持向量机类不平衡问题遗传算法机器学习 software defect prediction fuzzy support vector machine class imbalance genetic algorithm machine learning

分类号 TP311.5 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123

二级参考文献130

1王青,伍书剑,李明树.软件缺陷预测技术.软件学报,2008,19(7):1565—1580.http://www.jos.org.cn/1000—9825/19/1565.htm.
2Hall T, Beecham S, Bowes D, Gray D, Counsell S. A systematic literature review on fault prediction performance in software engineering. IEEE Trans. on Software Engineering, 2012,38(6): 1276-1304. [doi: 10.1109/TSE.2011.103 ].
3Radjenovic D, Hericko M, Torkar R, Zivkovic A. Software fault prediction metrics: A systematic literature review. Information and Software Technology, 2013,55(8): 1397-1418. [doi: 10.1016/j.infsof.2013.02.009].
4Akiyama E. An example of software system debugging. In: Proc. of the Int'1 Federation of Information Proc. Societies Congress. New York: Springer Science and Business Media, 1971. 353-359.
5Halstead MH. Elements of Software Science (Operating and Programming Systems Series). New York: Elsevier Science Inc., 1977.
6McCabe TJ. A complexity measure. IEEE Trans. on Software Engineering, 1976,2(4):308-320. [doi: 10.1109/TSE.1976.233837].
7Chidamber SR, Kemerer CF. A metrics suite for object oriented design. IEEE Trans. on Software Engineering, 1994,20(6): 476-493. [doi: 10.1109/32.295895].
8Basili VR, Briand LC, Melo WL. A validation of object-oriented design metrics as quality indicators. IEEE Trans. on Software Engineering, 1996,22(10):751-761. [doi: 10.1109/32.544352].
9Subramanyam R, Krishnan MS. Empirical analysis of CK metrics for object-oriented design complexity: Implications for software defects. IEEE Trans. on Software Engineering, 2003,29(4):297-310. [doi: 10.1109/TS E.2003.1191795].
10Zhou YM, Xu BW, Leung H. On the ability of complexity metrics to predict fault-prone classes in object-oriented systems. Journal of Systems and Software, 2010,83(4):660-674. [doi: 10.1016/j.jss.2009.11.704].

共引文献122

1郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3贾燕华,李英梅.基于自适应聚类过采样的软件缺陷预测研究[J].哈尔滨师范大学自然科学学报,2023,39(2):45-50. 被引量：1
4郑继栋.训练扎实指导有序──第十册《基础训练6》第五六七题教学设计[J].小学语文教学,2000(6):57-57.
5呙明辉.组态软件测试下电力系统程序缺陷检测仿真[J].计算机仿真,2018,35(12):325-328. 被引量：2
6陈翔.地方高等院校计算机专业本科生的科研能力培养方法研究[J].计算机教育,2016(6):17-21. 被引量：2
7刘望舒,陈翔,顾庆,刘树龙,陈道蓄.软件缺陷预测中基于聚类分析的特征选择方法[J].中国科学：信息科学,2016,46(9):1298-1320.
8王星,何鹏,陈丹,曾诚.跨项目缺陷预测中训练数据选择方法[J].计算机应用,2016,36(11):3165-3169. 被引量：3
9甘露,臧洌,李航.基于DA-SVM的软件缺陷预测模型[J].计算机与现代化,2017(2):36-39. 被引量：3
10陈翔,陆凌姣,吉人,魏世鑫.SBFS:基于搜索的软件缺陷预测特征选择框架[J].计算机应用研究,2017,34(4):1105-1108. 被引量：6

同被引文献71

1阳文锐,王如松,黄锦楼,陈展,李锋.反距离加权插值法在污染场地评价中的应用[J].应用生态学报,2007,18(9):2013-2018. 被引量：69
2王青,伍书剑,李明树.软件缺陷预测技术[J].软件学报,2008,19(7):1565-1580. 被引量：149
3余锦华,汪源源,陈萍.基于模糊支持向量机预测胎重的方法研究与比较[J].仪器仪表学报,2008,29(11):2241-2246. 被引量：4
4袁兴梅,杨明,杨杨.一种面向不平衡数据的结构化SVM集成分类器[J].模式识别与人工智能,2013,26(3):315-320. 被引量：22
5韩俊英,刘成忠.自适应混沌果蝇优化算法[J].计算机应用,2013,33(5):1313-1316. 被引量：46
6胡小生,张润晶,钟勇.两层聚类的类别不平衡数据挖掘算法[J].计算机科学,2013,40(11):271-275. 被引量：6
7李伟,郑征,郝鹏,高乙超,饶培峰,宫成.基于谓词执行序列的软件缺陷定位算法[J].计算机学报,2013,36(12):2406-2419. 被引量：11
8许海云,方曙.基于专利功效矩阵的技术主题关联分析及核心专利挖掘[J].情报学报,2014,33(2):158-166. 被引量：32
9李勇,刘战东,张海军.不平衡数据的集成分类算法综述[J].计算机应用研究,2014,31(5):1287-1291. 被引量：73
10陈翔,鞠小林,文万志,顾庆.基于程序频谱的动态缺陷定位方法研究[J].软件学报,2015,26(2):390-412. 被引量：43

引证文献8

1张建宁.基于改进动态图算法的软件保护技术[J].科技通报,2021,37(8):56-60. 被引量：1
2吉久明,施陈炜,李楠,康健.基于GloVe词向量的“技术——应用”发现研究[J].现代情报,2019,39(4):13-22. 被引量：5
3蒋兰华.基于迁移学习的软件缺陷预测技术研究[J].微型电脑应用,2019,35(4):93-94. 被引量：1
4蒋华,江日辰,王鑫,王慧娇.ADASYN和SMOTE相结合的不平衡数据分类算法[J].计算机仿真,2020,37(3):254-258. 被引量：15
5李莉,纪欣沅,宋嵩.回环软件缺陷数量预测模型[J].计算机工程与应用,2021,57(7):158-163. 被引量：3
6闫雅雯.基于CFOA优化模糊支持向量机的上证综指趋势预测研究[J].微型电脑应用,2021,37(5):52-54. 被引量：2
7黎家乐.基于朴素贝叶斯的软件缺陷预测[J].科学大众（科技创新）,2021(10):253-254.
8吴立胜,皮珣珣.基于交叉区域SMOTE算法的非平衡数据分类[J].电脑与电信,2023(7):75-79.

二级引证文献27

1程凤伟.基于划分融合的非平衡SVM分类算法[J].山西大学学报（自然科学版）,2021,44(1):56-61.
2李茂胜,王天一.基于多特征融合的羊养殖问句相似度评价方法[J].智能计算机与应用,2021,11(12):22-27.
3孔刘玲,刘秀文.基于改进YOLOv4算法的船舶目标检测方法[J].船舶工程,2022,44(1):96-103. 被引量：10
4朱应钊.异构迁移学习研究综述[J].电信科学,2020,36(3):100-110. 被引量：6
5徐玲玲,迟冬祥.面向不平衡数据集的机器学习分类策略[J].计算机工程与应用,2020,56(24):12-27. 被引量：59
6刘璐,蔡永明.基于语义加权的引文网络社区划分研究[J].新世纪图书馆,2021(1):50-56. 被引量：5
7陈欢,王忠震.基于TF-IDF特征词提取的不平衡文本分类[J].智能计算机与应用,2020,10(9):73-76. 被引量：1
8吴瑞霞,张志旺,王琰,周莉,岳峻,卢泰然.基于模糊多目标线性规划的软件缺陷预测方法研究[J].鲁东大学学报（自然科学版）,2021,37(2):131-138. 被引量：1
9杨政,尹春林,蔡迪,李慧斌.一种基于成词率和谱聚类的电力文本领域词发现方法[J].电子技术应用,2021,47(10):29-32. 被引量：1
10张浩,康海燕.基于特征优化生成对抗网络的在线交易反欺诈方法研究[J].郑州大学学报（理学版）,2022,54(1):69-74. 被引量：1

1杨龑,陈海滨,杨禹,朱斌.基于F-measure的生活垃圾分类效果评价指标优化研究[J].环境卫生工程,2018,26(3):1-3.
2王贵槐,谢朔,初秀民,洛天骄.基于深度学习的水面无人船前方船只图像识别方法[J].船舶工程,2018,40(4):19-22. 被引量：15
3潘秋羽.基于隐马尔可夫模型的网络入侵检测[J].网络空间安全,2018,9(4):65-68.
4齐莹,刘振丙,潘细朋,杨辉华.基于改进深度卷积神经网络的病理图像有丝分裂检测算法研究[J].计算机应用与软件,2018,35(9):199-204.
5尹涛,戴昭颖,闫冬,付建新.六西格玛管理在公司信息化系统中的应用研究[J].电子技术与软件工程,2018(16):182-184.
6郭慧,刘忠宝,赵文娟,张静.模糊双超球学习机[J].广西大学学报（自然科学版）,2018,43(3):1097-1102. 被引量：1
7徐荣图,贾明,宋凝芳.基于Faster R-CNN的保偏光纤偏振轴检测方法研究[J].半导体光电,2018,39(3):420-424. 被引量：3
8朱斌,郭岳,张富强.区间数多产品多计划期生产计划问题的目标规划求解方法[J].工业工程,2018,21(4):15-22. 被引量：2
9程东生,范广璐,俞雯静,伍飞,曾伟波.基于极限学习机的中文文本分类方法[J].重庆理工大学学报（自然科学）,2018,32(8):156-164. 被引量：5
10李中奇,丁俊英,杨辉,刘江.基于控制器匹配的高速列车广义预测控制方法[J].铁道学报,2018,40(9):82-89. 被引量：13

计算机工程与设计

2018年第9期

浏览历史

内容加载中请稍等...

基于模糊支持向量机的软件缺陷预测技术被引量：8

参考文献1

二级参考文献130

共引文献122

同被引文献71

引证文献8

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于模糊支持向量机的软件缺陷预测技术 被引量：8

参考文献1

二级参考文献130

共引文献122

同被引文献71

引证文献8

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于模糊支持向量机的软件缺陷预测技术被引量：8