基于模糊加权极限学习机的类不平衡软件缺陷预测被引量：2

Fuzzy weighted extreme learning machine for imbalanced software defect prediction

下载PDF

导出

摘要在软件缺陷预测中,普遍存在软件缺陷数据的类不平衡问题,严重影响着传统预测模型的性能.为了缓解类不平衡对预测模型性能的影响,引入模糊集的思想,提出了一种基于相对密度的模糊加权极限学习机算法.该方法首先采用所提的相对密度方法求出适用于不同数据样本的加权矩阵,进而将其与传统加权极限学习机结合,并训练模糊极限学习机,最后通过NASA软件缺陷类不平衡数据对所提方法的有效性和可行性进行验证.实验结果表明:与诸多类不平衡软件缺陷预测方法相比,文中方法具有更好的预测性能,并在G-mean、AUC和Balance的评价指标上有较优表现. In software defect predictions,the problem of class imbalance of software defect data is common,seriously affecting the performance of traditional prediction models.To alleviate the impact of class imbalance problem,this paper presents a fuzzy weighted extreme learning machine based on relative density information(FWELM-RD)algorithm and fuzzy set.First,a suitable weight matrix for different data samples is constructed based the proposed relative density information.Next,the weight matrix is combined with the traditional weighted extreme learning machine,and then a fuzzy extreme learning machine is trained.Finally,the validity and feasibility of the proposed method are verified by NASA software defect imbalanced datasets.The experiment results indicate that the proposed method can acquire better performance than traditional defect prediction model for class imbalance problem.Furthermore,FWELM-RD performs better in terms of the measures including G-mean,AUC and Balance.

作者郑尚孙丹于化龙 ZHENG Shang;SUN Dan;YU Hualong(School of Computer Science,Jiangsu University of Science and Technology,Zhenjiang 212003,China)

机构地区江苏科技大学计算机学院

出处《江苏科技大学学报（自然科学版）》 CAS 2019年第4期67-73,共7页 Journal of Jiangsu University of Science and Technology:Natural Science Edition

基金国家自然科学基金资助项目(61305058) 江苏省自然科学基金资助项目(BK20130471) 中国博士后特别资助计划项目(2015T80481) 中国博士后科学基金资助项目(2013M540404) 江苏省博士后基金资助项目(1401037B) 江苏科技大学2015人才引进项目江苏省高校自然科学基金资助项目(18KJB520011)

关键词软件缺陷预测数据不平衡相对密度模糊加权 software defect prediction data imbalance relative density fuzzy weight

分类号 TP311.5 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123
2刘福伦,闵帆,张本文.代价敏感代表选举的邻域覆盖粗糙集分类方法[J].江苏科技大学学报（自然科学版）,2017,31(2):190-195. 被引量：5
3王青,伍书剑,李明树.软件缺陷预测技术[J].软件学报,2008,19(7):1565-1580. 被引量：149

二级参考文献139

1陈火旺,王戟,董威.高可信软件工程技术[J].电子学报,2003,31(z1):1933-1938. 被引量：115
2张文浩,曹健.软件缺陷预防过程与方法[J].计算机工程,2004,30(B12):23-24. 被引量：4
3胡玉鹏,陈治平,林亚平,李军义.贝叶斯缺陷分析模型及其在软件测试中的应用[J].计算机应用,2005,25(4):808-810. 被引量：3
4刘宏伟,杨孝宗,岳晓光,曲峰.一个NHPP类软件可靠性增长模型框架[J].计算机工程与科学,2005,27(4):1-2. 被引量：4
5陈莉,刘海红,盛昌,陈威.可靠性增长模型和正交缺陷分类的结合及在过程定性分析中的应用[J].科学技术与工程,2005,5(14):963-966. 被引量：1
6郭树行,兰雨晴,金茂忠.软件构件的可信保证研究[J].计算机科学,2007,34(5):243-246. 被引量：14
7郭树行,兰雨晴,金茂忠.基于目标的软件可信性需求规约方法研究[J].计算机工程,2007,33(11):37-38. 被引量：3
8王青,伍书剑,李明树.软件缺陷预测技术.软件学报,2008,19(7):1565—1580.http://www.jos.org.cn/1000—9825/19/1565.htm.
9Hall T, Beecham S, Bowes D, Gray D, Counsell S. A systematic literature review on fault prediction performance in software engineering. IEEE Trans. on Software Engineering, 2012,38(6): 1276-1304. [doi: 10.1109/TSE.2011.103 ].
10Radjenovic D, Hericko M, Torkar R, Zivkovic A. Software fault prediction metrics: A systematic literature review. Information and Software Technology, 2013,55(8): 1397-1418. [doi: 10.1016/j.infsof.2013.02.009].

共引文献235

1郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3秦庆强,魏启国.结合软件开发过程的软件缺陷预测方法[J].计算机应用研究,2020,37(S02):210-213.
4贾燕华,李英梅.基于自适应聚类过采样的软件缺陷预测研究[J].哈尔滨师范大学自然科学学报,2023,39(2):45-50. 被引量：1
5左旭辉,李文泽.高效的小型软件项目的质量保障体系[J].计算机工程与设计,2009,30(9):2211-2212. 被引量：1
6吴超,许建平,陈丽容.基于生命周期的软件缺陷预测技术[J].计算机工程与设计,2009,30(12):2956-2959. 被引量：7
7李宁,李战怀.软件缺陷数据处理研究综述[J].计算机科学,2009,36(8):21-25. 被引量：11
8罗云锋,贲可荣.软件故障静态预测方法综述[J].计算机科学与探索,2009,3(5):449-459. 被引量：6
9王科欣,王胜利.基于贝叶斯网络技术的软件缺陷预测与故障诊断[J].微型电脑应用,2009(11):31-33. 被引量：5
10库燕,杨叶,李奇.基于COQUALMO的缺陷预测与校准工具的设计与实现[J].计算机工程与设计,2010,31(14):3185-3188.

同被引文献18

1张弦,王宏力.具有选择与遗忘机制的极端学习机在时间序列预测中的应用[J].物理学报,2011,60(8):68-74. 被引量：17
2菅小艳,韩素青,崔彩霞.不平衡数据集上的Relief特征选择算法[J].数据采集与处理,2016,31(4):838-844. 被引量：15
3鞠哲,曹隽喆,顾宏.用于不平衡数据分类的模糊支持向量机算法[J].大连理工大学学报,2016,56(5):525-531. 被引量：15
4周治平,朱书伟,张道文.分类数据的多目标模糊中心点聚类算法[J].计算机研究与发展,2016,53(11):2594-2606. 被引量：10
5张成刚,宋佳智,姜静清,裴志利.一种改进的降噪自编码神经网络不平衡数据分类算法[J].计算机应用研究,2017,34(5):1329-1332. 被引量：16
6高锋,黄海燕.基于邻域混合抽样和动态集成的不平衡数据分类方法[J].计算机科学,2017,44(8):225-229. 被引量：9
7顾晓清,蒋亦樟,王士同.用于不平衡数据分类的0阶TSK型模糊系统[J].自动化学报,2017,43(10):1773-1788. 被引量：16
8许明明,徐腾,胡中文,章华涛,季杭馨,姜海娇,王磊.基于ZEMAX和Python软件的空间引力波望远镜光程差算法研究与实现[J].应用光学,2017,38(6):872-876. 被引量：1
9吕艳霞,刘波男,王翠荣,王聪,万聪.面向概念漂移数据流的自适应增量集成分类算法[J].小型微型计算机系统,2019,40(12):2624-2630. 被引量：11
10崔巍,贾晓琳,樊帅帅,朱晓燕.一种新的不均衡关联分类算法[J].计算机科学,2020,47(S01):488-493. 被引量：7

引证文献2

1韦磊,姜海富,于化龙.基于特征结构不变性思想的自适应在线神经网络算法[J].江苏科技大学学报（自然科学版）,2022,36(1):67-75. 被引量：1
2刘影,徐辉.基于模糊关联的不平衡数据分类算法研究[J].齐齐哈尔大学学报（自然科学版）,2023,39(4):21-27.

二级引证文献1

1韩钰,邹炳燕.泵控液压系统中马达转速稳定控制及仿真分析[J].机床与液压,2024,52(6):153-159.

1金秀玲,柯荣泰.基于Boruta-SVM的软件缺陷预测[J].山西大同大学学报（自然科学版）,2019,35(4):34-37. 被引量：1
2李奇,张菁华,杨冰如,陈良,沈长青.基于生成对抗学习的旋转机械故障诊断研究[J].工业控制计算机,2019,32(8):88-89. 被引量：1
3陈祥焰,林耀进,王晨曦.基于邻域粗糙集的高维类不平衡数据在线流特征选择[J].模式识别与人工智能,2019,32(8):726-735. 被引量：17
4石振武,宋莹琪,刘洁.基于Delphi-FANP的城市基础设施PPP项目风险评价[J].土木工程与管理学报,2019,36(4):1-7. 被引量：9
5刘扬,赵洪激,董家梅.常压储罐系统可靠性研究[J].石油学报,2002,23(5):96-100. 被引量：7
6曹雅茜,黄海燕.基于代价敏感大间隔分布机的不平衡数据分类算法[J].华东理工大学学报（自然科学版）,2019,45(4):606-613. 被引量：1
7李艳琼,李冬冬,王喆,张静.万有引力近邻的多视角分类学习[J].计算机工程与应用,2019,55(17):137-142. 被引量：2
8黄玉荣,叶佐宽,朱春勇.漆包线在线检测分析系统在生产中的应用[J].电线电缆,2019,0(5):37-38. 被引量：1
9胡嘉成,王向阳,刘晗.基于深度学习的连铸坯表面缺陷检测[J].上海大学学报（自然科学版）,2019,25(4):445-452. 被引量：8
10蔡莉,李英姿,江芳,梁宇.面向城市热点区域的不平衡数据聚类挖掘研究[J].计算机科学,2019,46(8):16-22. 被引量：10

江苏科技大学学报（自然科学版）

2019年第4期

浏览历史

内容加载中请稍等...

基于模糊加权极限学习机的类不平衡软件缺陷预测被引量：2

参考文献3

二级参考文献139

共引文献235

同被引文献18

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于模糊加权极限学习机的类不平衡软件缺陷预测 被引量：2

参考文献3

二级参考文献139

共引文献235

同被引文献18

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于模糊加权极限学习机的类不平衡软件缺陷预测被引量：2