基于改进稀疏自编码神经网络的软件缺陷预测被引量：4

Software defects prediction based on improved sparse auto-encoder neural networks

下载PDF

导出

摘要针对软件缺陷预测时普遍存在的样本缺陷数据不平衡、特征冗余等问题,引进稀疏自编码(SAE)神经网络并加以改进,提出了一种新的分类模型。模型结合了SAE神经网络和少数样本合成过采样技术(SMOTE)的优点,可弥补传统分类方法在软件缺陷预测时忽视少数类分类效果、不能很好地保留数据内部特征等不足。基于NASA软件缺陷公共数据库中多个数据集的实验结果表明:提出的模型在软件缺陷预测方面的分类效果明显优于其他算法,尤其提高了不平衡数据集中少数类的分类精度。 In view of common problems such as data imbalance and feature redundancy in software defect prediction,the sparse auto-encoder(SAE) neural network is introduced and improved,a new classification model is proposed. Combining with advantages of SAE neural network and synthetic minority over-sampling technique (SMOTE),the model can make up for the shortcomings of the traditional classification methods such as ignoring minority categories effects and not able to retain inner feature of data. The result of experiments base on some databases of NASA Metrics Data repository shows that the classification effect of proposed model is superior to other traditional algorithms in software defects prediction,especially improve the minority category classification precision of imbalanced datasets.

作者徐海涛高莹苏娜 XU Hai-tao;GAO Ying;SU Na(School of Computer,Hangzhou Dianzi University,Hangzhou 310018,China)

机构地区杭州电子科技大学计算机学院

出处《传感器与微系统》 CSCD 2019年第2期49-51,62,共4页 Transducer and Microsystem Technologies

基金国家自然科学基金资助项目(61572165)

关键词过采样稀疏自编码神经网络软件缺陷预测不平衡 over-sampling sparse auto-encoder (SAE) neural network software defect prediction imbalanced

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1杨保杰,王彬,薛洁,代照坤,刘辉,熊新.基于深度自动编码器的脑网络状态观测矩阵降维方法[J].传感器与微系统,2017,36(1):9-12. 被引量：3
2王超学,张涛,马春森.面向不平衡数据集的改进型SMOTE算法[J].计算机科学与探索,2014,8(6):727-734. 被引量：23

二级参考文献10

1杨智明,乔立岩,彭喜元.基于改进SMOTE的不平衡数据挖掘方法研究[J].电子学报,2007,35(B12):22-26. 被引量：30
2郝秀兰,陶晓鹏,徐和祥,胡运发.kNN文本分类器类偏斜问题的一种处理对策[J].计算机研究与发展,2009,46(1):52-61. 被引量：33
3杨扬,李善平.基于实例重要性的SVM解不平衡数据分类[J].模式识别与人工智能,2009,22(6):913-918. 被引量：14
4顾亚祥,丁世飞.支持向量机研究进展[J].计算机科学,2011,38(2):14-17. 被引量：118
5陈思,郭躬德,陈黎飞.基于聚类融合的不平衡数据分类方法[J].模式识别与人工智能,2010,23(6):772-780. 被引量：28
6侯长军,宋坤,彭剑,霍丹群,董家乐,黄承洪.基于可视化传感器阵列系统的肺癌标志物快速检测研究[J].传感器与微系统,2012,31(9):57-59. 被引量：4
7焦圣喜,魏宏建.粗集与小波在医学超声图像降噪中的应用[J].传感器与微系统,2013,32(8):146-148. 被引量：2
8杨剑,陈书燊,皇甫浩然,梁佩鹏,钟宁.静息态脑电信号动态功能连接分析[J].物理学报,2015,64(5):374-383. 被引量：14
9张欣,胡新韬,郭雷.基于动态功能连接的运动任务大脑状态表达[J].计算机应用,2015,35(7):1933-1938. 被引量：4
10刘剑钊,董朝轶,冯丽斐.基于互信息的生物神经网络功能性连接辨识[J].传感器与微系统,2016,35(6):59-61. 被引量：2

共引文献24

1陈弓.基于不平衡算法的恶意网络行为检测分析[J].信息技术与信息化,2016(8):121-125.
2张成刚,宋佳智,姜静清,裴志利.一种改进的降噪自编码神经网络不平衡数据分类算法[J].计算机应用研究,2017,34(5):1329-1332. 被引量：16
3吴非,吴向前,陈晓燕.改进随机森林算法在Android恶意软件检测中的应用[J].新疆大学学报（自然科学版）,2017,34(3):322-327. 被引量：3
4武森,刘露,卢丹.基于聚类欠采样的集成不均衡数据分类算法[J].工程科学学报,2017,39(8):1244-1253. 被引量：12
5孟杰,李田,苑泽明.基于ODR-BADASYN-SVM的中小企业信用风险评估[J].金融发展研究,2018(1):24-31. 被引量：4
6朱安安.基于过采样SVM的不平衡数据信用评价模型[J].软件导刊,2018,17(10):64-67. 被引量：7
7赵鑫,强彦,强梓林,赵涓涓,杜晓平.基于局部感受野和半监督深度自编码的肺结节检测方法[J].科学技术与工程,2017,17(33):125-130. 被引量：4
8高超,许翰林.基于支持向量机的不均衡文本分类方法[J].现代电子技术,2018,41(15):183-186. 被引量：8
9魏浩,李红,刘小豫.一种改进的SMOTE算法[J].河南科学,2018,36(7):1009-1013. 被引量：3
10郭子洋,王彬,薛洁,熊新,刘畅,刘辉.时间约束NMF算法及其在动态脑功能网络降维中的应用[J].信号处理,2019,35(4):693-703. 被引量：1

同被引文献55

1吕坤,高珊.一种基于改进的BP神经网络算法的布匹瑕疵分类器[J].微电子学与计算机,2006,23(3):88-90. 被引量：3
2俞华锋.神经网络在软件可靠性预测中的应用研究[J].计算机仿真,2011,28(4):203-207. 被引量：5
3缪林松.基于代价敏感神经网络算法的软件缺陷预测[J].电子科技,2012,25(6):75-78. 被引量：9
4凤超,梁炜,张晓玲,杨雨沱,谈金东.基于隐马尔可夫模型的躯感网心电图信号特征提取方法[J].信息与控制,2012,41(5):628-636. 被引量：2
5吕刚,陈立.小波变换和支持向量机相融合的ECG身份识别[J].计算机工程与应用,2013,49(24):195-199. 被引量：5
6刘芳,高兴,周冰,邓娟.基于PCA-ISVM的软件缺陷预测模型[J].计算机仿真,2014,31(3):397-401. 被引量：6
7张家海,孙枫,谢荣生,郝燕玲.估测组合导航系统软件缺陷的一种神经网络方法[J].哈尔滨工程大学学报,2001,22(1):55-58. 被引量：8
8宋化志,马于涛.DeepTriage:一种基于深度学习的软件缺陷自动分配方法[J].小型微型计算机系统,2019,40(1):126-132. 被引量：10
9吴方君.软件缺陷预测经验共享:一种迁移学习方法[J].小型微型计算机系统,2014,35(11):2416-2421. 被引量：5
10宫丽娜,马怀志.粒子群算法优化的BP网络预测软件质量[J].计算机工程与应用,2014,50(23):65-68. 被引量：8

引证文献4

1吴方君.静态软件缺陷预测研究进展[J].计算机科学与探索,2019,13(10):1621-1637. 被引量：13
2马辉.基于改进神经网络的静态软件缺陷自动分配方法[J].信息与电脑,2021,33(4):68-70.
3周金治,郑淋文,黄静,涂道鑫,赖健琼.面向躯感网的心电融合特征分析方法[J].传感器与微系统,2021,40(9):30-33.
4刘灿,田川,王闯,李阳.基于改进堆叠自编码网络的软件质量预测方法[J].长江信息通信,2021,34(12):4-7. 被引量：2

二级引证文献15

1张晓峰.软件缺陷预测研究综述[J].信息通信,2020(4):125-127.
2张明亮.基于源文件可疑度的静态软件缺陷检测方法研究[J].黑龙江工业学院学报（综合版）,2020,20(6):55-59. 被引量：1
3张瑞,李学威.基于大数据的静态软件缺陷预测方法研究[J].信息与电脑,2020,32(19):43-44.
4丁晓梅.基于集成学习的静态软件缺陷预测模型构建[J].成都工业学院学报,2021,24(1):12-16. 被引量：1
5马辉.基于改进神经网络的静态软件缺陷自动分配方法[J].信息与电脑,2021,33(4):68-70.
6郑小萌,高猛,滕俊元.航天器软件缺陷预测数据集构建方法研究[J].计算机科学,2021,48(S01):575-580. 被引量：2
7尤姗姗,刘雪娇.基于非线性集成深度学习的软件模块风险预测[J].计算机仿真,2021,38(11):305-308.
8黄涛.基于工具的移动应用代码缺陷静态检测研究[J].武汉工程职业技术学院学报,2022,34(1):22-26. 被引量：2
9颜慧.基于机器学习的软件缺陷倾向性预测研究[J].电脑知识与技术,2022,18(7):67-70.
10王培.基于改进堆叠自编码网络的串行总线通信软件开发技术[J].长江信息通信,2022,35(9):61-63. 被引量：1

1于天琪,朱咏絮,王现斌.基于边缘计算的物联网监测系统中利用自编码神经网络实现的异常检测[J].物联网学报,2018,2(4):14-21. 被引量：10
2李文,张林郁.新产品研发原型数据关键特征准确提取仿真[J].计算机仿真,2018,35(11):383-386.
3于小青,马素霞,郑智聪.基于堆栈稀疏降噪自编码的电压暂降源识别方法[J].电力信息与通信技术,2018,16(11):47-52. 被引量：6
4杨文元.多标记学习自编码网络无监督维数约简[J].智能系统学报,2018,13(5):808-817. 被引量：5
5张俐,袁玉宇,王枞.基于最大相关信息系数的FCBF特征选择算法[J].北京邮电大学学报,2018,41(4):86-90. 被引量：11
6刘静,杨正校.改进ACO-SVM在网络入侵检测中的应用[J].软件,2018,39(10):57-59. 被引量：6
7科技日报.郑洪坤:用大数据探究基因奥秘[J].知识文库,2018,0(10):30-30.
8姚宇晨,彭虎.基于深度学习的通信信号自动调制识别技术[J].电子技术应用,2019,45(2):12-15. 被引量：26
9于思璇,王华伟.基于稀疏降噪自编码神经网络的通用航空风险预测[J].系统工程与电子技术,2019,41(1):112-117. 被引量：6
10李此君,刘云鹏.基于协方差流形和LogitBoost的异常驾驶行为识别方法[J].激光与光电子学进展,2018,55(11):332-339. 被引量：5

传感器与微系统

2019年第2期

浏览历史

内容加载中请稍等...

基于改进稀疏自编码神经网络的软件缺陷预测被引量：4

参考文献2

二级参考文献10

共引文献24

同被引文献55

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于改进稀疏自编码神经网络的软件缺陷预测 被引量：4

参考文献2

二级参考文献10

共引文献24

同被引文献55

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于改进稀疏自编码神经网络的软件缺陷预测被引量：4