-
题名基于程序结构与语义特征融合的软件缺陷预测
被引量:1
- 1
-
-
作者
董玉坤
李浩杰
位欣欣
唐道龙
-
机构
中国石油大学(华东)计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第16期84-93,共10页
-
基金
山东省自然科学基金(ZR2021MF058)
中央高校基本科研业务经费资助项目(19CX02028A,20CX05016A)。
-
文摘
随着软件系统的规模越来越庞大,如何快速高效地预测软件中的程序缺陷成为一个研究热点。最近的研究引入了深度学习模型,使用神经网络提取代码特征构建分类器进行缺陷预测。针对现有的神经网络只在单层面、单粒度上提取代码特征,导致特征不够丰富,造成预测精度不高的问题,提出了一种基于特征融合的软件缺陷预测框架。通过将程序解析为抽象语法树(abstract syntax tree,AST)以及Token序列两种不同的程序表示方式,利用树卷积神经网络以及文本卷积神经网络分别提取代码的结构和语义特征进行特征融合,从而提取到更丰富的代码特征用于缺陷预测。同时改进了AST和Token序列提取方法,降低模型复杂度。选择使用公共存储库PROMISE中的公开数据集作为实验数据集,采用softmax分类器预测得到最终的预测结果。实验结果表明,该框架在实验数据集上可以获得比已有方法更高的F1-score。
-
关键词
软件缺陷预测
特征融合
树卷积神经网络(tbcnn)
文本卷积神经网络(TextCNN)
-
Keywords
software defect prediction
features fusion
tree-based convolutional neural network(tbcnn)
text convolu-tional neural networks(TextCNN)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-