期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于软件历史仓库和抽象语法树的相似缺陷识别方法 被引量:7
1
作者 龚丹 王甜甜 +1 位作者 苏小红 董美含 《系统工程与电子技术》 EI CSCD 北大核心 2020年第10期2399-2408,共10页
软件开发过程中,软件开发人员常常通过搜索软件历史仓库(historical software repository,HSR),再经复制/粘贴以实现软件复用。HSR中会保存被复用的代码的缺陷及修复信息,辅助处理相似缺陷。基于此,提出一种基于HSR挖掘的相似缺陷识别... 软件开发过程中,软件开发人员常常通过搜索软件历史仓库(historical software repository,HSR),再经复制/粘贴以实现软件复用。HSR中会保存被复用的代码的缺陷及修复信息,辅助处理相似缺陷。基于此,提出一种基于HSR挖掘的相似缺陷识别方法。首先,基于变更日志的分析,从HSR中提取出已知缺陷的模块,建立bug模块库。然后,采用基于抽象语法树(abstract syntax tree,AST)的相似代码检测方法,识别待测试软件与bug模块库中相似的代码,并借助HSR中保存的相应缺陷及修复信息,完成待测试软件中可能包含潜在缺陷的模块的识别。同时,为提高相似代码的识别精度,优化基于AST的代码特征度量。在18个C程序、164对克隆代码上进行实验,结果表明所提方法能够识别出全部相似代码且性能优于已有工具。在人工构建的bug模块库上验证了代码相似性对相似缺陷识别的作用。最后,在8个真实的大型C项目上进行验证,平均缺陷召回率达到94%,表明挖掘HSR可以有效地为跨项目传播的相似代码提供缺陷理解支持。 展开更多
关键词 软件复用 软件历史仓库 克隆代码 相似缺陷 抽象语法树
下载PDF
基于多目标优化算法NSGA-II推荐相似缺陷报告 被引量:13
2
作者 樊田田 许蕾 陈林 《计算机学报》 EI CSCD 北大核心 2019年第10期2175-2189,共15页
在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基... 在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基于多目标优化算法NSGA-Ⅱ推荐相似缺陷报告的方法,即在推荐尽可能少的相似缺陷报告情况下,使得缺陷报告间的相似度尽可能大.为此,利用缺陷报告的摘要和描述信息,该文采用TFIDF和Word Embedding两种方法,从历史缺陷报告中找出相似的缺陷报告,并采用基于搜索的多目标优化算法NSGA-Ⅱ来保证推荐的相似缺陷报告数目尽可能少.实验数据集是6个开源项目(AspectJ、Birt、Eclipse UI、JDT、SWT和Tomcat).与采用单目标算法相比,该文方法在推荐相似缺陷报告的准确率、平均准确率均值、平均序位倒数均值都有提高,其中,在Top@1准确率、平均准确率均值、平均序位倒数均值上分别比Yang方法提高125.5%、67.7%和62.75%. 展开更多
关键词 相似缺陷报告推荐 多目标优化 空间向量模型 词嵌入模型 NSGA-Ⅱ算法 软件工程
下载PDF
Stack Overflow的缺陷代码特征分析与相似缺陷检测 被引量:2
3
作者 亢振兴 赵逢禹 刘亚 《小型微型计算机系统》 CSCD 北大核心 2021年第3期661-665,共5页
目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关... 目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关于缺陷代码的信息,提出一种基于缺陷代码特征分析的相似缺陷检测方法.该方法首先对缺陷报告进行LDA主题分析并将缺陷报告分类到不同的主题(类别)中,统计得到高频缺陷类别;其次对于高频缺陷类别的缺陷代码提取特征;最后根据缺陷代码特征构建相似缺陷检测模型.为了验证相似缺陷检测模型的有效性,针对数据操作缺陷数据构建诊断模型并对该模型进行实证,实验结果表明该方法对检测其他代码中相似缺陷有较好的效果. 展开更多
关键词 Stack Overflow LDA 缺陷代码特征 特征相似 相似缺陷检测
下载PDF
知识驱动的相似缺陷报告推荐方法
4
作者 余笙 李斌 +2 位作者 孙小兵 薄莉莉 周澄 《计算机科学》 CSCD 北大核心 2021年第5期91-98,共8页
软件缺陷在软件开发过程中不可避免,提交的缺陷报告则是分析和修复缺陷的重要信息来源。开发人员常通过借鉴相似的历史缺陷报告和修复信息来辅助对当前新缺陷的分析和修复。文中提出了一种知识驱动的相似缺陷报告推荐方法。该方法首先... 软件缺陷在软件开发过程中不可避免,提交的缺陷报告则是分析和修复缺陷的重要信息来源。开发人员常通过借鉴相似的历史缺陷报告和修复信息来辅助对当前新缺陷的分析和修复。文中提出了一种知识驱动的相似缺陷报告推荐方法。该方法首先利用信息检索和Word Embedding技术构建缺陷知识图谱;然后利用TF-IDF和Word Embedding技术计算缺陷报告之间的文本相似度,同时综合考虑缺陷的各项属性,从而得到缺陷报告之间的主次要属性相似度;最后将上述相似度融合成综合相似度,利用综合相似度推荐相似缺陷报告。实验结果表明,与基线方法相比,在Firefox数据集上所提方法的性能平均提高了12.7%。 展开更多
关键词 相似缺陷报告 信息检索 词嵌 知识图谱 推荐系统
下载PDF
冷轧带钢表面相似线性缺陷检测 被引量:5
5
作者 刘圆圆 卜明龙 +1 位作者 徐国庆 郝惠敏 《机械设计与制造》 北大核心 2023年第1期120-123,共4页
针对现有冷轧带钢表面的相似线状缺陷检测精度与识别率差的问题,提出一种局部二制模式LBP直方图特征与支持向量机SVM相结合的检测算法。通过对采集的大量划伤与夹杂的带钢表面缺陷图进行预处理,获得感兴趣区域,再进一步利用LBP等价模式... 针对现有冷轧带钢表面的相似线状缺陷检测精度与识别率差的问题,提出一种局部二制模式LBP直方图特征与支持向量机SVM相结合的检测算法。通过对采集的大量划伤与夹杂的带钢表面缺陷图进行预处理,获得感兴趣区域,再进一步利用LBP等价模式获得目标区域的LBP直方图信息,结果显示可以很好地分辨缺陷与非缺陷,并描述的各种缺陷具有可分辨性。采用核函数为径向基函数核的SVM分类器训练识别,结果表明:该方法对划伤和夹杂的缺陷检测准确率达98%。 展开更多
关键词 冷轧带钢 表面相似缺陷 局部二制模式 支持向量机 缺陷检测
下载PDF
基于缺陷相似度与再分配图的软件缺陷分配方法 被引量:1
6
作者 史高翔 赵逢禹 《计算机科学》 CSCD 北大核心 2016年第11期246-251,共6页
准确地将缺陷分配给最合适的修复者对大型软件项目的缺陷修复具有重要意义。当前缺陷自动分配技术的研究主要利用历史缺陷报告的描述信息、缺陷关联信息、历史分派信息等,但这些方法都没有将缺陷报告信息充分挖掘。提出在缺陷报告分配... 准确地将缺陷分配给最合适的修复者对大型软件项目的缺陷修复具有重要意义。当前缺陷自动分配技术的研究主要利用历史缺陷报告的描述信息、缺陷关联信息、历史分派信息等,但这些方法都没有将缺陷报告信息充分挖掘。提出在缺陷报告分配时将缺陷历史分派信息和缺陷文本相似信息相结合。首先根据缺陷历史分派信息生成再分配图;然后计算新缺陷报告与历史缺陷报告缺陷的文本相似度,找出相似度最高的前K个缺陷报告所对应的修复者;最后,根据这些修复者在再分配图中的依赖关系生成预测再分配路径。为了验证该方法的有效性,利用Eclipse和Mozilla的缺陷报告集进行实验,实验表明提出的方法在预测的准确度上明显优于其他方法。 展开更多
关键词 历史缺陷报告 缺陷相似 再分配图 预测再分配路径
下载PDF
A feature selection approach based on a similarity measure for software defect prediction 被引量:3
7
作者 Qiao YU Shu-juan JIANG +1 位作者 Rong-cun WANG Hong-yang WANG 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2017年第11期1744-1753,共10页
Software defect prediction is aimed to find potential defects based on historical data and software features. Software features can reflect the characteristics of software modules. However, some of these features may ... Software defect prediction is aimed to find potential defects based on historical data and software features. Software features can reflect the characteristics of software modules. However, some of these features may be more relevant to the class (defective or non-defective), but others may be redundant or irrelevant. To fully measure the correlation between different features and the class, we present a feature selection approach based on a similarity measure (SM) for software defect prediction. First, the feature weights are updated according to the similarity of samples in different classes. Second, a feature ranking list is generated by sorting the feature weights in descending order, and all feature subsets are selected from the feature ranking list in sequence. Finally, all feature subsets are evaluated on a k-nearest neighbor (KNN) model and measured by an area under curve (AUC) metric for classification performance. The experiments are conducted on 11 National Aeronautics and Space Administration (NASA) datasets, and the results show that our approach performs better than or is comparable to the compared feature selection approaches in terms of classification performance. 展开更多
关键词 Software defect prediction Feature selection Similarity measure Feature weights Feature ranking list
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部