期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
CLUBAS: An Algorithm and Java Based Tool for Software Bug Classification Using Bug Attributes Similarities
1
作者 Naresh Kumar Nagwani Shrish Verma 《Journal of Software Engineering and Applications》 2012年第6期436-447,共12页
In this paper, a software bug classification algorithm, CLUBAS (Classification of Software Bugs Using Bug Attribute Similarity) is presented. CLUBAS is a hybrid algorithm, and is designed by using text clustering, fre... In this paper, a software bug classification algorithm, CLUBAS (Classification of Software Bugs Using Bug Attribute Similarity) is presented. CLUBAS is a hybrid algorithm, and is designed by using text clustering, frequent term calculations and taxonomic terms mapping techniques. The algorithm CLUBAS is an example of classification using clustering technique. The proposed algorithm works in three major steps, in the first step text clusters are created using software bug textual attributes data and followed by the second step in which cluster labels are generated using label induction for each cluster, and in the third step, the cluster labels are mapped against the bug taxonomic terms to identify the appropriate categories of the bug clusters. The cluster labels are generated using frequent and meaningful terms present in the bug attributes, for the bugs belonging to the bug clusters. The designed algorithm is evaluated using the performance parameters F-measures and accuracy. These parameters are compared with the standard classification techniques like Na?ve Bayes, Naive Bayes Multinomial, J48, Support Vector Machine and Weka’s classification using clustering algorithms. A GUI (Graphical User Interface) based tool is also developed in java for the implementation of CLUBAS algorithm. 展开更多
关键词 SOFTWARE bug Mining SOFTWARE bug CLASSIFICATION bug CLUSTERING CLASSIFICATION Using CLUSTERING bug Attribute similarity bug CLASSIFICATION TOOL
下载PDF
ML-CLUBAS: A Multi Label Bug Classification Algorithm
2
作者 Naresh Kumar Nagwani Shrish Verma 《Journal of Software Engineering and Applications》 2012年第12期983-990,共8页
In this paper, a multi label variant of CLUBAS [1] algorithm, ML-CLUBAS (Multi Label-Classification of software Bugs Using Bug Attribute Similarity) is presented. CLUBAS is a hybrid algorithm, and is designed by using... In this paper, a multi label variant of CLUBAS [1] algorithm, ML-CLUBAS (Multi Label-Classification of software Bugs Using Bug Attribute Similarity) is presented. CLUBAS is a hybrid algorithm, and is designed by using text clustering, frequent term calculations and taxonomic terms mapping techniques, and is an example of classification using clustering technique. CLUBAS is a single label algorithm, where one bug cluster is exactly mapped to a single bug category. However a bug cluster can be mapped into the more than one bug category in case of cluster label matches with the more than one category term, for this purpose ML-CLUBAS a multi label variant of CLUBAS is presented in this work. The designed algorithm is evaluated using the performance parameters F-measures and accuracy, number of clusters and purity. These parameters are compared with the CLUBAS and other multi label text clustering algorithms. 展开更多
关键词 SOFTWARE bug Mining SOFTWARE bug CLASSIFICATION bug CLUSTERING CLASSIFICATION Using CLUSTERING bug Attribute similarity MULTI LABEL CLASSIFICATION
下载PDF
基于软件历史仓库和抽象语法树的相似缺陷识别方法 被引量:7
3
作者 龚丹 王甜甜 +1 位作者 苏小红 董美含 《系统工程与电子技术》 EI CSCD 北大核心 2020年第10期2399-2408,共10页
软件开发过程中,软件开发人员常常通过搜索软件历史仓库(historical software repository,HSR),再经复制/粘贴以实现软件复用。HSR中会保存被复用的代码的缺陷及修复信息,辅助处理相似缺陷。基于此,提出一种基于HSR挖掘的相似缺陷识别... 软件开发过程中,软件开发人员常常通过搜索软件历史仓库(historical software repository,HSR),再经复制/粘贴以实现软件复用。HSR中会保存被复用的代码的缺陷及修复信息,辅助处理相似缺陷。基于此,提出一种基于HSR挖掘的相似缺陷识别方法。首先,基于变更日志的分析,从HSR中提取出已知缺陷的模块,建立bug模块库。然后,采用基于抽象语法树(abstract syntax tree,AST)的相似代码检测方法,识别待测试软件与bug模块库中相似的代码,并借助HSR中保存的相应缺陷及修复信息,完成待测试软件中可能包含潜在缺陷的模块的识别。同时,为提高相似代码的识别精度,优化基于AST的代码特征度量。在18个C程序、164对克隆代码上进行实验,结果表明所提方法能够识别出全部相似代码且性能优于已有工具。在人工构建的bug模块库上验证了代码相似性对相似缺陷识别的作用。最后,在8个真实的大型C项目上进行验证,平均缺陷召回率达到94%,表明挖掘HSR可以有效地为跨项目传播的相似代码提供缺陷理解支持。 展开更多
关键词 软件复用 软件历史仓库 克隆代码 相似缺陷 抽象语法树
下载PDF
基于多目标优化算法NSGA-II推荐相似缺陷报告 被引量:13
4
作者 樊田田 许蕾 陈林 《计算机学报》 EI CSCD 北大核心 2019年第10期2175-2189,共15页
在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基... 在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基于多目标优化算法NSGA-Ⅱ推荐相似缺陷报告的方法,即在推荐尽可能少的相似缺陷报告情况下,使得缺陷报告间的相似度尽可能大.为此,利用缺陷报告的摘要和描述信息,该文采用TFIDF和Word Embedding两种方法,从历史缺陷报告中找出相似的缺陷报告,并采用基于搜索的多目标优化算法NSGA-Ⅱ来保证推荐的相似缺陷报告数目尽可能少.实验数据集是6个开源项目(AspectJ、Birt、Eclipse UI、JDT、SWT和Tomcat).与采用单目标算法相比,该文方法在推荐相似缺陷报告的准确率、平均准确率均值、平均序位倒数均值都有提高,其中,在Top@1准确率、平均准确率均值、平均序位倒数均值上分别比Yang方法提高125.5%、67.7%和62.75%. 展开更多
关键词 相似缺陷报告推荐 多目标优化 空间向量模型 词嵌入模型 NSGA-Ⅱ算法 软件工程
下载PDF
自动分析软件缺陷报告间相关性的方法研究 被引量:2
5
作者 李楠 王晓博 刘超 《计算机应用研究》 CSCD 北大核心 2010年第6期2134-2139,共6页
针对缺陷报告相关性分析的研究主要采用计算其文本信息相似度的方法使其查全率和查准率并不理想,提出了一种将结构化信息相似度与文本信息相似度计算相结合的方法,即同时提取出缺陷报告中的文本信息(包括主题和详细描述)以及结构化信息... 针对缺陷报告相关性分析的研究主要采用计算其文本信息相似度的方法使其查全率和查准率并不理想,提出了一种将结构化信息相似度与文本信息相似度计算相结合的方法,即同时提取出缺陷报告中的文本信息(包括主题和详细描述)以及结构化信息(包括补丁、异常堆栈和代码片段),从缺陷外部表现和内部特征两个角度共同衡量缺陷报告间的相关性。通过对Eclipse系统中的1000个缺陷报告进行实验,结果显示,增加结构化信息相似度计算,可以有效地将缺陷报告间相关性分析的查准率和查全率均提高到90%左右。 展开更多
关键词 相关缺陷报告 结构化信息 相似度
下载PDF
基于缺陷报告分析的软件缺陷定位方法 被引量:1
6
作者 高子欣 赵逢禹 刘亚 《软件》 2019年第5期8-15,共8页
在软件开发过程中,软件缺陷是不可避免的。在缺陷跟踪系统中,一个重要的问题是如何根据用户所提交的缺陷报告,进行缺陷的自动定位。本文在综合考虑缺陷报告与源代码文件结构相似性的基础上,进一步分析已修复缺陷报告、缺陷报告中的异常... 在软件开发过程中,软件缺陷是不可避免的。在缺陷跟踪系统中,一个重要的问题是如何根据用户所提交的缺陷报告,进行缺陷的自动定位。本文在综合考虑缺陷报告与源代码文件结构相似性的基础上,进一步分析已修复缺陷报告、缺陷报告中的异常堆栈(Stack Trace)信息对软件缺陷定位的作用,从而提高定位的精度。在Eclipse、AspectJ和SWT开源项目数据程序集上进行相关实验,并与Buglocator、BRTracer和BLUiR缺陷定位方法进行了比较分析,实验结果表明,本文方法能显著提高软件缺陷定位的精度。 展开更多
关键词 缺陷定位 缺陷报告 结构相似 异常堆栈信息
下载PDF
知识驱动的相似缺陷报告推荐方法
7
作者 余笙 李斌 +2 位作者 孙小兵 薄莉莉 周澄 《计算机科学》 CSCD 北大核心 2021年第5期91-98,共8页
软件缺陷在软件开发过程中不可避免,提交的缺陷报告则是分析和修复缺陷的重要信息来源。开发人员常通过借鉴相似的历史缺陷报告和修复信息来辅助对当前新缺陷的分析和修复。文中提出了一种知识驱动的相似缺陷报告推荐方法。该方法首先... 软件缺陷在软件开发过程中不可避免,提交的缺陷报告则是分析和修复缺陷的重要信息来源。开发人员常通过借鉴相似的历史缺陷报告和修复信息来辅助对当前新缺陷的分析和修复。文中提出了一种知识驱动的相似缺陷报告推荐方法。该方法首先利用信息检索和Word Embedding技术构建缺陷知识图谱;然后利用TF-IDF和Word Embedding技术计算缺陷报告之间的文本相似度,同时综合考虑缺陷的各项属性,从而得到缺陷报告之间的主次要属性相似度;最后将上述相似度融合成综合相似度,利用综合相似度推荐相似缺陷报告。实验结果表明,与基线方法相比,在Firefox数据集上所提方法的性能平均提高了12.7%。 展开更多
关键词 相似缺陷报告 信息检索 词嵌 知识图谱 推荐系统
下载PDF
基于缺陷相似度与再分配图的软件缺陷分配方法 被引量:1
8
作者 史高翔 赵逢禹 《计算机科学》 CSCD 北大核心 2016年第11期246-251,共6页
准确地将缺陷分配给最合适的修复者对大型软件项目的缺陷修复具有重要意义。当前缺陷自动分配技术的研究主要利用历史缺陷报告的描述信息、缺陷关联信息、历史分派信息等,但这些方法都没有将缺陷报告信息充分挖掘。提出在缺陷报告分配... 准确地将缺陷分配给最合适的修复者对大型软件项目的缺陷修复具有重要意义。当前缺陷自动分配技术的研究主要利用历史缺陷报告的描述信息、缺陷关联信息、历史分派信息等,但这些方法都没有将缺陷报告信息充分挖掘。提出在缺陷报告分配时将缺陷历史分派信息和缺陷文本相似信息相结合。首先根据缺陷历史分派信息生成再分配图;然后计算新缺陷报告与历史缺陷报告缺陷的文本相似度,找出相似度最高的前K个缺陷报告所对应的修复者;最后,根据这些修复者在再分配图中的依赖关系生成预测再分配路径。为了验证该方法的有效性,利用Eclipse和Mozilla的缺陷报告集进行实验,实验表明提出的方法在预测的准确度上明显优于其他方法。 展开更多
关键词 历史缺陷报告 缺陷相似度 再分配图 预测再分配路径
下载PDF
文件信息增强的方法级软件缺陷定位
9
作者 薄莉莉 朱程 +1 位作者 李斌 孙小兵 《电子学报》 EI CAS CSCD 北大核心 2023年第3期613-621,共9页
软件开发与维护中会产生大量缺陷报告,根据缺陷报告准确定位到缺陷代码的位置是极具挑战性的.目前大多数工作在文件粒度定位缺陷,虽然少量工作定位在方法粒度,但定位准确度较低.本文提出一个文件信息增强的方法级软件缺陷定位技术FMBL(a... 软件开发与维护中会产生大量缺陷报告,根据缺陷报告准确定位到缺陷代码的位置是极具挑战性的.目前大多数工作在文件粒度定位缺陷,虽然少量工作定位在方法粒度,但定位准确度较低.本文提出一个文件信息增强的方法级软件缺陷定位技术FMBL(a File information enhanced Method-level Bug Localization technology),考虑方法与文件之间的从属关系以增强缺陷定位准确性.通过综合考虑代码与缺陷报告的词汇相似度、语义相似度和代码长度度量它们之间的相关性.在六个开源软件项目上开展实验以评估FMBL的有效性.结果表明,本文方法在六个项目上的平均Accuracy@10、MAP(Mean Average Precision)和MRR(Mean Reciprocal Rank)值分别达到0.436、0.223、0.296.与现有方法BugLocator、BLIA(Bug Localization using Integrated Analysis)、BugPecker相比,本文方法在MAP指标上分别提升153.1%、209.1%、22.8%. 展开更多
关键词 软件维护 缺陷定位 词汇相似度 语义相似度 文件信息 方法粒度
下载PDF
基于神经机器翻译的二进制函数相似性检测方法 被引量:4
10
作者 陈斌 刘胜利 +1 位作者 胡安祥 杨启超 《信息工程大学学报》 2021年第6期675-682,共8页
二进制函数相似性检测是检测软件中已知安全漏洞的一种重要手段,随着物联网设备急剧增长,越来越多的软件被编译到不同指令集架构的平台上运行,因此基于二进制的跨平台相似性检测方法更具通用性。针对目前基于深度神经网络的跨平台相似... 二进制函数相似性检测是检测软件中已知安全漏洞的一种重要手段,随着物联网设备急剧增长,越来越多的软件被编译到不同指令集架构的平台上运行,因此基于二进制的跨平台相似性检测方法更具通用性。针对目前基于深度神经网络的跨平台相似性检测方法只能在基本块粒度进行相似性比对的不足,基于神经机器翻译的思想,提出一个通用的跨指令集架构的二进制函数相似性检测框架BFS,在函数粒度上通过无监督学习的方法自动捕获二进制函数的语义信息,生成二进制函数的嵌入向量。实验结果表明,BFS的P@10评价指标在88.0%以上,相较于现有方法提升了10.6百分点,并且能够有效检测出路由器固件中的已知真实漏洞。充分说明BFS检测框架在对二进制函数进行嵌入时,不仅能够保留较多原始语义信息,同时能够消除不同指令集架构以及编译优化选项的影响。 展开更多
关键词 二进制代码 相似性检测 跨平台 漏洞搜索 神经机器翻译
下载PDF
内蒙古东部草原盲蝽多样性及其分布 被引量:4
11
作者 柴畅 石凯 +2 位作者 董永义 兴安 王家骏 《生态学杂志》 CAS CSCD 北大核心 2021年第10期3234-3242,共9页
盲蝽多植食性,为草原常发昆虫类群,是生物多样性的重要组成。于2017—2018年每年6月末至9月初采用扫网法对内蒙古东部草原盲蝽多样性及分布进行调查,旨在为后续草原盲蝽进一步研究提供基础资料。共采集盲蝽1825头(34属65种),其中科尔沁... 盲蝽多植食性,为草原常发昆虫类群,是生物多样性的重要组成。于2017—2018年每年6月末至9月初采用扫网法对内蒙古东部草原盲蝽多样性及分布进行调查,旨在为后续草原盲蝽进一步研究提供基础资料。共采集盲蝽1825头(34属65种),其中科尔沁草原858头(20属34种),呼伦贝尔草原967头(27属52种)。科尔沁草原以斯氏后丽盲蝽(Apolygus spinolae)、条赤须盲蝽(Trigonotylus caelestialium)和小欧盲蝽(Europiella artemisiae)为优势种;呼伦贝尔草原以苜蓿盲蝽(Adelphocoris lineolatus)、青草绿盲蝽(Lygus gemellatus)及红楔异盲蝽(Polymerus cognatus)为优势种。呼伦贝尔草原盲蝽的Margalef丰富度指数(7.42)、香农指数(3.04)和辛普森多样性指数(0.93)均较高;Pielou均匀度指数以科尔沁草原稍高(0.77)。盲蝽亚科在属、种数分布上表现为呼伦贝尔草原明显较高,但在个体数分布上两草原差异不明显。合垫盲蝽亚科在属、种和个体数分布上两草原均不具明显差异。叶盲蝽亚科则在属、种和个体数分布上均表现为科尔沁草原较高。两个草原盲蝽物种相似性系数为0.32。可见,呼伦贝尔草原盲蝽多样性高于科尔沁草原,两草原盲蝽物种中等不相似。 展开更多
关键词 盲蝽 多样性 相似性分析 科尔沁草原 呼伦贝尔草原
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部