期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
双视角数据下移动应用BUG报告识别方法研究
1
作者 彭春雨 郑尚 +2 位作者 邹海涛 于化龙 高尚 《江苏科技大学学报(自然科学版)》 CAS 2024年第1期68-74,88,共8页
为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,... 为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,构建Bi-LSTM网络获取高级文本特征,并通过注意力机制分配权重以捕获句子中对BUG报告识别起到关键作用的信息,最后获取问题报告的BUG标签.实验结果表明所提方法在准确率、召回率、F1-score和查准率上均有提高,有助于开发人员准确识别移动应用的BUG报告,提高BUG修复效率. 展开更多
关键词 移动应用 软件维护 问题报告 用户反馈 bug标签
下载PDF
High-Impact Bug Report Identification with Imbalanced Learning Strategies 被引量:6
2
作者 Xin-Li Yang David Lo +2 位作者 Xin Xia Qiao Huang Jian-Ling Sun 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期181-198,共18页
In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they oft... In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they often concentrate on bugs that are highly impactful. In the literature, high-impact bugs are used to refer to the bugs which appear at unexpected time or locations and bring more unexpected effects (i.e., surprise bugs), or break pre-existing functionalities and destroy the user experience (i.e., breakage bugs). Unfortunately, identifying high-impact bugs from thousands of bug reports in a bug tracking system is not an easy feat. Thus, an automated technique that can identify high-impact bug reports can help developers to be aware of them early, rectify them quickly, and minimize the damages they cause. Considering that only a small proportion of bugs are high-impact bugs, the identification of high-impact bug reports is a difficult task. In this paper, we propose an approach to identify high-impact bug reports by leveraging imbalanced learning strategies. We investigate the effectiveness of various variants, each of which combines one particular imbalanced learning strategy and one particular classification algorithm. In particular, we choose four widely used strategies for dealing with imbalanced data and four state-of-the-art text classification algorithms to conduct experiments on four datasets from four different open source projects. We mainly perform an analytical study on two types of high-impact bugs, i.e., surprise bugs and breakage bugs. The results show that different variants have different performances, and the best performing variants SMOTE (synthetic minority over-sampling technique) + KNN (K-nearest neighbours) for surprise bug identification and RUS (random under-sampling) + NB (naive Bayes) for breakage bug identification outperform the Fl-scores of the two state-of-the-art approaches by Thung et al. and Garcia and Shihab. 展开更多
关键词 high-impact bug imbalanced learning bug report identification
原文传递
Bug localization based on syntactical and semantic information of source code
3
作者 YAN Xuefeng CHENG Shasha GUO Liqin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第1期236-246,共11页
The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactic... The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactical and semantic information of source code is proposed. Firstly, abstract syntax tree(AST) is divided based on node category to obtain statement sequence. The statement tree is encoded into vectors to capture lexical and syntactical knowledge at the statement level.Secondly, the source code is transformed into vector representation by the sequence naturalness of the statement. Therefore,the problem of gradient vanishing and explosion caused by a large AST size is obviated when using AST to the represent source code. Finally, the correlation between bug reports and source files are comprehensively analyzed from three aspects of syntax, semantics and text to locate the buggy code. Experiments show that compared with other standard models, the proposed model improves the performance of bug localization, and it has good advantages in mean reciprocal rank(MRR), mean average precision(MAP) and Top N Rank. 展开更多
关键词 bug report abstract syntax tree code representation software bug localization
下载PDF
Bug Prioritization Using Average One Dependence Estimator
4
作者 Kashif Saleem Rashid Naseem +3 位作者 Khalil Khan Siraj Muhammad Ikram Syed Jaehyuk Choi 《Intelligent Automation & Soft Computing》 SCIE 2023年第6期3517-3533,共17页
Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on... Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on their sever-ity and importance.Manually managing the deluge of incoming bug reports faces time and resource constraints from the development team and delays the resolu-tion of critical bugs.Therefore,bug report prioritization is vital.This study pro-poses a new model for bug prioritization based on average one dependence estimator;it prioritizes bug reports based on severity,which is determined by the number of attributes.The more the number of attributes,the more the severity.The proposed model is evaluated using precision,recall,F1-Score,accuracy,G-Measure,and Matthew’s correlation coefficient.Results of the proposed model are compared with those of the support vector machine(SVM)and Naive Bayes(NB)models.Eclipse and Mozilla datasetswere used as the sources of bug reports.The proposed model improved the bug repository management and out-performed the SVM and NB models.Additionally,the proposed model used a weaker attribute independence supposition than the former models,thereby improving prediction accuracy with minimal computational cost. 展开更多
关键词 bug report triaging PRIORITIZATION support vector machine Naive Bayes
下载PDF
基于知识图谱的跨项目安全缺陷报告预测方法
5
作者 郑炜 刘程远 +4 位作者 吴潇雪 陈翔 成婧源 孙小兵 孙瑞阳 《软件学报》 EI CSCD 北大核心 2024年第3期1257-1279,共23页
安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属... 安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属于新启动的项目,没有足够的已标记安全缺陷报告供在实践中构建此软件安全漏洞预测模型.一种简单的解决方案就是使用迁移模型,即利用其他项目已经标记过的数据来构建预测模型.受到该领域最近的两项研究工作的启发,以安全关键字过滤为思路提出一种融合知识图谱的跨项目安全缺陷报告预测方法KG-SBRP(knowledge graph of security bug report prediction).使用安全缺陷报告中的文本信息域结合CWE(common weakness enumeration)与CVE Details(common vulnerabilities and exposures)共同构建三元组规则实体,以三元组规则实体构建安全漏洞知识图谱,在图谱中结合实体及其关系识别安全缺陷报告.将数据分为训练集和测试集进行模型拟合和性能评估.所构建的模型在7个不同规模的安全缺陷报告数据集上展开实证研究,研究结果表明,所提方法与当前主流方法FARSEC和Keyword matrix相比,在跨项目安全缺陷报告预测场景下,性能指标F1-score值可以平均提高11%,除此之外,在项目内安全缺陷报告预测场景下,F1-score值同样可以平均提高30%. 展开更多
关键词 软件安全 安全缺陷报告预测 跨项目 知识图谱 领域知识
下载PDF
融合信息检索和深度模型特征的软件缺陷定位方法
6
作者 申宗汶 牛菲菲 +4 位作者 李传艺 陈翔 李奇 葛季栋 骆斌 《软件学报》 EI CSCD 北大核心 2024年第7期3245-3264,共20页
构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利... 构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利用深度模型特征的缺陷定位方法也取得了一定效果.然而,由于深度模型训练的时间成本和耗费资源相对较高,现有基于深度模型的缺陷定位研究方法存在实验搜索空间和真实情况不符的情况.这些研究方法在测试时并没有将项目下的所有代码作为搜索空间,而仅仅搜索了与已有缺陷相关的代码,例如DNNLOC方法、DeepLocator方法、DreamLoc方法.这种做法和现实中程序员进行缺陷定位的搜索场景是不一致的.致力于模拟缺陷定位的真实场景,提出了一种融合信息检索和深度模型特征的TosLoc方法进行缺陷定位.TosLoc方法首先通过信息检索的方式检索真实项目的所有源代码,确保已有特征的充分利用;再利用深度模型挖掘源代码和缺陷报告的语义,获取最终定位结果.通过两阶段的检索,TosLoc方法能够对单个项目的所有代码实现快速缺陷定位.通过在4个常用的真实Java项目上进行实验,TosLoc方法能够在检索速度和准确性上超越已有基准方法.与最优基准方法DreamLoc相比,TosLoc方法在消耗DreamLoc方法35%的检索时间下,平均MRR值比DreamLoc方法提高了2.5%,平均MAP值提高了6.0%. 展开更多
关键词 缺陷定位 缺陷报告 信息检索 深度学习 检索空间
下载PDF
基于历史缺陷信息检索的语句级软件缺陷定位方法
7
作者 岳雷 崔展齐 +2 位作者 陈翔 王荣存 李莉 《软件学报》 EI CSCD 北大核心 2024年第10期4642-4661,共20页
软件在开发和维护过程中会产生大量缺陷报告,可为开发人员定位缺陷提供帮助.基于信息检索的缺陷定位方法通过分析缺陷报告内容和源码文件的相似度来定位缺陷所在位置,已在文件、函数等粗粒度级别上取得了较为精确的定位效果,但由于其定... 软件在开发和维护过程中会产生大量缺陷报告,可为开发人员定位缺陷提供帮助.基于信息检索的缺陷定位方法通过分析缺陷报告内容和源码文件的相似度来定位缺陷所在位置,已在文件、函数等粗粒度级别上取得了较为精确的定位效果,但由于其定位粒度较粗,仍需要耗费大量人力和时间成本检查可疑文件和函数片段.为此,提出一种基于历史缺陷信息检索的语句级软件缺陷定位方法STMTLocator,首先检索出与被测程序缺陷报告相似度较高的历史缺陷报告,并提取其中的历史缺陷语句;然后根据被测程序源码文件与缺陷报告的文本相似度检索可疑文件,并提取其中的可疑语句;最后计算可疑语句与历史缺陷语句的相似度,并进行降序排列,以定位缺陷语句.为评估STMTLocator的缺陷定位性能,使用Top@N、MRR等评价指标在基于Defects4J和JIRA构建的数据集上进行对比实验.实验结果表明,相比静态缺陷定位方法BugLocator,STMTLocator在MRR指标上提升近4倍,在Top@1指标上多定位到7条缺陷语句;相比动态缺陷定位方法Metallaxis和DStar,STMTLocator完成一个版本缺陷定位平均消耗的时间减少98.37%和63.41%,且具有不需要设计和执行测试用例的显著优势. 展开更多
关键词 软件调试 缺陷定位 信息检索 缺陷报告
下载PDF
基于知识图谱的bug问题探索性搜索方法 被引量:8
8
作者 孙小兵 王璐 +2 位作者 王经纬 李斌 李宇 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1578-1583,共6页
软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过... 软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过建立bug报告、commit提交信息及相关人员(如:bug报告人、commit提交者等)信息的bug知识图谱,并结合探索性搜索的思想,不仅能准确搜索bug问题,还能提供相关辅助信息对bug问题进行探索性搜索,帮助软件开发人员更有效地理解和解决bug问题. 展开更多
关键词 bug报告 commit提交 知识图谱 探索性搜索
下载PDF
基于推荐列表的缺陷文件识别
9
作者 王昭丹 邹卫琴 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期802-809,共8页
缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查... 缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查从而找到真正有缺陷的文件,这增加了定位的时间和成本。为解决这个问题,提出了一个相应的解决方案。首先运行主流的基于信息检索的静态缺陷定位技术来获得一个初始的可疑文件推荐列表;然后依据问题特性提出3类领域特征,并基于这3类特征构建一个机器学习模型,尝试从列表中识别出真正有缺陷(Truly Buggy)的源代码文件。在4个开源项目(Zoo-Keeper,OpenJPA,Tomcat,AspectJ)的2558个bug上进行了实验,结果表明,在最初可疑文件推荐列表上可以获得72.6%~80.7%的真正有缺陷的文件预测准确率。同时探究了3类特征子集及各个特征在预测真正有缺陷的文件上的重要性,发现缺陷报告与源代码的关系特征更重要。 展开更多
关键词 缺陷报告 缺陷定位 机器学习 信息检索 缺陷文件
下载PDF
基于领域知识微调的缺陷报告严重性预测
10
作者 陈冰婷 邹卫琴 +1 位作者 蔡碧瑜 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期835-841,共7页
有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的... 有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题。对此,提出一种基于领域知识微调的缺陷报告严重性预测方法。利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识。微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建。在Mozilla,Eclipse和Apache选取的共计15个项目上进行的实验表明,在准确率、召回率和F1值上,相较传统的信息检索方法,所提方法分别能提升4.5%~22.0%,3.0%~22.0%,4.0%~22.0%;相较通用BERT模型,微调后的BERT模型的准确率、召回率和F1值分别能够提高2.0%~5.1%,1.9%~5.1%,1.8%~5.0%。 展开更多
关键词 词嵌入 BERT 预训练模型 缺陷报告 微调 严重性预测
下载PDF
基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法
11
作者 刘文杰 邹卫琴 +1 位作者 蔡碧瑜 陈冰婷 《计算机科学》 CSCD 北大核心 2024年第7期1-9,共9页
为了加快开发人员定位软件缺陷,研究人员提出了一系列基于文本检索的缺陷定位技术,自动为用户所提交的缺陷报告推荐可疑的代码文件。由于用户的专业知识不同,编写的缺陷报告质量不一致,因此某些低质量的缺陷报告无法被成功定位。对低质... 为了加快开发人员定位软件缺陷,研究人员提出了一系列基于文本检索的缺陷定位技术,自动为用户所提交的缺陷报告推荐可疑的代码文件。由于用户的专业知识不同,编写的缺陷报告质量不一致,因此某些低质量的缺陷报告无法被成功定位。对低质量的缺陷报告进行重构从而改进其定位效果,是常见的解决方案。现有基于查询扩展和查询缩减的主流重构方法,容易出现重构前后查询主题不一致或所依赖伪相关库质量差导致重构质量低的问题。对此,提出了一种基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法,由主题一致性保持的查询缩减阶段和伪相关反馈库扩展的查询扩展阶段两部分组成。查询缩减阶段将缺陷报告的概要问题描述和从问题描述文本中提取的关键词合并来解决主题不一致性问题;查询扩展阶段综合使用多种定位工具(即Lucene, BugLocator和Blizzard)来获得伪相关反馈库,并从中提取查询扩展关键词,以解决现有伪相关反馈库质量差导致的重构质量低的问题;最后将查询缩减和扩展阶段的输出合并得到重构后的查询。通过在6个Java项目上进行实验发现,对于使用现有缺陷定位方法无法在TOP 10可疑推荐文件中定位的低质量缺陷报告,使用所提重构方法后,能定位其中21%~39%的缺陷即Accuracy@10,MRR@10为10%~16%。对比现有重构技术,所提重构方法在Accuracy@10和MRR@10两个指标上分别可以提升7%~32%和2%~13%。 展开更多
关键词 缺陷定位 查询重构 查询缩减 查询扩展 伪相关反馈库 缺陷报告质量
下载PDF
浅析BUG管理
12
作者 李晓叶 《计算机光盘软件与应用》 2011年第19期108-108,共1页
在软件测试的过程中,BUG管理是一个很重要的环节,它是测试人员和开发人员之间的桥梁,对BUG进行有效的管理,能够提高项目团队的工作质量和效率。
关键词 软件测试 bug bug报告 bug管理
下载PDF
DBugHelper:分布式系统Debug协助工具
13
作者 张燕飞 张春熙 +1 位作者 李宇明 张蓉 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期153-164,共12页
对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于... 对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于系统开发人员来说,bug报告能非常有效地帮助其了解bug的所有特征信息,并找到能修复bug的方法.通过研究发现,许多大规模分布式系统之间具有较强的相关性和相似性,因而其bug的产生情况和修复方法也具有类似特征.开发人员可以利用已存在的修复bug的方案来协助修复与其一致或相近的bug.本文提出一个适用于大规模分布式系统的Debug协助工具——DBugHelper,能为某些大规模分布式系统的开发人员的bug修复提供比较有效、正确的帮助.DBugHelper将最新的bug报告进行文本处理,形成查询向量,并将大量已被修复的bug及其相关信息进行离线处理和缓存,从而为在线查询提供索引机制.通过将大量已修复的bug报告进行离线处理并同时减少在线处理的数据量,从而使其准确并快速地为系统开发人员提供必要的Debug协助工作,以此减少系统开发的周期与成本. 展开更多
关键词 大规模分布式系统 DEbug bug报告 协助
下载PDF
版本失配和数据泄露对基于缺陷报告的缺陷定位模型的影响 被引量:3
14
作者 周慧聪 郭肇强 +3 位作者 梅元清 李言辉 陈林 周毓明 《软件学报》 EI CSCD 北大核心 2023年第5期2196-2217,共22页
为了降低缺陷定位过程中的人力成本,研究者们在缺陷报告的基础上提出了许多基于信息检索的缺陷定位模型,包括使用传统特征和使用深度学习特征进行建模的定位模型.在评价不同缺陷定位模型时设计的实验中,现有研究大多忽视了缺陷报告所属... 为了降低缺陷定位过程中的人力成本,研究者们在缺陷报告的基础上提出了许多基于信息检索的缺陷定位模型,包括使用传统特征和使用深度学习特征进行建模的定位模型.在评价不同缺陷定位模型时设计的实验中,现有研究大多忽视了缺陷报告所属的版本与目标源代码的版本之间存在的“版本失配”问题或/和在训练和测试模型时缺陷报告的时间顺序所引发的“数据泄露”问题.致力于报告现有模型在更加真实的应用场景下的性能表现,并分析版本失配和数据泄露问题对评估各模型真实性能产生的影响.选取6个使用传统特征的定位模型(BugLocator、BRTracer、BLUiR、AmaLgam、BLIA、Locus)和1个使用深度学习特征的定位模型(CodeBERT)作为研究对象.在5个不同实验设置下基于8个开源项目进行系统性的实证分析.首先,CodeBERT模型直接应用于缺陷定位效果并不理想,其定位的准确率依赖于目标项目的版本数目和源代码规模.其次,版本匹配设置下使用传统特征的定位模型在平均准确率均值(MAP)、平均序位倒数均值(MRR)两个指标上比版本失配实验设置下最高可以提高47.2%和46.0%,CodeBERT模型的效果也受到数据泄露和版本匹配的双重影响.使用传统特征的缺陷定位模型的性能被低估,而使用深度学习特征的CodeBERT模型在应用于缺陷定位任务时还需要更多的探索和验证. 展开更多
关键词 缺陷定位 缺陷报告 版本失配 数据泄露 信息检索
下载PDF
Automated Time Based Multi-Criteria Bug Triage Approach:Developer Working Efficiency and Social Network Based Developer Recommendation
15
作者 YADAV Asmita SINGH Kumar Sandeep 《Journal of Shanghai Jiaotong university(Science)》 EI 2024年第3期566-578,共13页
In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfacti... In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfaction,keep within limited development cost,and improve bug resolution time.To address and resolve bug report as soon as possible is the main focus of triager when a new bug is reported.Thus,developer work efficiency is an important factor in bug-fixing.To address these issues,a proposed approach recommends a set of developers that could potentially share their knowledge with each other to fix new bug reports.The proposed approach is called developer working efficiency and social network based developer recommendation(DweSn).It is a composite model that builds developers'profile by using developer average bug fixing time,work efficiency to fix variety of bugs,as well as the developer's social interactions with other developers.A similarity measure is applied between new bug and bugs in corpus to extract the list of capable developers from the corpus.The proposed approach only selects those developers who are active and less loaded with work.The developer with the highest profile score is assigned the bugs.We evaluated our approach on the subset of five large open-source projects including Mozilla,Netbeans,Eclipse,Firefox and OpenOffice,and compared it with the state-of-the-art.The results demonstrate that combination of developers'efficiency with their average bug fixing time and interactions in their social network gives good accuracy and efficiently reduces bug tossing length.This approach shows an improvement in prediction accuracy,precision,recall,F-score and reduced bug tossing length up to 93.89%,93.12%,93.46%,93.27%and 93.25%,respectively.The proposed approach achieved a 93%hit ratio and 93.34%mean reciprocal rank,indicating that our proposed triager is able to efficiently assign bugs to correct developers. 展开更多
关键词 open-source repository bug report bug assignment tossing length bug triager developer social network developer recommendation
原文传递
缺陷报告质量研究综述 被引量:1
16
作者 邹卫琴 张静宣 +2 位作者 张霄炜 陈林 玄跻峰 《软件学报》 EI CSCD 北大核心 2023年第1期171-196,共26页
在软件开发和维护过程中,缺陷修复人员通常根据由终端用户或者开发/测试者提交的缺陷报告来定位和修复缺陷.因此,缺陷报告本身的质量对修复人员能否快速准确定位并修复缺陷具有重要的作用.围绕缺陷报告质量的刻画及改进,研究人员开展了... 在软件开发和维护过程中,缺陷修复人员通常根据由终端用户或者开发/测试者提交的缺陷报告来定位和修复缺陷.因此,缺陷报告本身的质量对修复人员能否快速准确定位并修复缺陷具有重要的作用.围绕缺陷报告质量的刻画及改进,研究人员开展了大量的研究工作,但尚未进行系统性的归纳.旨在对这些工作进行系统性地梳理,展示该领域的研究现状并为未来的研究方向提供参考意见.首先,总结了已有缺陷报告存在的质量问题,如关键信息缺失、信息错误等;接着,总结了对缺陷报告质量进行自动化建模的技术;然后,描述了一系列对缺陷报告质量进行改进的方法;最后,对未来研究可能面临的挑战和机遇进行了展望. 展开更多
关键词 软件质量保障 缺陷定位与修复 缺陷报告质量 质量建模和改进
下载PDF
开源SDN控制器并发缺陷的量化分析研究
17
作者 郑冰 李华 《小型微型计算机系统》 CSCD 北大核心 2023年第7期1563-1570,共8页
SDN(software-defined networking)控制器是SDN网络的核心软件,它的并发缺陷会使网络的运行出现不确定甚至错误.本文对开源SDN控制器的真实历史并发缺陷报告进行深入实证量化分析:首先,从缺陷管理工具自动获取真实缺陷报告并进行预处理... SDN(software-defined networking)控制器是SDN网络的核心软件,它的并发缺陷会使网络的运行出现不确定甚至错误.本文对开源SDN控制器的真实历史并发缺陷报告进行深入实证量化分析:首先,从缺陷管理工具自动获取真实缺陷报告并进行预处理获得数据集;其次,基于软件缺陷生命周期选取4个维度10个具体度量作为并发缺陷修复过程的评估指标,基于指标对数据集进行修复过程的特征提取,自动获得其特征集;再次,基于特征集给出包含5种并发缺陷类型的数据集;最后,采用量化统计分析方法对于具有修复过程特征的并发缺陷数据集进行分析,给出SDN控制器在并发缺陷类型、功能模块和修复过程的数据分布特征及分析结果,并进行了有效性讨论. 展开更多
关键词 SDN控制器 并发缺陷 缺陷报告 量化分析
下载PDF
软件缺陷标题质量的实证研究
18
作者 续永 孙龙飞 +1 位作者 张汤浩然 毛新军 《计算机科学》 CSCD 北大核心 2023年第12期14-23,共10页
软件缺陷标题用简洁的语言描述了软件缺陷的关键信息,有助于软件开发者快速地掌握软件缺陷的梗概,进而高效地开展软件缺陷管理工作。当前诸多软件开发实践中可以发现,软件缺陷标题的质量参差不齐,存在冗长、晦涩、缺乏对关键信息的描述... 软件缺陷标题用简洁的语言描述了软件缺陷的关键信息,有助于软件开发者快速地掌握软件缺陷的梗概,进而高效地开展软件缺陷管理工作。当前诸多软件开发实践中可以发现,软件缺陷标题的质量参差不齐,存在冗长、晦涩、缺乏对关键信息的描述等问题,导致难以阅读和理解,影响了软件缺陷管理的效率和质量。因此有必要深入探究影响软件缺陷标题质量的具体因素以及当前软件缺陷标题的质量情况。文中围绕这两个方面的问题开展了定性和定量相结合的实证研究,选取190个在线文档进行定性分析以获取开发者对缺陷标题质量的需求,基于分析结果采取GQM范式构建了缺陷标题质量度量模型,并以此对GitHub中5个开源项目的1804个软件缺陷标题进行质量问题普遍性分析。研究结果表明:1)开发者主要关注软件缺陷标题4个方面的质量需求,即简洁(110,58%)、清楚(65,34%)、提供期望信息(157,83%)和提供具体描述(67,35%);2)70%的软件缺陷标题存在不同程度的质量问题。缺乏期望信息和描述不具体是最常见的两类质量问题,42%的软件缺陷标题缺乏期望信息,24%的软件缺陷标题需要补充具体描述。文中的研究发现有助于指导报告者提交高质量的软件缺陷标题。 展开更多
关键词 缺陷标题 度量模型 质量问题分布 主题分析 软件缺陷管理
下载PDF
强化文本关联语义和多特征提取的重复缺陷报告检测模型
19
作者 周文杰 谢琪 崔梦天 《重庆大学学报》 CAS CSCD 北大核心 2023年第7期53-62,共10页
针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行... 针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。 展开更多
关键词 重复缺陷报告检测 长距离依赖 自注意力机制 语义分析 多特征提取
下载PDF
一种基于缺陷关联模式挖掘的软件缺陷定位方法
20
作者 马雪 马诗洋 张东昕 《长江信息通信》 2023年第3期13-15,共3页
在软件演进中,软件缺陷不可避免,且严重影响软件系统的发展。因此,缺陷修复在软件工程领域占据重要位置,为了降低缺陷修复成本,软件缺陷定位应运而生。但现有的缺陷定位方法因为缺少成熟且庞大的数据测试基准而不被业界广泛认可,并且缺... 在软件演进中,软件缺陷不可避免,且严重影响软件系统的发展。因此,缺陷修复在软件工程领域占据重要位置,为了降低缺陷修复成本,软件缺陷定位应运而生。但现有的缺陷定位方法因为缺少成熟且庞大的数据测试基准而不被业界广泛认可,并且缺乏从关联缺陷角度出发来优化。与此同时,丰富历史缺陷数据,以及缺陷链接行为都为软件维护提供指导。但鲜有工作从历史关联缺陷数据的角度研究缺陷定位方法提升的途径。因此,文章构建缺陷数据集,提供一个数据测试基准,挖掘历史缺陷数据链接行为上潜在的缺陷关联模式,从关联缺陷角度出发,研究缺陷定位方法的提升途径。 展开更多
关键词 软件缺陷 缺陷报告 信息检索 缺陷定位方法 缺陷关联模式
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部