期刊文献+
共找到590篇文章
< 1 2 30 >
每页显示 20 50 100
基于改进鲸鱼算法优化SVM的软件缺陷检测方法
1
作者 杜晔 田晓清 +1 位作者 李昂 黎妹红 《信息网络安全》 CSCD 北大核心 2024年第8期1152-1162,共11页
为解决传统支持向量机在软件缺陷检测中存在分类精度低、参数选择困难等问题,文章提出一种基于改进鲸鱼算法优化SVM的软件缺陷检测方法LFWOA-SVM。首先针对鲸鱼算法在求解过程中存在收敛速度慢、寻优效率低和局部最优解问题,基于Levy飞... 为解决传统支持向量机在软件缺陷检测中存在分类精度低、参数选择困难等问题,文章提出一种基于改进鲸鱼算法优化SVM的软件缺陷检测方法LFWOA-SVM。首先针对鲸鱼算法在求解过程中存在收敛速度慢、寻优效率低和局部最优解问题,基于Levy飞行策略优化鲸鱼觅食阶段,最大限度地实现搜索代理多样化,并利用混合变异扰动算子提高WOA的全局寻优能力;然后采用改进的鲸鱼算法LFWOA对SVM的惩罚因子和核函数参数进行优化,在获得最优参数的同时可有效检测软件缺陷。仿真实验表明,在6个基准测试函数中,LFWOA展现出更高的寻优速度和全局搜索能力;在8个公开软件缺陷数据集上进行测试显示,LFWOA-SVM方法能够有效提高分类性能和预测精度。 展开更多
关键词 软件缺陷检测 Levy飞行 鲸鱼优化算法 变异扰动 支持向量机
下载PDF
改进的采样算法与无监督聚类相结合的软件缺陷预测模型
2
作者 石海鹤 周世文 +1 位作者 钟林辉 肖正兴 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期301-310,共10页
该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同... 该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同密度簇的连接性,生成了分布更为均衡的数据集.然后使用基于连接的spectral clustering算法进行聚类预测操作,将过采样算法和无监督聚类相结合,提出一种新型实用的软件缺陷预测模型TA-SC(T-ADASYN+spectral clustering).以F-score为评价指标,spectral clustering为聚类模型进行验证.实验结果表明:改进的T-ADASYN过采样算法在公开的PROMISE数据集和NASA数据集上比常用的过采样算法均有6%的性能提升,且TA-SC模型在PROMISE和NASA 2个数据集上比常用聚类算法分别有3%和2%的性能提升. 展开更多
关键词 软件缺陷预测 类别不平衡 过采样算法 聚类算法 无监督学习
下载PDF
基于自注意力机制神经机器翻译的软件缺陷自动修复方法
3
作者 曹鹤玲 刘昱 韩栋 《电子学报》 EI CAS CSCD 北大核心 2024年第3期945-956,共12页
循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题... 循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题,提出一种基于自注意力神经机器翻译的软件缺陷自动修复方法(Self-attention Neural machine translation based automatic software Repair,SNRepair).首先,为有效缓解源码中的未登录词问题,对数据集引入子词切分技术进行预处理;其次,为解决源代码中棘手的长距离依赖问题并更充分地利用局部信息,构建融合局部建模的Transformer程序补丁生成模型;然后,采用缺陷自动定位技术定位缺陷语句位置,利用参数优化后的Transformer补丁生成模型生成候选补丁;最后,运行测试用例验证候选补丁.在具有395个真实Java软件缺陷的Defects4J缺陷库上实验评估,结果表明SNRepair方法与对比方法比较,修复成功率和修复效率更高. 展开更多
关键词 软件缺陷自动修复 神经机器翻译 自注意力机制 子词切分 局部建模
下载PDF
学习困难与泛化能力感知的软件缺陷预测过采样方法
4
作者 范洪旗 严远亭 +1 位作者 张以文 张燕平 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2663-2671,共9页
软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的采样策略避免因引入异常样本而导致的过度泛化风险,始终是软件缺陷预测过采样方法面临的难点。针对这一... 软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的采样策略避免因引入异常样本而导致的过度泛化风险,始终是软件缺陷预测过采样方法面临的难点。针对这一问题,本文提出一种结合样本学习困难程度和合成泛化影响的过采样方法(GDOS)。具体来说,GDOS方法通过样本的局部先验概率和潜在合成方向上的样本分布信息衡量样本的安全系数与泛化系数,并以此度量样本的选择权重。通过抑制潜在过泛化区域的样本合成概率,给予相对安全的近邻合成方向更高的选择概率,为高质量样本的合成提供保障。在26个PROMISE数据集上的实验表明,GDOS在MCC、pd、pf、F-measure等指标上较于经典的采样方法和专门提出的软件缺陷预测采样方法均取得了更优的性能表现。 展开更多
关键词 软件缺陷预测 类别不平衡 过采样 过度泛化
下载PDF
基于前景理论的软件缺陷预测过采样方法
5
作者 徐彪 严远亭 张以文 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2822-2831,共10页
在软件缺陷预测中,数据困难因子对预测性能的影响比类不平衡更为明显。然而,大多数现有软件缺陷预测过采样方法在解决类不平衡问题过程中,忽视了软件项目数据集固有的数据困难因子,从而导致预测性能不佳。针对上述问题,提出一种基于前... 在软件缺陷预测中,数据困难因子对预测性能的影响比类不平衡更为明显。然而,大多数现有软件缺陷预测过采样方法在解决类不平衡问题过程中,忽视了软件项目数据集固有的数据困难因子,从而导致预测性能不佳。针对上述问题,提出一种基于前景理论的过采样算法(POS)。POS同时考虑局部邻域中同类和异类样本的影响来评估少数类样本的学习难度,通过基于引力的策略构建同类收益和异类损失来刻画样本的前景值,并强调异类损失来计算少数类样本的采样权重,以此降低引入数据困难因子的风险,提高合成样本的质量,进一步提升预测性能。在NASA数据集上的实验结果表明,POS算法在AUC、balance和G-mean等性能指标上均有所提升,具有更好的缺陷预测性能。 展开更多
关键词 软件缺陷预测 类不平衡 数据困难因子 过采样 前景理论
下载PDF
基于知识回放的即时软件缺陷预测增量模型
6
作者 张文静 李勇 王越 《计算机应用研究》 CSCD 北大核心 2024年第11期3420-3425,共6页
即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,... 即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,提出一种基于知识回放的即时软件缺陷预测增量模型方法。首先,通过知识回放机制存储模型参数和随机样本,实现对旧知识的学习;其次,使用分布式训练框架在本地设备上对即时软件数据流进行增量学习,通过重构实现模型的即时更新;最后采用知识蒸馏技术,构建全局增量预测模型。实验表明,该模型与常见模型算法相比,在保证训练效率的前提下,模型的综合性能表现较优。 展开更多
关键词 即时软件缺陷预测 增量学习 知识回放 知识蒸馏
下载PDF
基于联邦迁移的跨项目软件缺陷预测
7
作者 宋慧玲 李勇 张文静 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第3期122-128,共7页
跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能... 跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能.本文提出基于联邦迁移的跨项目软件缺陷预测方法(FT-CPDP).首先,针对数据隐私泄露和项目间特征异构问题,提出基于联邦学习与迁移学习相结合的模型算法,打破各数据持有者间的“数据壁垒”,实现隐私保护场景下的跨项目缺陷预测模型.其次,在联邦通信过程中添加满足隐私预算的噪声来提高隐私保护水平,最后构建卷积神经网络模型实现软件缺陷预测.基于NASA软件缺陷预测数据集进行实验,结果表明与传统跨项目缺陷预测方法相比,本文提出的FT-CPDP方法在实现软件数据隐私保护的前提下,模型的综合性能表现较优. 展开更多
关键词 软件缺陷预测 联邦学习 迁移学习 差分隐私 卷积神经网络
下载PDF
面向可解释性的软件缺陷预测主动学习方法
8
作者 王越 李勇 张文静 《现代电子技术》 北大核心 2024年第20期101-108,共8页
针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本... 针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本放入源项目中以训练预测器。其次,利用领域知识对选定样本进行扰动,构建局部数据集,并通过线性模型在该数据集上模拟数据选择策略的行为,以实现模型的可解释性。实验结果显示:该方法在数据标注方面的指标性能要优于传统的主动学习基准方法;同时,在可解释性方面,该方法的RMSE指标也均低于LIME、全局代理模型以及RuleFit,能较好地解释“黑盒”模型。该方法不仅可以有效提高软件缺陷数据的标注效率,还可以实现模型的可解释性。 展开更多
关键词 软件缺陷预测 主动学习 可解释性 数据标注 数据选择策略 深度学习
下载PDF
面向版本演化的APP软件缺陷跟踪分析方法
9
作者 刘海毅 姜瑛 赵泽江 《软件学报》 EI CSCD 北大核心 2024年第7期3180-3203,共24页
移动应用(APP)软件的版本更新速度正在加快,对软件缺陷的有效分析,可以帮助开发人员理解和及时修复软件缺陷.然而,现有研究的分析对象大多较为单一,存在信息孤立、零散、质量差等问题,并且没有充分考虑数据验证及版本失配问题,分析结果... 移动应用(APP)软件的版本更新速度正在加快,对软件缺陷的有效分析,可以帮助开发人员理解和及时修复软件缺陷.然而,现有研究的分析对象大多较为单一,存在信息孤立、零散、质量差等问题,并且没有充分考虑数据验证及版本失配问题,分析结果存在较大误差,导致无效的软件演化.为了提供更有效的缺陷分析结果,提出一种面向版本演化的APP软件缺陷跟踪分析方法(ASD-TAOVE).首先,从多源、异构的APP软件数据中抽取APP软件缺陷内容并挖掘缺陷事件的因果关系;接着,设计了一种APP软件缺陷内容验证方法,基于信息熵结合文本特征和结构特征定量分析缺陷怀疑度,用于缺陷内容验证并构建APP软件缺陷内容异构图;然后,为了考虑版本演化带来的影响,设计了一个APP软件缺陷跟踪分析方法,用于在版本演化中分析缺陷的演化关系,并将其转化为缺陷/演化元路径;最后,通过一个基于深度学习的异构信息网络完成APP软件缺陷分析.针对4个研究问题(RQ)的实验结果,证实了ASD-TAOVE方法在面向版本演化过程中对缺陷内容验证与跟踪分析的有效性,缺陷识别准确率分别提升约9.9%和5%(平均7.5%).与同类基线方法相比,ASD-TAOVE方法可分析丰富的APP软件数据,提供有效的缺陷信息. 展开更多
关键词 APP软件缺陷 跟踪分析 版本演化 缺陷内容提取 缺陷内容验证 异构信息网络
下载PDF
工作量感知软件缺陷预测中偏斜分布的影响及测试评估方法
10
作者 郭育晨 朱晓燕 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期203-213,共11页
针对工作量感知软件缺陷预测中传统模型测试评估方法存在偏差这一问题,采用偏斜分布的偏度作为数值特征,研究了3种主要测试评估方法的测试集在工作量偏度的偏差和与其对应的估计误差,并基于偏度偏差较小的采样余量方法,提出一种改进方... 针对工作量感知软件缺陷预测中传统模型测试评估方法存在偏差这一问题,采用偏斜分布的偏度作为数值特征,研究了3种主要测试评估方法的测试集在工作量偏度的偏差和与其对应的估计误差,并基于偏度偏差较小的采样余量方法,提出一种改进方法——后采样方法,所提后采样方法能够保持测试集的类标签比例以避免生成无效测试集。研究结果表明:最常用的十折交叉验证方法偏度偏差最大,其估计误差也最大;与十折交叉验证相比,改进方法性能估计误差减少约4.9%~26.9%;与采样余量方法相比,改进方法不会产生无效测试集,并证明了减小测试集偏度偏差以减少估计误差的有效性。所提后采样方法为工作量感知软件缺陷预测提供了一种更可靠的测试评估方法,能够更准确地评估模型性能。 展开更多
关键词 软件缺陷预测 工作量感知 偏斜分布 测试评估方法
下载PDF
基于注意力和代价敏感的软件缺陷预测方法
11
作者 毛敬恩 周世健 +1 位作者 章树卿 樊鑫 《计算机测量与控制》 2024年第9期94-100,共7页
软件缺陷预测的目的是预先识别容易出现缺陷的代码模块以帮助软件质量保障团队适当的分配资源和人力;当前基于稳定学习的软件缺陷预测方法在特征提取过程中缺乏代码图像的全局信息,并忽视了不平衡数据对模型性能的影响;为了解决上述问题... 软件缺陷预测的目的是预先识别容易出现缺陷的代码模块以帮助软件质量保障团队适当的分配资源和人力;当前基于稳定学习的软件缺陷预测方法在特征提取过程中缺乏代码图像的全局信息,并忽视了不平衡数据对模型性能的影响;为了解决上述问题,文章提出了一种基于注意力和代价敏感的软件缺陷预测方法;该方法在SDP-SL的神经网络中增加了全局注意力模块,重点关注图像中和缺陷代码相关的特征,并将分类器的损失函数改进为代价敏感的损失函数,降低类不平衡对模型性能的影响;为了评估SDP-SLAC的性能,在PROMISE数据库中的10个开源Java项目上进行了多组比较实验;实验结果表明,SDP-SLAC方法可以有效提升缺陷预测模型的性能。 展开更多
关键词 软件缺陷预测 全局注意力 代价敏感 类不平衡 损失函数
下载PDF
基于加权复杂度的SMOTE算法及其在软件缺陷预测中的应用
12
作者 魏威 江峰 《计算机与数字工程》 2024年第5期1418-1422,1427,共6页
近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必... 近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必要利用样本的复杂度来辅助新样本的合成,从而提高缺陷预测的性能。如何度量样本的复杂度非常重要,论文在计算样本复杂度时充分考虑到每一个条件属性的权重,从而得到一种加权复杂度的概念。基于加权复杂度,提出一种新的SMOTE算法——WCP-SMOTE,并将其应用于软件缺陷预测。WCP-SMOTE算法首先利用粗糙集中的粒度决策熵来计算决策表中每个条件属性的重要性和权重;其次,通过对样本在所有属性上的取值进行加权求和,从而得到该样本的加权复杂度;第三,根据加权复杂度对少数类样本进行升序排序,并从头到尾对相邻的两个少数类样本求平均来不断地合成新的样本,直到获得一个平衡的数据集。在多个缺陷预测数据集上的实验表明,利用WCP-SMOTE算法来处理不平衡数据能够获得更好的软件缺陷预测性能。 展开更多
关键词 软件缺陷预测 不平衡数据 粗糙集 粒度决策熵 加权复杂度 SMOTE
下载PDF
基于PCA-Smote-XGBoost的软件缺陷预测研究
13
作者 曾子安 李英梅 《软件工程与应用》 2024年第3期346-357,共12页
随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少... 随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少特征数量并提取关键信息;利用Smote过采样方法解决数据不平衡问题;结合XGBoost算法构建预测模型,并通过实验验证模型的有效性。在软件缺陷预测常用数据集的十一个项目中,实验结果表明,该模型在软件缺陷预测方面相较于其他八种基准模型,具有最高的准确率ACC和F1,能够有效地辅助软件开发团队识别潜在的缺陷风险。 展开更多
关键词 软件缺陷预测 PCA SMOTE XGBoost
下载PDF
膜内麻雀优化ELM的软件缺陷预测算法
14
作者 唐宇 代琪 +1 位作者 杨梦园 陈丽芳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期643-654,共12页
原始麻雀搜索算法存在寻优精度低、迭代后期容易陷入局部极值的问题,结合高效寻优性能的改进麻雀搜索算法和具有并行计算能力的膜计算,提出一种膜内麻雀优化算法(IMSSA)。在10个CEC2017测试函数上的实验结果表明,IMSSA具有更高的寻优精... 原始麻雀搜索算法存在寻优精度低、迭代后期容易陷入局部极值的问题,结合高效寻优性能的改进麻雀搜索算法和具有并行计算能力的膜计算,提出一种膜内麻雀优化算法(IMSSA)。在10个CEC2017测试函数上的实验结果表明,IMSSA具有更高的寻优精度。为进一步验证IMSSA的性能,使用IMSSA优化极限学习机(ELM)参数,提出一种膜内麻雀优化ELM(IMSSA-ELM)算法,并将其应用于软件缺陷预测领域。实验结果表明:在15个公开的软件缺陷数据集中,IMSSA-ELM算法预测性能在G-mean、MCC这2个评价指标下明显优于其他4种先进的对比算法,表明IMSSA-ELM算法具有更好的预测精度和稳定性,其实验结果在Friedman ranking和Holm’s post-hoc test非参数检验中具有明显的统计显著性。 展开更多
关键词 改进麻雀搜索算法 膜计算 极限学习机 优化算法 软件缺陷预测
下载PDF
基于TMFG生成拓扑图的软件缺陷预测图特征选择方法
15
作者 崔梦天 陈建英 徐智慧 《西南民族大学学报(自然科学版)》 CAS 2024年第4期418-427,共10页
软件缺陷预测是降低软件测试成本的重要手段,而特征选择则是其中关键的一环.然而,传统的特征选择算法局限于考虑特征之间的双边关系和两两特征的关联,而无法有效处理更为复杂的多边关系和多向交互等问题.为此,提出了一种基于TMFG的软件... 软件缺陷预测是降低软件测试成本的重要手段,而特征选择则是其中关键的一环.然而,传统的特征选择算法局限于考虑特征之间的双边关系和两两特征的关联,而无法有效处理更为复杂的多边关系和多向交互等问题.为此,提出了一种基于TMFG的软件缺陷预测图特征选择方法.该方法首先将拓扑图引入特征选择算法中,利用对称不确定性作为特征关联度,将特征表示为拓扑图的节点,构建特征全连接图.然后,通过TMFG去连边算法去除全连接图中的部分连边,并进行图聚类操作.接着,对每个聚类中的特征进行排序,并从每个类中选取特定数目的特征进行综合,得到最终的特征子集.最后,通过在Promise数据仓库中的数据集上进行对比实验,结果表明,所提出的方法在进一步优化特征选择选出的特征子集的质量方面取得了良好的效果,尤其在数据量较大的数据集中表现出更大的优势. 展开更多
关键词 软件缺陷预测 特征选择 拓扑图 社区检测算法 TMFG
下载PDF
基于多源特征门控融合的软件缺陷预测
16
作者 李英玲 巴依斯勒 +3 位作者 张禾 邵俊铭 王子翱 蔡牧昕 《西南民族大学学报(自然科学版)》 CAS 2024年第3期312-320,共9页
随着当前软件开发规模的增大和复杂度的不断提高,如何在保证效率的同时提高软件质量成为软件工程领域研究的重点和难点.软件缺陷预测是软件质量保障的重要研究方向,旨在帮助软件从业人员预测软件产品中潜在的缺陷模块,从而更有效地分配... 随着当前软件开发规模的增大和复杂度的不断提高,如何在保证效率的同时提高软件质量成为软件工程领域研究的重点和难点.软件缺陷预测是软件质量保障的重要研究方向,旨在帮助软件从业人员预测软件产品中潜在的缺陷模块,从而更有效地分配测试资源.已有研究主要提取软件特征来建立缺陷预测模型,但通常仅使用单一类型特征作为模型输入,并且缺乏特征的有效融合,导致缺陷预测的性能有待提高.提出了一种基于多源特征门控融合的软件缺陷预测方法(DP⁃GM),首先利用抽象语法树和词嵌入模型得到代码语义表示;然后,采用门控循环单元(GRU)对语义特征向量和传统特征向量进行特征提取;最后,利用门控机制融合多源特征来训练模型并进行软件缺陷预测.实验结果表明,与当前具有代表性的三个基线方法相比较,提出的方法在召回率和F1值分别高出最优基线方法35.3%和10.5%.因此,提出的方法可提升软件缺陷预测的准确性,帮助软件从业者提高开发效益. 展开更多
关键词 软件缺陷预测 多源特征融合 门控神经网络
下载PDF
基于数据集扩充的即时软件缺陷预测方法
17
作者 杨帆 夏鸿崚 《南通大学学报(自然科学版)》 CAS 2024年第1期58-65,共8页
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时... 即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F_(1)指标提升了18.33%;在LLTC4J数据集上,F_(1)指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。 展开更多
关键词 数据增强 深度学习 即时软件缺陷预测 样本生成 类不平衡问题
下载PDF
基于贝叶斯网络集成的软件缺陷预测
18
作者 秦阳阳 张思鹏 +2 位作者 郑越 韩阳 陈丽芳 《华北理工大学学报(自然科学版)》 CAS 2024年第3期96-103,共8页
针对常用的软件缺陷预测模型缺乏可解释性及鲁棒性的问题,为了推断和理解软件缺陷预测中变量间的相关关系,研究了贝叶斯网络在软件缺陷预测中的应用方法,建立了贝叶斯网络软件缺陷预测模型及集成软件缺陷预测模型。使用数据离散化方法... 针对常用的软件缺陷预测模型缺乏可解释性及鲁棒性的问题,为了推断和理解软件缺陷预测中变量间的相关关系,研究了贝叶斯网络在软件缺陷预测中的应用方法,建立了贝叶斯网络软件缺陷预测模型及集成软件缺陷预测模型。使用数据离散化方法处理数据,采用贝叶斯网络结构学习算法确定网络结构及参数,并利用贝叶斯网络推断软件缺陷的概率分布;将贝叶斯网络与K近邻、决策树、逻辑回归等软件缺陷预测器以软投票的方式集成,建立集成软件缺陷预测模型;在6个公开的软件缺陷数据集上进行实验仿真。实验结果表明,与常用的集成软件缺陷预测模型相比所建立的基于贝叶斯网络的集成软件缺陷预测模型在F1、Recall、G-Mean评价指标上表现出了更好的预测性能。从因果分析的角度,为软件缺陷预测探索一条新的研究思路。 展开更多
关键词 软件缺陷预测 贝叶斯网络 集成学习 因果分析
下载PDF
基于改进支持向量机的软件缺陷快速分类研究
19
作者 闫昀泽 《软件》 2024年第4期184-186,共3页
随着软件在各行业的广泛应用,对软件缺陷快速而准确的分类变得愈发关键。本文基于支持向量机(SVM)算法,提出了一种新的改进算法,强调提高处理效率和降低对噪声的敏感性,并通过对比分析实验结果,验证了改进算法相对于传统算法的性能优势... 随着软件在各行业的广泛应用,对软件缺陷快速而准确的分类变得愈发关键。本文基于支持向量机(SVM)算法,提出了一种新的改进算法,强调提高处理效率和降低对噪声的敏感性,并通过对比分析实验结果,验证了改进算法相对于传统算法的性能优势。本文的研究结果能够为软件工程领域提供更先进、可靠的软件缺陷分类方法,为确保软件质量和可维护性提供有力支持。 展开更多
关键词 软件缺陷分类 支持向量机 改进算法 性能评估
下载PDF
基于极限学习机的软件缺陷预测分析研究
20
作者 徐舜 《信息记录材料》 2024年第2期75-77,共3页
软件测试是软件开发生命周期中最主要的阶段,它可以最大限度地减少软件的缺陷,软件缺陷预测是近几年来软件研究人员关注的一个领域。为了提高缺陷模型的准确性,本文提出使用极限学习机(extreme learning machine, ELM)算法来预测缺陷。... 软件测试是软件开发生命周期中最主要的阶段,它可以最大限度地减少软件的缺陷,软件缺陷预测是近几年来软件研究人员关注的一个领域。为了提高缺陷模型的准确性,本文提出使用极限学习机(extreme learning machine, ELM)算法来预测缺陷。首先,从Eclipse程序库中提取3个版本控制系统用作训练数据并做预处理;其次,使用ELM算法来训练模型;最后,使用一些指标进行性能预测。基于软件包的预测结果证明ELM适合跨版本缺陷预测。 展开更多
关键词 机器学习 软件缺陷预测 软件度量 软件质量检测
下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部