期刊文献+
共找到2,152篇文章
< 1 2 108 >
每页显示 20 50 100
改进的采样算法与无监督聚类相结合的软件缺陷预测模型
1
作者 石海鹤 周世文 +1 位作者 钟林辉 肖正兴 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期301-310,共10页
该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同... 该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同密度簇的连接性,生成了分布更为均衡的数据集.然后使用基于连接的spectral clustering算法进行聚类预测操作,将过采样算法和无监督聚类相结合,提出一种新型实用的软件缺陷预测模型TA-SC(T-ADASYN+spectral clustering).以F-score为评价指标,spectral clustering为聚类模型进行验证.实验结果表明:改进的T-ADASYN过采样算法在公开的PROMISE数据集和NASA数据集上比常用的过采样算法均有6%的性能提升,且TA-SC模型在PROMISE和NASA 2个数据集上比常用聚类算法分别有3%和2%的性能提升. 展开更多
关键词 软件缺陷预测 类别不平衡 过采样算法 聚类算法 无监督学习
下载PDF
基于模型驱动和自动演进理论的矿集区找矿预测数据模型应用软件开发
2
作者 张志辉 左群超 《矿产勘查》 2024年第8期1478-1490,共13页
本文旨在构建一个系统而全面支持矿集区找矿预测数据模型应用的软件体系架构。采用模型驱动和自动演进的软件研发理论,服务和支持矿集区找矿预测数据模型应用。研发工作主要集中在3类核心应用软件的研发:数据模型管理类软件、数据模型... 本文旨在构建一个系统而全面支持矿集区找矿预测数据模型应用的软件体系架构。采用模型驱动和自动演进的软件研发理论,服务和支持矿集区找矿预测数据模型应用。研发工作主要集中在3类核心应用软件的研发:数据模型管理类软件、数据模型使用类软件和数据质量控制类软件,推出这些软件将有效地管理数据模型,提高矿集区找矿效率,并确保数据质量可靠性和准确性。提出了一个包含9个层次且完备的支持软件体系架构,全面覆盖数据模型从需求、设计到实际应用和用户层面各个环节。通过构建和研发支持矿集区找矿预测数据模型应用的软件体系架构及一套核心应用软件,成功为矿集区找矿预测提供了有效信息技术支持。这项工作不仅提高了找矿预测理论方法研究层次,还显著提升了软件技术应用水平,并可推广使用,具有重要的找矿指导意义。 展开更多
关键词 矿集区找矿预测 大数据模型 软件体系 理论找矿模式
下载PDF
人工智能在农机软件故障诊断和预测性维护中的应用研究
3
作者 姚日煌 周聪 +2 位作者 黄怡婷 黄晓昆 鹿洵 《电子质量》 2024年第10期38-42,共5页
探讨了人工智能技术在农机软件故障诊断和预测性维护方面的应用。首先,分析了农机软件功能安全的重要性和现有挑战;然后,深入探讨了人工智能在数据处理、故障模式识别、实时监测、长期性能监测和用户行为分析等方面的应用潜力;最后,预... 探讨了人工智能技术在农机软件故障诊断和预测性维护方面的应用。首先,分析了农机软件功能安全的重要性和现有挑战;然后,深入探讨了人工智能在数据处理、故障模式识别、实时监测、长期性能监测和用户行为分析等方面的应用潜力;最后,预测了未来发展趋势,并总结了人工智能技术在推动农业机械化方面的重要作用。 展开更多
关键词 人工智能 农机软件 故障诊断 预测性维护 功能安全
下载PDF
学习困难与泛化能力感知的软件缺陷预测过采样方法
4
作者 范洪旗 严远亭 +1 位作者 张以文 张燕平 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2663-2671,共9页
软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的采样策略避免因引入异常样本而导致的过度泛化风险,始终是软件缺陷预测过采样方法面临的难点。针对这一... 软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的采样策略避免因引入异常样本而导致的过度泛化风险,始终是软件缺陷预测过采样方法面临的难点。针对这一问题,本文提出一种结合样本学习困难程度和合成泛化影响的过采样方法(GDOS)。具体来说,GDOS方法通过样本的局部先验概率和潜在合成方向上的样本分布信息衡量样本的安全系数与泛化系数,并以此度量样本的选择权重。通过抑制潜在过泛化区域的样本合成概率,给予相对安全的近邻合成方向更高的选择概率,为高质量样本的合成提供保障。在26个PROMISE数据集上的实验表明,GDOS在MCC、pd、pf、F-measure等指标上较于经典的采样方法和专门提出的软件缺陷预测采样方法均取得了更优的性能表现。 展开更多
关键词 软件缺陷预测 类别不平衡 过采样 过度泛化
下载PDF
基于混合图表示的软件变更预测方法
5
作者 杨馨悦 刘安 +2 位作者 赵雷 陈林 章晓芳 《软件学报》 EI CSCD 北大核心 2024年第8期3824-3842,共19页
软件变更预测旨在识别出具有变更倾向的模块,可以帮助软件管理者和开发人员有效地分配资源,降低维护开销.从代码中提取有效的特征在构建准确的预测模型中起着重要作用.近年来,研究人员从利用传统的手工特征进行预测转向具有强大表示能... 软件变更预测旨在识别出具有变更倾向的模块,可以帮助软件管理者和开发人员有效地分配资源,降低维护开销.从代码中提取有效的特征在构建准确的预测模型中起着重要作用.近年来,研究人员从利用传统的手工特征进行预测转向具有强大表示能力的语义特征,他们从抽象语法树(abstract syntax tree,AST)的节点序列中提取语义特征构建模型.但已有研究忽略了AST的结构信息以及代码中丰富的语义信息,如何提取代码的语义特征仍然是一个具有挑战性的问题.为此,提出一种基于混合图表示的变更预测方法.该模型首先结合AST、控制流图(control flow graph,CFG)、数据流图(data flow graph,DFG)等结构信息构建代码的程序图表示,接着利用图神经网络学习出程序图的语义特征,根据该特征预测变更倾向性.所提模型能够融合各种语义信息以更好地表征代码.在多组变更数据集上开展与最新变更预测方法的对比实验,验证了所提方法的有效性. 展开更多
关键词 软件变更预测 图神经网络 AST 控制流图 数据流图
下载PDF
基于知识回放的即时软件缺陷预测增量模型
6
作者 张文静 李勇 王越 《计算机应用研究》 CSCD 北大核心 2024年第11期3420-3425,共6页
即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,... 即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,提出一种基于知识回放的即时软件缺陷预测增量模型方法。首先,通过知识回放机制存储模型参数和随机样本,实现对旧知识的学习;其次,使用分布式训练框架在本地设备上对即时软件数据流进行增量学习,通过重构实现模型的即时更新;最后采用知识蒸馏技术,构建全局增量预测模型。实验表明,该模型与常见模型算法相比,在保证训练效率的前提下,模型的综合性能表现较优。 展开更多
关键词 即时软件缺陷预测 增量学习 知识回放 知识蒸馏
下载PDF
基于前景理论的软件缺陷预测过采样方法
7
作者 徐彪 严远亭 张以文 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2822-2831,共10页
在软件缺陷预测中,数据困难因子对预测性能的影响比类不平衡更为明显。然而,大多数现有软件缺陷预测过采样方法在解决类不平衡问题过程中,忽视了软件项目数据集固有的数据困难因子,从而导致预测性能不佳。针对上述问题,提出一种基于前... 在软件缺陷预测中,数据困难因子对预测性能的影响比类不平衡更为明显。然而,大多数现有软件缺陷预测过采样方法在解决类不平衡问题过程中,忽视了软件项目数据集固有的数据困难因子,从而导致预测性能不佳。针对上述问题,提出一种基于前景理论的过采样算法(POS)。POS同时考虑局部邻域中同类和异类样本的影响来评估少数类样本的学习难度,通过基于引力的策略构建同类收益和异类损失来刻画样本的前景值,并强调异类损失来计算少数类样本的采样权重,以此降低引入数据困难因子的风险,提高合成样本的质量,进一步提升预测性能。在NASA数据集上的实验结果表明,POS算法在AUC、balance和G-mean等性能指标上均有所提升,具有更好的缺陷预测性能。 展开更多
关键词 软件缺陷预测 类不平衡 数据困难因子 过采样 前景理论
下载PDF
油气井套损风险预测及防控软件研制及应用
8
作者 唐庆 李娟 +5 位作者 杨涛 谢刚 牛会钊 康泽泽 檀朝东 闫伟 《石油化工应用》 CAS 2024年第4期19-26,42,共9页
针对套损作用机理复杂、主控因素难以厘清、防控措施制定不科学等问题,开展了基于数据驱动的套损风险评价预警防控策略研究。对油气井基本数据和套损样本进行数据预处理和主控因素分析,用机器学习算法进行样本训练,建立“二分类”套损... 针对套损作用机理复杂、主控因素难以厘清、防控措施制定不科学等问题,开展了基于数据驱动的套损风险评价预警防控策略研究。对油气井基本数据和套损样本进行数据预处理和主控因素分析,用机器学习算法进行样本训练,建立“二分类”套损预测模型,预测套损的概率,优化完井和生产参数,制定油气井套损防控策略。开发了基于B/S架构的油气井套损风险评价预警防控软件,并链接了A2数据库,实现了某油田2400井层套损防控的实时预警和优化。研究应用表明:建立的预测模型和软件可以对油气井套损原因及防控策略形成认知,可以实现老井、新井、待补层井套损预防对策的优化。 展开更多
关键词 油气井套损 “二分类” 预测 防控 软件
下载PDF
基于联邦迁移的跨项目软件缺陷预测
9
作者 宋慧玲 李勇 张文静 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第3期122-128,共7页
跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能... 跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能.本文提出基于联邦迁移的跨项目软件缺陷预测方法(FT-CPDP).首先,针对数据隐私泄露和项目间特征异构问题,提出基于联邦学习与迁移学习相结合的模型算法,打破各数据持有者间的“数据壁垒”,实现隐私保护场景下的跨项目缺陷预测模型.其次,在联邦通信过程中添加满足隐私预算的噪声来提高隐私保护水平,最后构建卷积神经网络模型实现软件缺陷预测.基于NASA软件缺陷预测数据集进行实验,结果表明与传统跨项目缺陷预测方法相比,本文提出的FT-CPDP方法在实现软件数据隐私保护的前提下,模型的综合性能表现较优. 展开更多
关键词 软件缺陷预测 联邦学习 迁移学习 差分隐私 卷积神经网络
下载PDF
面向可解释性的软件缺陷预测主动学习方法
10
作者 王越 李勇 张文静 《现代电子技术》 北大核心 2024年第20期101-108,共8页
针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本... 针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本放入源项目中以训练预测器。其次,利用领域知识对选定样本进行扰动,构建局部数据集,并通过线性模型在该数据集上模拟数据选择策略的行为,以实现模型的可解释性。实验结果显示:该方法在数据标注方面的指标性能要优于传统的主动学习基准方法;同时,在可解释性方面,该方法的RMSE指标也均低于LIME、全局代理模型以及RuleFit,能较好地解释“黑盒”模型。该方法不仅可以有效提高软件缺陷数据的标注效率,还可以实现模型的可解释性。 展开更多
关键词 软件缺陷预测 主动学习 可解释性 数据标注 数据选择策略 深度学习
下载PDF
工作量感知软件缺陷预测中偏斜分布的影响及测试评估方法
11
作者 郭育晨 朱晓燕 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期203-213,共11页
针对工作量感知软件缺陷预测中传统模型测试评估方法存在偏差这一问题,采用偏斜分布的偏度作为数值特征,研究了3种主要测试评估方法的测试集在工作量偏度的偏差和与其对应的估计误差,并基于偏度偏差较小的采样余量方法,提出一种改进方... 针对工作量感知软件缺陷预测中传统模型测试评估方法存在偏差这一问题,采用偏斜分布的偏度作为数值特征,研究了3种主要测试评估方法的测试集在工作量偏度的偏差和与其对应的估计误差,并基于偏度偏差较小的采样余量方法,提出一种改进方法——后采样方法,所提后采样方法能够保持测试集的类标签比例以避免生成无效测试集。研究结果表明:最常用的十折交叉验证方法偏度偏差最大,其估计误差也最大;与十折交叉验证相比,改进方法性能估计误差减少约4.9%~26.9%;与采样余量方法相比,改进方法不会产生无效测试集,并证明了减小测试集偏度偏差以减少估计误差的有效性。所提后采样方法为工作量感知软件缺陷预测提供了一种更可靠的测试评估方法,能够更准确地评估模型性能。 展开更多
关键词 软件缺陷预测 工作量感知 偏斜分布 测试评估方法
下载PDF
一种基于强化学习的软件安全实体关系预测方法
12
作者 杨鹏 刘亮 +3 位作者 张磊 刘林 李子强 贾凯 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期163-171,共9页
为改善现有基于翻译的软件安全知识图谱实体关系预测方法不具备可解释性,而基于路径推理的方法准确性不高的现状,本研究提出一种基于强化学习的预测方法 .该方法首先分别使用TuckER模型和SBERT模型将软件安全知识图谱的结构信息和描述... 为改善现有基于翻译的软件安全知识图谱实体关系预测方法不具备可解释性,而基于路径推理的方法准确性不高的现状,本研究提出一种基于强化学习的预测方法 .该方法首先分别使用TuckER模型和SBERT模型将软件安全知识图谱的结构信息和描述信息表示为低维度向量,接着将实体关系预测过程建模为强化学习过程,将TuckER模型计算得到的得分引入强化学习的奖励函数,并且使用输入的实体关系向量训练强化学习的策略网络,最后使用波束搜索得到答案实体的排名列表和与之对应的推理路径.实验结果表明,该方法给出了所有预测结果相应的关系路径,在链接预测实验中hit@5为0.426,hit@10为0.797,MRR为0.672,在事实预测实验中准确率为0.802,精确率为0.916,在准确性方面与同类实体关系预测模型相比具有不同程度的提升,并且通过进行可解释性分析实验,验证了该方法所具备的可解释性. 展开更多
关键词 软件安全实体关系 强化学习 链接预测 知识图谱 可解释推理
下载PDF
面向自然崩落法矿山的初始块度预测软件研发及应用
13
作者 郭晓强 谭期仁 +2 位作者 黄敏 黄明发 李邵东 《中国矿业》 北大核心 2024年第2期100-106,共7页
矿石块度是采用自然崩落法开采需要考虑的重要因素。以自然崩落法初始块度预测基本原理为基础,在DIMINE软件平台上采用C++语言开发了初始块度预测软件系统。该系统综合考虑了节理系统的空间几何参数和地应力的作用,支持从块体体积、等... 矿石块度是采用自然崩落法开采需要考虑的重要因素。以自然崩落法初始块度预测基本原理为基础,在DIMINE软件平台上采用C++语言开发了初始块度预测软件系统。该系统综合考虑了节理系统的空间几何参数和地应力的作用,支持从块体体积、等效尺寸和块体形状等不同角度对初始块度结果进行分析。以国外某斑岩型铜矿为例,采用该软件对矿体按勘探线分区进行了初始块度预测,并将结果与国外常用的BCF软件的预测结果进行了对比分析。研究结果表明,矿体勘探线间初始块度的大块率在40.8%~74.8%之间,等效尺寸在1.65~2.63 m之间变化。软件预测的结果与BCF软件预测的结果比较接近,变化趋势基本一致,预测结果为自然崩落法矿山后续的开采设计提供了参考依据。 展开更多
关键词 自然崩落法 初始块度 块度分析 块度预测软件 等效尺寸
下载PDF
薄带短流程无头连铸连轧组织演变 预测模型及其软件开发
14
作者 李伟 张龙 +2 位作者 张灵杰 王涛 黄庆学 《中国重型装备》 2024年第4期20-26,共7页
为了准确预测薄带短流程无头连铸连轧产线上轧制过程中轧件组织的演变过程,结合薄带无头连铸连轧产线的轧制设备和生产工艺特点,基于热传导理论构建了适用于薄带无头连铸连轧轧制全流程的板带温度场模拟系统;在此基础上,利用JMAK模型并... 为了准确预测薄带短流程无头连铸连轧产线上轧制过程中轧件组织的演变过程,结合薄带无头连铸连轧产线的轧制设备和生产工艺特点,基于热传导理论构建了适用于薄带无头连铸连轧轧制全流程的板带温度场模拟系统;在此基础上,利用JMAK模型并耦合温度演变,建立了一种适用于薄带无头连铸连轧产线的组织演变预测模型。进而采用Python和PyQt工具,开发了一款面向用户、便于人机交互的软件,实现该组织演变预测模型的应用。通过将模型计算结果与生产现场的实测数据进行对比验证,结果表明所构建模型对温度的预测误差不超过±5℃,对晶粒尺寸的预测精度不超过±3μm,满足无头连铸连轧产线的生产需求,为薄带无头连铸连轧轧制工艺的制定与优化提供了可靠的理论支持。 展开更多
关键词 薄带无头连铸连轧 温度场模拟系统 组织演变预测模型 软件开发
下载PDF
基于注意力和代价敏感的软件缺陷预测方法
15
作者 毛敬恩 周世健 +1 位作者 章树卿 樊鑫 《计算机测量与控制》 2024年第9期94-100,共7页
软件缺陷预测的目的是预先识别容易出现缺陷的代码模块以帮助软件质量保障团队适当的分配资源和人力;当前基于稳定学习的软件缺陷预测方法在特征提取过程中缺乏代码图像的全局信息,并忽视了不平衡数据对模型性能的影响;为了解决上述问题... 软件缺陷预测的目的是预先识别容易出现缺陷的代码模块以帮助软件质量保障团队适当的分配资源和人力;当前基于稳定学习的软件缺陷预测方法在特征提取过程中缺乏代码图像的全局信息,并忽视了不平衡数据对模型性能的影响;为了解决上述问题,文章提出了一种基于注意力和代价敏感的软件缺陷预测方法;该方法在SDP-SL的神经网络中增加了全局注意力模块,重点关注图像中和缺陷代码相关的特征,并将分类器的损失函数改进为代价敏感的损失函数,降低类不平衡对模型性能的影响;为了评估SDP-SLAC的性能,在PROMISE数据库中的10个开源Java项目上进行了多组比较实验;实验结果表明,SDP-SLAC方法可以有效提升缺陷预测模型的性能。 展开更多
关键词 软件缺陷预测 全局注意力 代价敏感 类不平衡 损失函数
下载PDF
基于图卷积神经网络的大规模软件定义网络流量预测模型 被引量:1
16
作者 张国明 《微电子学与计算机》 2024年第4期96-103,共8页
为了提高大规模软件定义网络流量预测的准确率,研究基于图卷积神经网络的大规模软件定义网络流量预测模型。构建包含图卷积神经网络(Graph Convolution Neural Network,GCN)层、门控递归单元(Gating Recursive Unit,GRU)层及自注意力机... 为了提高大规模软件定义网络流量预测的准确率,研究基于图卷积神经网络的大规模软件定义网络流量预测模型。构建包含图卷积神经网络(Graph Convolution Neural Network,GCN)层、门控递归单元(Gating Recursive Unit,GRU)层及自注意力机制层的流量预测模型。通过GCN层与GRU层分别重构与更新网络流量的空间与时间特征;将两种特征共同输入自注意力机制层,经整合与加权平均运算后,获得网络流量预测值输出,实现大规模软件定义网络流量预测。实验结果显示,该模型可精准预测大规模软件定义网络流量,降低所应用网络的通信丢包率与通信延时,实现高质量高时效的网络数据传输,保障大规模软件定义网络的智能流量通信。 展开更多
关键词 图卷积神经网络 软件定义网络 流量预测 门控递归 注意力机制 时间特征
下载PDF
基于加权复杂度的SMOTE算法及其在软件缺陷预测中的应用
17
作者 魏威 江峰 《计算机与数字工程》 2024年第5期1418-1422,1427,共6页
近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必... 近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必要利用样本的复杂度来辅助新样本的合成,从而提高缺陷预测的性能。如何度量样本的复杂度非常重要,论文在计算样本复杂度时充分考虑到每一个条件属性的权重,从而得到一种加权复杂度的概念。基于加权复杂度,提出一种新的SMOTE算法——WCP-SMOTE,并将其应用于软件缺陷预测。WCP-SMOTE算法首先利用粗糙集中的粒度决策熵来计算决策表中每个条件属性的重要性和权重;其次,通过对样本在所有属性上的取值进行加权求和,从而得到该样本的加权复杂度;第三,根据加权复杂度对少数类样本进行升序排序,并从头到尾对相邻的两个少数类样本求平均来不断地合成新的样本,直到获得一个平衡的数据集。在多个缺陷预测数据集上的实验表明,利用WCP-SMOTE算法来处理不平衡数据能够获得更好的软件缺陷预测性能。 展开更多
关键词 软件缺陷预测 不平衡数据 粗糙集 粒度决策熵 加权复杂度 SMOTE
下载PDF
基于PCA-Smote-XGBoost的软件缺陷预测研究
18
作者 曾子安 李英梅 《软件工程与应用》 2024年第3期346-357,共12页
随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少... 随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少特征数量并提取关键信息;利用Smote过采样方法解决数据不平衡问题;结合XGBoost算法构建预测模型,并通过实验验证模型的有效性。在软件缺陷预测常用数据集的十一个项目中,实验结果表明,该模型在软件缺陷预测方面相较于其他八种基准模型,具有最高的准确率ACC和F1,能够有效地辅助软件开发团队识别潜在的缺陷风险。 展开更多
关键词 软件缺陷预测 PCA SMOTE XGBoost
下载PDF
基于TMFG生成拓扑图的软件缺陷预测图特征选择方法
19
作者 崔梦天 陈建英 徐智慧 《西南民族大学学报(自然科学版)》 CAS 2024年第4期418-427,共10页
软件缺陷预测是降低软件测试成本的重要手段,而特征选择则是其中关键的一环.然而,传统的特征选择算法局限于考虑特征之间的双边关系和两两特征的关联,而无法有效处理更为复杂的多边关系和多向交互等问题.为此,提出了一种基于TMFG的软件... 软件缺陷预测是降低软件测试成本的重要手段,而特征选择则是其中关键的一环.然而,传统的特征选择算法局限于考虑特征之间的双边关系和两两特征的关联,而无法有效处理更为复杂的多边关系和多向交互等问题.为此,提出了一种基于TMFG的软件缺陷预测图特征选择方法.该方法首先将拓扑图引入特征选择算法中,利用对称不确定性作为特征关联度,将特征表示为拓扑图的节点,构建特征全连接图.然后,通过TMFG去连边算法去除全连接图中的部分连边,并进行图聚类操作.接着,对每个聚类中的特征进行排序,并从每个类中选取特定数目的特征进行综合,得到最终的特征子集.最后,通过在Promise数据仓库中的数据集上进行对比实验,结果表明,所提出的方法在进一步优化特征选择选出的特征子集的质量方面取得了良好的效果,尤其在数据量较大的数据集中表现出更大的优势. 展开更多
关键词 软件缺陷预测 特征选择 拓扑图 社区检测算法 TMFG
下载PDF
基于多源特征门控融合的软件缺陷预测
20
作者 李英玲 巴依斯勒 +3 位作者 张禾 邵俊铭 王子翱 蔡牧昕 《西南民族大学学报(自然科学版)》 CAS 2024年第3期312-320,共9页
随着当前软件开发规模的增大和复杂度的不断提高,如何在保证效率的同时提高软件质量成为软件工程领域研究的重点和难点.软件缺陷预测是软件质量保障的重要研究方向,旨在帮助软件从业人员预测软件产品中潜在的缺陷模块,从而更有效地分配... 随着当前软件开发规模的增大和复杂度的不断提高,如何在保证效率的同时提高软件质量成为软件工程领域研究的重点和难点.软件缺陷预测是软件质量保障的重要研究方向,旨在帮助软件从业人员预测软件产品中潜在的缺陷模块,从而更有效地分配测试资源.已有研究主要提取软件特征来建立缺陷预测模型,但通常仅使用单一类型特征作为模型输入,并且缺乏特征的有效融合,导致缺陷预测的性能有待提高.提出了一种基于多源特征门控融合的软件缺陷预测方法(DP⁃GM),首先利用抽象语法树和词嵌入模型得到代码语义表示;然后,采用门控循环单元(GRU)对语义特征向量和传统特征向量进行特征提取;最后,利用门控机制融合多源特征来训练模型并进行软件缺陷预测.实验结果表明,与当前具有代表性的三个基线方法相比较,提出的方法在召回率和F1值分别高出最优基线方法35.3%和10.5%.因此,提出的方法可提升软件缺陷预测的准确性,帮助软件从业者提高开发效益. 展开更多
关键词 软件缺陷预测 多源特征融合 门控神经网络
下载PDF
上一页 1 2 108 下一页 到第
使用帮助 返回顶部