期刊文献+
共找到280篇文章
< 1 2 14 >
每页显示 20 50 100
Detection of semantically similar code 被引量:1
1
作者 Tiantian WANG Kechao WANG +1 位作者 Xiaohong SU Peijun MA 《Frontiers of Computer Science》 SCIE EI CSCD 2014年第6期996-1011,共16页
The traditional similar code detection approaches are limited in detecting semantically similar codes, impeding their applications in practice. In this paper, we have improved the traditional metrics-based approach as... The traditional similar code detection approaches are limited in detecting semantically similar codes, impeding their applications in practice. In this paper, we have improved the traditional metrics-based approach as well as the graph- based approach and presented a metrics-based and graph- based combined approach. First, source codes are represented as augmented system dependence graphs. Then, metrics- based candidate similar code extraction is performed to filter out most of the dissimilar code pairs so as to lower the computational complexity. After that, code normalization is performed on the candidate similar codes to remove code variations so as to detect similar code at the semantic level. Finally, program matching is performed on the normalized control dependence trees to output semantically similar codes. Experiment results show that our approach can detect similar codes with code variations, and it can be applied to large software. 展开更多
关键词 similar code detection system dependence graph code normalization semantically equivalent
原文传递
Golay Code Clustering for Mobility Behavior Similarity Classification in Pocket Switched Networks
2
作者 Hongjun YU Tao Jing +1 位作者 Dechang Chen Simon Y. Berkovich 《通讯和计算机(中英文版)》 2012年第4期466-472,共7页
关键词 流动行为 交换网络 相似性 分类代码 聚类 端到端时延 口袋 路由协议
下载PDF
代码相似性检测技术综述
3
作者 孙祥杰 魏强 +1 位作者 王奕森 杜江 《计算机应用》 CSCD 北大核心 2024年第4期1248-1258,共11页
代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术... 代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术。首先,系统梳理代码相似性检测的近期技术进展,根据目标代码是否开源,将代码相似性检测技术分为源码相似性检测和二进制代码相似性检测,又根据编程语言、指令集的不同进行二次细分;其次,总结每一种技术的思路和研究成果,分析机器学习技术在代码相似性检测领域成功的案例,并讨论现有技术的优势与不足;最后,给出代码相似性检测技术的发展趋势,为相关研究人员提供参考。 展开更多
关键词 二进制代码相似性 源代码相似性 跨语言代码相似性 深度学习 代码克隆
下载PDF
基于用户系统调用序列的二进制代码识别
4
作者 黄海翔 彭双和 钟子煜 《计算机应用》 CSCD 北大核心 2024年第7期2160-2167,共8页
针对编译优化、跨编译器、混淆等带来的二进制代码相似性识别准确率低的问题,提出并实现了一种基于用户系统调用序列的识别方案UstraceDiff。首先,基于Intel Pin框架设计了一个动态分析插桩工具,动态提取二进制代码的用户系统调用序列... 针对编译优化、跨编译器、混淆等带来的二进制代码相似性识别准确率低的问题,提出并实现了一种基于用户系统调用序列的识别方案UstraceDiff。首先,基于Intel Pin框架设计了一个动态分析插桩工具,动态提取二进制代码的用户系统调用序列及参数;其次,通过序列对齐获得被分析的2个二进制代码的系统调用序列的公有序列,并设计了一个有效参数表用于筛选出有效系统调用参数;最后,为评估二进制代码的相似性,提出一种算法利用公有序列及有效参数,计算它们的同源度。使用Coreutils数据集在4种不同的编译条件下对UstraceDiff进行了评估。实验结果表明,相较于Bindiff和DeepBinDiff,UstraceDiff对于同源程序识别的平均准确率分别提高了35.1个百分点和55.4个百分点,对于非同源程序的区分效果也更好。 展开更多
关键词 代码识别 动态分析 系统调用 程序溯源 二进制相似性分析
下载PDF
基于序列判定的多维网络双向链路稳定性预测
5
作者 王少英 王福忠 《计算机仿真》 2024年第1期452-456,共5页
为了确保多维网络双向链路的稳定运行,提出一种多维网络双向链路稳定性预测算法。根据多维网络维数定义和小世界网络特性分析结果,获取多维双向网络的主要特征,通过提取的特征建立多维网络模型,采用稀疏编码网络方法对模型降维处理。以... 为了确保多维网络双向链路的稳定运行,提出一种多维网络双向链路稳定性预测算法。根据多维网络维数定义和小世界网络特性分析结果,获取多维双向网络的主要特征,通过提取的特征建立多维网络模型,采用稀疏编码网络方法对模型降维处理。以结构相似性为基础,计算降维处理后多维网络双向链路中不同节点之间的相似度,通过相似度排序结果获取一个连边序列,以连边序列为判定依据实现多维网络双向链路稳定性预测。实验结果表明,采用所提算法可以获取高精度、高效率的预测结果,有利于提升网络链路的稳定性。 展开更多
关键词 多维网络 双向链路 稳定性预测 稀疏编码网络方法 相似度
下载PDF
基于Jump-SBERT的二进制代码相似性检测技术研究
6
作者 严尹彤 于璐 +2 位作者 王泰彦 李宇薇 潘祖烈 《计算机科学》 CSCD 北大核心 2024年第5期355-362,共8页
二进制代码相似性检测技术在不同的安全领域中有着重要的作用。针对现有的二进制代码相似性检测方法面临计算开销大且精度低、二进制函数语义信息识别不全面和评估数据集单一等问题,提出了一种基于Jump-SBERT的二进制代码相似性检测技术... 二进制代码相似性检测技术在不同的安全领域中有着重要的作用。针对现有的二进制代码相似性检测方法面临计算开销大且精度低、二进制函数语义信息识别不全面和评估数据集单一等问题,提出了一种基于Jump-SBERT的二进制代码相似性检测技术。Jump-SBERT有两个主要创新点,一是利用孪生网络构建SBERT网络结构,该网络结构能够在降低模型的计算开销的同时保持计算精度不变;二是引入了跳转识别机制,使Jump-SBERT可以学习到二进制函数的图结构信息,从而更加全面地捕获二进制函数的语义信息。实验结果表明,Jump-SBERT在小函数池(32个函数)中的识别准确率可达96.3%,在大函数池(10000个函数)中的识别准确率可达85.1%,比最先进(State-of-the-Art,SOTA)的方法高出36.13%,且Jump-SBERT在大规模二进制代码相似性检测中的表现更加稳定。消融实验表明,两个主要创新点对Jump-SBERT均有积极作用,其中,跳转识别机制的贡献最高可达9.11%。 展开更多
关键词 二进制代码 相似性检测 语义信息 SBERT网络结构 跳转识别机制
下载PDF
基于角度边界的二进制函数对比学习模型
7
作者 孙瑞锦 郭世泽 +3 位作者 黎维 詹达之 王军 潘志松 《陆军工程大学学报》 2024年第4期42-50,共9页
现有代码相似性检测模型主要关注编码器的构建,对深度学习的损失函数研究较少。针对二进制函数嵌入向量评估被忽略的问题,提出了一种基于角度边界的二进制代码对比学习模型(angular marginbased binary code contrastive learning frame... 现有代码相似性检测模型主要关注编码器的构建,对深度学习的损失函数研究较少。针对二进制函数嵌入向量评估被忽略的问题,提出了一种基于角度边界的二进制代码对比学习模型(angular marginbased binary code contrastive learning framework,AngCLF)。通过优化对比学习的目标函数,提高了模型的准确性并加快了收敛速度。分析了模型产生效果的原因,并引入多个评估二进制代码向量空间的指标。通过实验验证了AngCLF的准确性,发现其在准确性上超越了包括jTrans模型在内的6个模型,并且收敛速度更快,对齐度和均匀性等指标也有明显优势。 展开更多
关键词 对比学习 角度边界 嵌入学习 二进制代码相似性检测
下载PDF
子宫动脉超声血流参数、血清LncRNA FAM99A、CCL21水平与妊娠期高血压疾病患者病情程度及预后的相关性分析
8
作者 袁梅 刘芳 孙改艳 《黑龙江医药科学》 2024年第4期24-28,共5页
目的:探讨妊娠期高血压疾病(hypertensive disorders of pregnancy,HDP)患者子宫动脉超声血流参数、血清长链非编码RNA家族成员A序列相似性99(LncRNA FAM99A)、CC趋化因子配体21(CCL21)水平变化,并分析其与病情程度相关性及其对预后的... 目的:探讨妊娠期高血压疾病(hypertensive disorders of pregnancy,HDP)患者子宫动脉超声血流参数、血清长链非编码RNA家族成员A序列相似性99(LncRNA FAM99A)、CC趋化因子配体21(CCL21)水平变化,并分析其与病情程度相关性及其对预后的评估价值。方法:回顾性选取2021年1月至2023年12月于开封市第三人民医院诊治的126例HDP患者作为研究组,另选取健康孕产妇42例作为对照组。比较两组不同病情程度者子宫动脉超声血流参数[子宫动脉收缩期/舒张期血流最大速度(systolic/diastolic,S/D)、子宫动脉阻力指数(resistance index,RI)、子宫动脉搏动指数(pulsation index,PI)]、血清LncRNA FAM99A、CCL21水平。分析子宫动脉超声血流参数、血清LncRNA FAM99A、CCL21与病情程度相关性。依据预后情况分为预后不良亚组27例、预后良好亚组99例,比较其子宫动脉超声血流参数、血清LncRNA FAM99A、CCL21水平。分析预后不良的影响因素。评价子宫动脉超声血流参数、血清LncRNA FAM99A、CCL21对预后不良的评估价值。结果:研究组S/D、RI、PI及血清CCL21水平高于对照组,血清LncRNA FAM99A水平低于对照组(P<0.05);S/D、RI、PI、CCL21与病情程度呈正相关(r=0.526、0.418、0.509、0.624,P<0.05),LncRNA FAM99A与病情程度呈负相关(r=-0.637,P<0.05);预后不良亚组S/D、RI、PI及血清CCL21水平高于预后良好亚组,血清LncRNA FAM99A水平低于预后良好亚组(P<0.05);S/D、RI、PI、CCL21为预后不良的危险因素,LncRNA FAM99A为预后不良的保护因素(P<0.05);S/D、RI、PI、LncRNA FAM99A、CCL21联合评估预后的AUC大于单项指标评估(P<0.05)。结论:HDP患者S/D、RI、PI及血清CCL21水平升高,血清LncRNA FAM99A水平降低,且与病情程度及预后密切相关,联合检测其水平对预后具有一定评估价值。 展开更多
关键词 妊娠期高血压疾病 子宫动脉超声血流参数 长链非编码RNA家族成员A序列相似性99 CC趋化因子配体21 预后
下载PDF
非小细胞肺癌患者血清LncRNA FAM138B、miR-105-5p表达与病理特征的关系
9
作者 崔本科 王岩 卢云凤 《河北医药》 CAS 2024年第5期674-678,683,共6页
目的探讨非小细胞肺癌(NSCLC)患者血清长链非编码RNA序列相似性家族138成员B(LncRNA FAM138B)、微小RNA-105-5p(miR-105-5p)表达与病理特征的预后的关系。方法选取2018年1月至2019年12月收治的110例NSCLC患者为NSCLC组,另选取同期60例... 目的探讨非小细胞肺癌(NSCLC)患者血清长链非编码RNA序列相似性家族138成员B(LncRNA FAM138B)、微小RNA-105-5p(miR-105-5p)表达与病理特征的预后的关系。方法选取2018年1月至2019年12月收治的110例NSCLC患者为NSCLC组,另选取同期60例体检健康者为对照组,采用实时荧光定量聚合酶链式反应检测血清LncRNA FAM138B、miR-105-5p表达。分析血清LncRNA FAM138B、miR-105-5p表达与NSCLC患者病理特征的关系。StarBase数据库预测LncRNA FAM138B与miR-105-5p的关系。采用Pearson相关性分析NSCLC患者血清LncRNA FAM138B与miR-105-5p表达的相关性,多因素Cox回归分析NSCLC患者预后影响因素,受试者工作特征(ROC)曲线分析血清LncRNA FAM138B、miR-105-5p表达对NSCLC患者预后的预测价值。结果与对照组比较,NSCLC组血清LncRNA FAM138B表达降低,miR-105-5p表达升高(P<0.05)。经StarBase数据库预测,LncRNA FAM138B与miR-105-5p存在互补序列。Pearson相关性分析显示,NSCLC患者血清LncRNA FAM138B与miR-105-5p表达呈负相关(r=-0.770,P<0.001)。不同分化程度、TNM分期、淋巴结转移NSCLC患者LncRNA FAM138B、miR-105-5p表达比较,差异有统计学意义(P<0.05)。110例NSCLC患者3年总生存率为56.36%(62/110)。K-M生存曲线分析显示,LncRNA FAM138B高表达组总生存率高于低表达组,miR-105-5p高表达组总生存率高于低表达组(P<0.05)。多因素Cox回归分析显示,低分化、TNM分期Ⅲ~Ⅳ期、淋巴结转移和miR-105-5p≥1.494为NSCLC患者死亡的独立危险因素,LncRNA FAM138B≥0.871为独立保护因素(P<0.05)。ROC曲线分析显示,血清LncRNA FAM138B、miR-105-5p表达单独与联合预测NSCLC患者预后的曲线下面积分别为0.783、0.779、0.905,二项联合预测的曲线下面积最大(P<0.05)。结论NSCLC患者血清LncRNA FAM138B低表达,miR-105-5p高表达,与分化程度、TNM分期、淋巴结转移和预后有关,可能成为NSCLC患者预后的辅助预测指标。 展开更多
关键词 非小细胞肺癌 长链非编码RNA序列相似性家族138成员B 微小RNA-105-5p 病理特征 预后
下载PDF
Genetic Searching Algorithm for Optimal Runlength-Limited Codes with Error Control 被引量:5
10
作者 RenQingsheng YeZhongxing 《通信学报》 EI CSCD 北大核心 1997年第3期54-59,共6页
GeneticSearchingAlgorithmforOptimalRunlength┐LimitedCodeswithErrorControl**ThisworkwassupportedbytheChineseK... GeneticSearchingAlgorithmforOptimalRunlength┐LimitedCodeswithErrorControl**ThisworkwassupportedbytheChineseKeyProjectofFundam... 展开更多
关键词 基因算法 分组码 信号处理
下载PDF
REVERSE DESIGN APPROACH FOR MECHANISM TRAJECTORY BASED ON CODE-CHAINS MATCHING 被引量:2
11
作者 ZHANG Shuyou YI Guodong XU Xiaofeng 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2007年第3期86-90,共5页
Aiming at the problem of reverse-design of mechanism, a method based on the matching of trajectory code-chains is presented. The motion trajectory of mechanism is described with code-chain, which is normalized to simp... Aiming at the problem of reverse-design of mechanism, a method based on the matching of trajectory code-chains is presented. The motion trajectory of mechanism is described with code-chain, which is normalized to simplify the operation of geometric transformation. The geometric transforma-tion formulas of scale, mirror and rotation for trajectory code-chain are defined, and the reverse de-sign for mechanism trajectory is realized through the analysis and solution of similarity matching between the desired trajectory and the predefined trajectory. The algorithm program and prototype system of reverse design for mechanism trajectory are developed. Application samples show that the method can break the restriction of trajectory patterns in matching, meet the demand of partial match-ing, and overcome the influence of geometric transformation of trajectory on the reverse design for mechanism. 展开更多
关键词 TRAJECTORY code-chain similarity matching Reverse-design
下载PDF
Improved similarity criterion for seepage erosion using mesoscopic coupled PFC–CFD model 被引量:3
12
作者 倪小东 王媛 +1 位作者 陈珂 赵帅龙 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第8期3069-3078,共10页
Conventional model tests and centrifuge tests are frequently used to investigate seepage erosion. However, the centrifugal test method may not be efficient according to the results of hydraulic conductivity tests and ... Conventional model tests and centrifuge tests are frequently used to investigate seepage erosion. However, the centrifugal test method may not be efficient according to the results of hydraulic conductivity tests and piping erosion tests. The reason why seepage deformation in model tests may deviate from similarity was first discussed in this work. Then, the similarity criterion for seepage deformation in porous media was improved based on the extended Darcy-Brinkman-Forchheimer equation. Finally, the coupled particle flow code–computational fluid dynamics(PFC-CFD) model at the mesoscopic level was proposed to verify the derived similarity criterion. The proposed model maximizes its potential to simulate seepage erosion via the discrete element method and satisfy the similarity criterion by adjusting particle size. The numerical simulations achieved identical results with the prototype, thus indicating that the PFC-CFD model that satisfies the improved similarity criterion can accurately reproduce the processes of seepage erosion at the mesoscopic level. 展开更多
关键词 cfd模型 耦合渗流 相似准则 侵蚀过程 介观层次 计算流体动力学 离心试验 模型试验
下载PDF
基于可解释性人工智能的软件工程技术方法综述 被引量:2
13
作者 邢颖 《计算机科学》 CSCD 北大核心 2023年第5期3-11,共9页
在信息处理与决策方面,人工智能(AI)方法相比传统方法表现出了优越的性能。但在将AI模型投入生产时,其输出结果并不能保证完全准确,因此AI技术的“不可信”逐渐成为AI大规模落地的一大阻碍。目前人工智能被逐步应用到软件工程中,其过度... 在信息处理与决策方面,人工智能(AI)方法相比传统方法表现出了优越的性能。但在将AI模型投入生产时,其输出结果并不能保证完全准确,因此AI技术的“不可信”逐渐成为AI大规模落地的一大阻碍。目前人工智能被逐步应用到软件工程中,其过度依赖历史数据和决策不透明等弊端愈发明显,因此对决策结果做出合理的解释至关重要。文中对可解释性人工智能的基本概念、可解释模型的评估进行了详细阐述,探讨了软件工程与可解释人工智能结合的可行性;同时调研了相关文献,对软件工程中的恶意软件检测、高风险组件检测、软件负载分配、二进制代码相似性分析这4个人工智能的典型应用方向做出分析,讨论如何通过可解释AI揭示系统输出的正确程度,进而提高系统决策的可信度;最后展望未来软件工程与可解释人工智能相结合的研究方向。 展开更多
关键词 可解释人工智能 软件工程 恶意软件检测 代码相似性分析
下载PDF
光纤传输网络衰耗节点定位方法
14
作者 梁青云 宋岸峰 +1 位作者 冯帆 张海鹏 《激光杂志》 CAS 北大核心 2023年第7期149-153,共5页
在光纤传输网络环境中,为将传输信号的衰耗周期控制在既定数值范围之内,实现对光应用信号的最大化应用,提出光纤传输网络中的衰耗节点定位方法。联合激光器驱动电路与波分复用分路器,确定与光纤传输信号相关的调制编码形式,实现光纤传... 在光纤传输网络环境中,为将传输信号的衰耗周期控制在既定数值范围之内,实现对光应用信号的最大化应用,提出光纤传输网络中的衰耗节点定位方法。联合激光器驱动电路与波分复用分路器,确定与光纤传输信号相关的调制编码形式,实现光纤传输网络的构建。在此基础上,确定衰耗信号的相似性数值,通过定义信号结构体相关函数的方式,确定局部衰耗定位点的实际所处位置,完成光纤传输网络中衰耗节点定位方法研究。实验结果表明,所提方法的数据传输信噪比最高值仅为50 dB,衰耗周期数值最高为3.03 mm,在光纤传输网络环境中更符合光应用信号的最大化应用需求。 展开更多
关键词 光纤传输网络 衰耗节点 驱动电路 复用分路器 调制编码 相似性 相关函数
下载PDF
采动岩层全空间“类双曲面”立体移动模型 被引量:4
15
作者 左建平 李颖 +3 位作者 李宏杰 于美鲁 吴作启 刘家顺 《矿业科学学报》 CSCD 2023年第1期1-14,共14页
基于大量现场调研及岩层移动内外“类双曲线”移动模型分析,本文对哈拉沟煤矿厚松散岩层煤层开挖展开了物理相似模型试验,验证了内外“类双曲线”整体移动模型的有效性;将其推广到三维空间,提出采动岩层全空间“类双曲面”立体移动模型... 基于大量现场调研及岩层移动内外“类双曲线”移动模型分析,本文对哈拉沟煤矿厚松散岩层煤层开挖展开了物理相似模型试验,验证了内外“类双曲线”整体移动模型的有效性;将其推广到三维空间,提出采动岩层全空间“类双曲面”立体移动模型。该模型包含“类单叶”、“类双叶”两类双曲面,能近似描述不同岩性条件下全空间采动岩层立体移动与地表沉陷特征。“类单叶双曲面”模型为空间岩层水平移动边界模型,隐含于厚松散层覆岩内部;“类双叶双曲面”模型为空间地表沉降与覆岩裂隙拱、冒落拱垂向移动边界模型,均在主关键层近似关于“原点”对称,具体表现为采掘扰动下地表沉陷及采场围岩拱形垮落等外部形态。通过理论分析、相似模型试验及3DEC数值模拟,本文建立并验证了厚松散层近水平煤层开采条件下空间采动岩层立体移动与地表沉陷“类双曲面”模型。同时,分析了共渐近锥面“类双曲面”模型的构成条件、影响因素及整体运移规律。研究结果表明:在薄基岩厚松散层近水平煤层开采条件下,“类双曲面”理论模型与3DEC模拟结果吻合较好,表明采动空间覆岩运移和地表沉降呈“类双曲面”特征。 展开更多
关键词 覆岩破断与移动 地表沉降 类双曲面 立体移动模型 相似模型试验 3DEC
下载PDF
基于Transformer模型的问句语义相似度计算 被引量:3
16
作者 丁邱 迟海洋 +2 位作者 严馨 徐广义 邓忠莹 《计算机工程与设计》 北大核心 2023年第3期887-893,共7页
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此... 针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。 展开更多
关键词 自然语言处理 Transformer编码器 交互注意力机制 特征融合 语义相似度 语义编码 句子表示
下载PDF
基于模型相似度的模型恶意代码夹带检测方法 被引量:1
17
作者 汪德刚 孙奕 +2 位作者 周传鑫 高琦 杨帆 《网络与信息安全学报》 2023年第4期90-103,共14页
联邦学习主要通过源数据不出本地而仅交互模型参数的方式保护参与共享用户数据的隐私安全,然而其仍然面临众多安全挑战,目前研究者主要针对如何增强模型隐私保护和检测恶意模型攻击等问题展开较为广泛的研究,然而利用联邦学习过程中频... 联邦学习主要通过源数据不出本地而仅交互模型参数的方式保护参与共享用户数据的隐私安全,然而其仍然面临众多安全挑战,目前研究者主要针对如何增强模型隐私保护和检测恶意模型攻击等问题展开较为广泛的研究,然而利用联邦学习过程中频繁交互的模型数据进行恶意代码夹带导致风险扩散的问题鲜有研究。针对联邦学习训练过程中通过模型传递恶意代码导致风险扩散的问题,提出一种基于模型相似度的模型恶意代码夹带检测方法。通过分析联邦学习本地模型与全局模型的迭代过程,提出计算模型距离的方法,并使用模型距离量化模型之间的相似度,最终根据各客户端模型之间的相似度对携带恶意代码的模型进行检测。实验结果表明,提出的检测方法具有较好的性能指标,当训练集为独立同分布时,在178MB大小的模型中嵌入0.375 MB恶意代码,检测方法的真正率为82.9%,误报率为1.8%;嵌入0.75 MB恶意代码时,检测方法的真正率为96.6%,误报率为0.38%。当训练集为非独立同分布时,检测方法的准确率随恶意代码嵌入率以及联邦学习训练轮数的增加而增加。在对恶意代码进行加密的情况下,提出的检测方法仍然能够达到90%以上的准确率。在多攻击者的场景中,攻击者数量已知与未知时的检测方法准确率均能保持在90%左右。 展开更多
关键词 联邦学习 模型 模型相似度 恶意代码 检测
下载PDF
基于代码相似性的测试用例重用及生成方法
18
作者 刘巧韵 杨秋辉 +2 位作者 洪玫 刘美英 刘盈盈 《计算机工程与设计》 北大核心 2023年第10期2950-2955,共6页
为在测试用例自动化生成中有效利用现有用例信息,降低测试用例生成成本,提高生成效率,提出一种基于代码相似性的测试用例重用及生成方法。设计基于文本和度量的被测代码相似性检测方法,分别从语法和语义上检测并划分相似类型;针对不同... 为在测试用例自动化生成中有效利用现有用例信息,降低测试用例生成成本,提高生成效率,提出一种基于代码相似性的测试用例重用及生成方法。设计基于文本和度量的被测代码相似性检测方法,分别从语法和语义上检测并划分相似类型;针对不同相似类型,采用更名重用和补充重用生成测试用例。将代码相似性应用于测试用例生成,综合考虑代码的语法、语义等多维相似信息,提升代码相似性检测的准确性,能更有效运用重用技术提升测试用例生成效率。实验结果表明,所提方法具有更高的重用召回率和重用精度,在相同时间成本下生成的测试用例覆盖率更高。 展开更多
关键词 单元测试 测试用例自动化生成 测试用例重用 代码相似性检测 代码克隆 语法相似性 语义相似性
下载PDF
融合知识的小片段代码相似性比较模型
19
作者 夏冰 周鑫 +2 位作者 庞建民 岳峰 单征 《计算机工程与设计》 北大核心 2023年第8期2360-2366,共7页
二进制小片段代码指令序列较短,基本块逻辑调用图结构简单,有限语义信息影响代码相似性比较结果,为此提出一种融合知识表示学习的二进制代码小片段相似性比较模型(BSM)。分别提取小片段代码的函数知识和函数代码,利用注意力机制和双向... 二进制小片段代码指令序列较短,基本块逻辑调用图结构简单,有限语义信息影响代码相似性比较结果,为此提出一种融合知识表示学习的二进制代码小片段相似性比较模型(BSM)。分别提取小片段代码的函数知识和函数代码,利用注意力机制和双向长短记忆得到知识嵌入,使用序列学习模型或图神经网络得到函数嵌入,融合知识嵌入和函数嵌入作为小片段代码向量表示。实验结果表明,BSM模型在跨平台比较上优于其它对比模型,说明模型能提升小片段代码比较的准确度。 展开更多
关键词 二进制代码 跨平台 小片段比较 神经网络 自然语言处理 知识表示学习 代码表示学习
下载PDF
改进型SimHash算法用于代码数据相似度检测 被引量:2
20
作者 徐莉 刘威 常兴治 《福建电脑》 2023年第6期41-45,共5页
在程序设计类课程的教学过程中,对学生代码的分析和检测能够有效反映学生的课堂学习行为和知识点掌握情况。学生书写速度的不同会导致相同周期内程序代码长度不一致,对从时间维度提取代码文件的特征会有一定的影响。本文提出了一种用于... 在程序设计类课程的教学过程中,对学生代码的分析和检测能够有效反映学生的课堂学习行为和知识点掌握情况。学生书写速度的不同会导致相同周期内程序代码长度不一致,对从时间维度提取代码文件的特征会有一定的影响。本文提出了一种用于检测代码相似度的改进型SimHash算法。首先,将学生代码以时间序列进行收集,统计代码的有效行数和字符数量,并结合整个课堂讲授周期数据计算代码有效性权重;其次,对学生代码进行动态时间规整,使学生代码在相同的周期内长度一致;随后,提取代码文件的SimHash特征,根据代码有效性权重对特征进行加权处理并降维,得到改进型SimHash特征;最后,根据代码文件的改进型SimHash特征,计算代码相似度。实验表明,本文提出的算法能够有效计算代码的相似度。 展开更多
关键词 程序设计 代码相似度 SimHash特征 动态时间规整
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部