期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
程序代码相似度度量的研究与实现 被引量:17
1
作者 于海英 《计算机工程》 CAS CSCD 北大核心 2010年第4期45-46,49,共3页
针对程序代码相似度的度量问题,提出一种属性计数和结构度量相结合的方法,通过统计程序源代码的操作符和操作数个数,产生Halstead长度、Halstead词汇和Halstead容量3个程序的特征向量,利用向量夹角的余弦计算属性相似度,采用最长公共子... 针对程序代码相似度的度量问题,提出一种属性计数和结构度量相结合的方法,通过统计程序源代码的操作符和操作数个数,产生Halstead长度、Halstead词汇和Halstead容量3个程序的特征向量,利用向量夹角的余弦计算属性相似度,采用最长公共子序列算法获取结构相似度,从而衡量程序对间的相似程度。实验结果表明,该方法能够有效检测出学生作业中的相似程序代码。 展开更多
关键词 属性计数 结构 程序代码相似度
下载PDF
程序代码相似度检测方法的设计与实现 被引量:5
2
作者 全上克 杨新锋 《微型电脑应用》 2013年第10期38-41,共4页
程序代码的相似度是剽窃检测的关键技术。通过对现有程序代码相似度度量技术进行研究后,基于属性技术法、结构度量法提出了一种属性计数和结构度量相结合的方法。通过统计程序源代码的操作符和操作数个数以及程序逻辑结构从而产生出一... 程序代码的相似度是剽窃检测的关键技术。通过对现有程序代码相似度度量技术进行研究后,基于属性技术法、结构度量法提出了一种属性计数和结构度量相结合的方法。通过统计程序源代码的操作符和操作数个数以及程序逻辑结构从而产生出一个特征向量,利用向量夹角的余弦计算属性相似度。实验结果表明,该方法能够有效检测出作业中相似的程序代码。 展开更多
关键词 属性计数 结构 程序代码相似度
下载PDF
基于代码相似度的隐含学生行为模式挖掘
3
作者 徐雅静 李通 刘玉涛 《计算机教育》 2017年第6期90-94,共5页
针对学生在编程中出现的代码拷贝问题,提出用一种改进的分段最长公共子序列匹配算法分析代码相似度,进一步挖掘隐藏在相似代码背后的学生之间合作关系以及行为模式,对于如何了解、干预和避免学生抄袭行为的扩散以及正确评价学生的编程... 针对学生在编程中出现的代码拷贝问题,提出用一种改进的分段最长公共子序列匹配算法分析代码相似度,进一步挖掘隐藏在相似代码背后的学生之间合作关系以及行为模式,对于如何了解、干预和避免学生抄袭行为的扩散以及正确评价学生的编程能力进行积极有益的探索。 展开更多
关键词 代码相似度 行为模式挖掘 合作关系挖掘 LCS(大于3个 小于8个)
下载PDF
基于LCS和GST算法的代码相似度分析 被引量:1
4
作者 金恩海 殷立曜 王阳睿 《电子技术与软件工程》 2016年第3期180-180,共1页
从上世纪70年代开始,就有大批的学者进行了代码相似度的研究。通过研究前任的方法,我们提出了通过最长公共子序列和贪婪串匹配的方法进行计算预处理之后的代码的相似度,预处理剔除了注释和预编译指令,并把代码转换为单词串,从而保留了... 从上世纪70年代开始,就有大批的学者进行了代码相似度的研究。通过研究前任的方法,我们提出了通过最长公共子序列和贪婪串匹配的方法进行计算预处理之后的代码的相似度,预处理剔除了注释和预编译指令,并把代码转换为单词串,从而保留了程序的结构这一重要属性,使得大大提升了结果的准确性,使得结果更具有参考意义。 展开更多
关键词 代码相似度分析 最长公共子序列 贪婪字符串匹配
下载PDF
二进制代码相似度分析及在嵌入式设备固件漏洞搜索中的应用 被引量:7
5
作者 于颖超 甘水滔 +2 位作者 邱俊洋 秦晓军 陈左宁 《软件学报》 EI CSCD 北大核心 2022年第11期4137-4172,共36页
在当今“万物互联”的时代,嵌入式系统逐渐成为接入云端的重要组件,常用于安全和隐私敏感的应用或设备中.然而,其底层软件(即固件)也在频繁遭受着安全漏洞的影响.由于嵌入式设备底层硬件平台的复杂异构,软硬件实现差异较大,且其专用性... 在当今“万物互联”的时代,嵌入式系统逐渐成为接入云端的重要组件,常用于安全和隐私敏感的应用或设备中.然而,其底层软件(即固件)也在频繁遭受着安全漏洞的影响.由于嵌入式设备底层硬件平台的复杂异构,软硬件实现差异较大,且其专用性强、源码/文档等往往不会公开,加之其运行环境受限等原因,使得一些在桌面系统上运行良好的动态测试工具很难(或根本不可能)直接适配到嵌入式设备/固件环境中.近年来,研究人员逐渐开始探索基于二进制相似度分析技术来检测嵌入式设备固件中存在的已知漏洞,并且取得了较大的进展.围绕二进制代码相似度分析面临的关键技术挑战,系统研究了现有的二进制代码相似度分析技术,对其通用流程、技术特征、评估标准进行了综合分析和比较;然后分析并总结了现有二进制代码相似度分析技术在嵌入式设备固件漏洞搜索领域的应用;最后,提出了该领域应用仍然存在的一些技术挑战及未来的一些开放性的研究方向. 展开更多
关键词 二进制代码相似度分析 嵌入式固件 漏洞搜索 学习
下载PDF
代码相似度检验的研究与实践
6
作者 畅斌 赵建强 《计算机科学》 CSCD 北大核心 2015年第B10期102-104,共3页
代码相似度检验是确定是否侵犯软件版权和商业秘密的科学方法之一,能够准确描述涉嫌侵犯版权的软件被侵权的范围和程度。克隆代码检测是代码相似度检验的基本技术,从算法上可分为两类,一类是基于文本序列的检测,另一类是关键字查找... 代码相似度检验是确定是否侵犯软件版权和商业秘密的科学方法之一,能够准确描述涉嫌侵犯版权的软件被侵权的范围和程度。克隆代码检测是代码相似度检验的基本技术,从算法上可分为两类,一类是基于文本序列的检测,另一类是关键字查找,这两类方法都有较为成熟的检验工具可供使用。在实践中,由于缺乏权威性方法和工具,应首先阐明理论依据,然后利用已有工具进行合理测算,从而获得较好的检验效果。 展开更多
关键词 克隆代码 克隆软件 代码相似度
下载PDF
基于频繁子图挖掘的代码相似度比对方法
7
作者 季泽凡 刘慧 《信息系统工程》 2019年第1期159-162,共4页
将代码转化为程序依赖图进行比较是代码相似度比对的方法之一。论文针对传统查找方法效率较低,耗时较长的问题,提出一种基于频繁子图挖掘的代码相似度比对方法。该方法用频繁子图挖掘的过程对程序依赖图进行处理,并用一种吸收马尔科夫... 将代码转化为程序依赖图进行比较是代码相似度比对的方法之一。论文针对传统查找方法效率较低,耗时较长的问题,提出一种基于频繁子图挖掘的代码相似度比对方法。该方法用频繁子图挖掘的过程对程序依赖图进行处理,并用一种吸收马尔科夫链的模型描述该过程;在此基础上,用一种Horvitz-Thompson估计的方法估算相似比。测试结果表明,和传统的方法相比,这种方法可以有效提升准确率和效率,适用于更大规模的代码段。 展开更多
关键词 代码相似度比对 程序依赖图 频繁子图挖掘 吸收马尔科夫链 Horvitz-Thompson估计
下载PDF
改进型SimHash算法用于代码数据相似度检测 被引量:2
8
作者 徐莉 刘威 常兴治 《福建电脑》 2023年第6期41-45,共5页
在程序设计类课程的教学过程中,对学生代码的分析和检测能够有效反映学生的课堂学习行为和知识点掌握情况。学生书写速度的不同会导致相同周期内程序代码长度不一致,对从时间维度提取代码文件的特征会有一定的影响。本文提出了一种用于... 在程序设计类课程的教学过程中,对学生代码的分析和检测能够有效反映学生的课堂学习行为和知识点掌握情况。学生书写速度的不同会导致相同周期内程序代码长度不一致,对从时间维度提取代码文件的特征会有一定的影响。本文提出了一种用于检测代码相似度的改进型SimHash算法。首先,将学生代码以时间序列进行收集,统计代码的有效行数和字符数量,并结合整个课堂讲授周期数据计算代码有效性权重;其次,对学生代码进行动态时间规整,使学生代码在相同的周期内长度一致;随后,提取代码文件的SimHash特征,根据代码有效性权重对特征进行加权处理并降维,得到改进型SimHash特征;最后,根据代码文件的改进型SimHash特征,计算代码相似度。实验表明,本文提出的算法能够有效计算代码的相似度。 展开更多
关键词 程序设计 代码相似度 SimHash特征 动态时间规整
下载PDF
基于程序控制流图源代码相似程度分析系统 被引量:4
9
作者 陈新 《计算机系统应用》 2013年第3期144-147,共4页
源代码相似程度分析在软件工程和计算机教学等领域都有重要的应用.软件工程领域的源代码盗窃和著作权纠纷仲裁,计算机教学领域的学生作业作弊分析都需要源代码相似程度的分析.良好的源代码相似程序分析软件还可以应用于相似代码聚类和... 源代码相似程度分析在软件工程和计算机教学等领域都有重要的应用.软件工程领域的源代码盗窃和著作权纠纷仲裁,计算机教学领域的学生作业作弊分析都需要源代码相似程度的分析.良好的源代码相似程序分析软件还可以应用于相似代码聚类和搜索引擎的源代码搜索领域.尽管源代码相似程度分析问题由来已久,但是这个问题并没有令人十分满意和惊喜的研究结果.源代码有其特殊结构,使用传统的纯文本相似度分析显然是不合适的.将首先介绍这个问题的研究历史和进展,简单分析这个问题的难点所在,继而介绍一个新的基于程序控制流图分析的源代码相似程度分析系统,并给出其算法和实现细节.文章最后将分析这个方法的优劣所在,讨论这个方法的进一步改进方向. 展开更多
关键词 作弊检测 代码相似度 控制流图 哈希函数 GCC
下载PDF
代码标识符属性特征向量相似度检测技术研究 被引量:1
10
作者 陈凯 刘建宾 《福建电脑》 2016年第1期4-7,共4页
每段程序代码中的标识符,包含了不同程序部件的名字属性信息,是程序代码中不可或缺的重要元素,为程序代码相似度检测提供了重要分析依据。该文通过提取程序代码中所有的标识符,并对其进行分类,获得程序代码的基础数据,将其中的属性信息... 每段程序代码中的标识符,包含了不同程序部件的名字属性信息,是程序代码中不可或缺的重要元素,为程序代码相似度检测提供了重要分析依据。该文通过提取程序代码中所有的标识符,并对其进行分类,获得程序代码的基础数据,将其中的属性信息映射到特征向量中,然后用改进的向量距离算法计算标识符相似度结果。实验证明,该文所述方法比传统的属性计数法能更有效快速地检测出标识符相似的代码。 展开更多
关键词 代码相似度 标识符 属性计数法 向量
下载PDF
一种基于串匹配的程序代码相似性识别方法 被引量:2
11
作者 王春晖 《黑龙江科技信息》 2015年第29期167-,共1页
相同功能的程序代码之间存在较高的相似度,识别出这些相似的代码有助于代码的抄袭检测、软件中克隆代码检测以及代码同源性检测。将程序转换成了一些量化的标识串(Token),然后使用高效的RKR-GST串匹配算法找出每对Token串的所有最长公... 相同功能的程序代码之间存在较高的相似度,识别出这些相似的代码有助于代码的抄袭检测、软件中克隆代码检测以及代码同源性检测。将程序转换成了一些量化的标识串(Token),然后使用高效的RKR-GST串匹配算法找出每对Token串的所有最长公共子串,然后根据公式计算相似度,最后根据相似度的值作为判定相似性的依据。 展开更多
关键词 RKR-GST算法 代码相似度 识别方法
下载PDF
基于词嵌入的源码相似度研究 被引量:1
12
作者 钱程 谢春丽 +1 位作者 王梦琦 权雷 《软件导刊》 2021年第7期97-101,共5页
源码相似性度量是代码推荐、缺陷监测、代码搜索等很多软件工程领域任务的基础工作。传统的源码相似性度量方法主要利用统计方法从代码的结构属性、文本特性两方面进行度量,缺乏对代码的语义相似性研究。为解决此类问题,在词嵌入基础上... 源码相似性度量是代码推荐、缺陷监测、代码搜索等很多软件工程领域任务的基础工作。传统的源码相似性度量方法主要利用统计方法从代码的结构属性、文本特性两方面进行度量,缺乏对代码的语义相似性研究。为解决此类问题,在词嵌入基础上提出结合TF-IDF和Word2vec的向量空间模型,利用向量间距离衡量代码间的相似性,融合代码的语义信息和统计信息。实验结果表明,相比于传统基于统计的方法,该模型效果提高了15%。 展开更多
关键词 N-GRAM TF-IDF Word2Vec 词嵌入 代码相似度
下载PDF
基于AST的程序代码抄袭检测方法研究
13
作者 朱良梅 洪晓彬 《电脑知识与技术》 2023年第16期61-64,共4页
为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特... 为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特征序列的节点频度,生成特征向量,通过向量聚类划分“抄袭团伙”,在“抄袭团伙”内比对特征序列计算程序相似度。实验结果表明,该方法能有效检测多种抄袭行为,尤其是对等价控制结构替换的抄袭行为,检测效果明显优于JPlag系统。 展开更多
关键词 代码抄袭检测 代码相似度检测 抽象语法树 聚类
下载PDF
建立抽象语法树模型评测C++代码 被引量:6
14
作者 崔舒宁 吴宁 叶丹 《计算机应用》 CSCD 北大核心 2015年第A01期183-185,191,共4页
目前绝大多数的C++程序评测是通过对程序运行结果和标准测试用例的比对,给出非对即错的2值评判。而在虚拟实验室和慕课中,需要结合程序源码给出更全面客观的评价。针对此问题,通过建立C++源代码的抽象语法树,改进了结果相似度和程序代... 目前绝大多数的C++程序评测是通过对程序运行结果和标准测试用例的比对,给出非对即错的2值评判。而在虚拟实验室和慕课中,需要结合程序源码给出更全面客观的评价。针对此问题,通过建立C++源代码的抽象语法树,改进了结果相似度和程序代码相似度的计算方法,使其能够反映程序语义之间的相似度,并在此基础上建立了C++代码综合评价模型。通过实际检验,和人工批改相比较平均批改准确率达到了92.11%,并以百分制的方式给出评价结果。结合程序语义的评价,不仅对学生而言给出了更公正的评分,也为后续的虚拟实验室智能在线指导提供了基础。 展开更多
关键词 在线评测 抽象语法树 代码相似度 慕课 程序设计
下载PDF
JavaScript混淆恶意代码检测方法 被引量:3
15
作者 王婷 牟永敏 +1 位作者 张志华 崔展齐 《计算机仿真》 北大核心 2021年第2期432-437,共6页
随着Web前端代码压缩与混淆工具的快速发展,浏览器需要执行的代码的体积减小,可读性大幅下降,同时也为恶意代码的隐藏提供了便利。为了解决混淆JavaScript代码中恶意代码片段的检测问题,以及找到混淆前后代码中函数的对应关系,通过对Jav... 随着Web前端代码压缩与混淆工具的快速发展,浏览器需要执行的代码的体积减小,可读性大幅下降,同时也为恶意代码的隐藏提供了便利。为了解决混淆JavaScript代码中恶意代码片段的检测问题,以及找到混淆前后代码中函数的对应关系,通过对JavaScript代码函数调用序列及函数调用的分析,研究基于函数调用序列和函数调用关系图的代码相似度,以及Google Closure Compiler的代码混淆方法。提出了一种基于函数调用信息的JavaScript混淆恶意代码检测方法。实验结果表明:上述方法可以有效检测出混淆前后JavaScript代码中函数的对应关系,对换名混淆具有鲁棒性,且检测复杂度低于通用的JavaScript反混淆工具。 展开更多
关键词 函数调用 代码混淆 恶意代码检测 代码相似度
下载PDF
基于代码仓库的语言类计算机课程教学辅助平台 被引量:2
16
作者 陆柳敏 王庭 +1 位作者 杨李婷 张卫丰 《软件导刊》 2020年第12期164-166,共3页
高校计算机类课程作业抄袭现象屡禁不止,加上作业进度跟踪困难、作业批改耗时、师生交流困难等因素,计算机类课程教师已无法通过作业准确评价学生的专业水准。使用代码仓库与持续集成技术,结合课程管理场景,设计了基于代码仓库的教学平... 高校计算机类课程作业抄袭现象屡禁不止,加上作业进度跟踪困难、作业批改耗时、师生交流困难等因素,计算机类课程教师已无法通过作业准确评价学生的专业水准。使用代码仓库与持续集成技术,结合课程管理场景,设计了基于代码仓库的教学平台系统。该系统实现作业在线批注、自动审查及代码相似度检测等功能。在C语言计算机课程中应用,反馈结果良好,教学效率得到提高。 展开更多
关键词 代码仓库 代码相似度检测 持续集成
下载PDF
程序设计类SPOC课程综合教学支撑平台的设计与实现 被引量:2
17
作者 徐雅静 刘玉涛 +2 位作者 李通 李智超 罗安根 《计算机教育》 2017年第1期147-151,共5页
程序设计类课程教学模式的改变必然要依赖强大的教学平台的支撑,针对该类课程实践性强的特点,分析基于SPOC的课堂教学、课后自学的教学实际以及教学反馈的需求,设计并实现一种支持SPOC全教学环节的综合教学支撑平台,并总结该平台在数据... 程序设计类课程教学模式的改变必然要依赖强大的教学平台的支撑,针对该类课程实践性强的特点,分析基于SPOC的课堂教学、课后自学的教学实际以及教学反馈的需求,设计并实现一种支持SPOC全教学环节的综合教学支撑平台,并总结该平台在数据结构SPOC课程中的应用效果。 展开更多
关键词 SPOC OJ平台 APP CLOUD 代码相似度
下载PDF
混合教学模式下程序设计课程在线实践探索 被引量:10
18
作者 陈叶芳 王晓丽 《宁波大学学报(教育科学版)》 2019年第1期103-107,共5页
程序设计课程的实践能力是衡量课程教学效果的关键因素,为促进实践能力培养,在混合式教学模式下设计多层次的实践内容,采用大规模在线实践(Massive Online Open Practice, MOOP)的思路,运用案例点评、边讲边练、边做边评等多种实践形式... 程序设计课程的实践能力是衡量课程教学效果的关键因素,为促进实践能力培养,在混合式教学模式下设计多层次的实践内容,采用大规模在线实践(Massive Online Open Practice, MOOP)的思路,运用案例点评、边讲边练、边做边评等多种实践形式,通过多点化成绩取样、代码相似度检测等功能以增强实践能力评价的客观性,该方法有较好的培养效果及可操作性,可以改变课程现有的实践能力培养的不足。 展开更多
关键词 混合教学 程序设计课程 在线实践 多点化成绩取样 代码相似度
下载PDF
基于符号执行的底层虚拟机混淆器反混淆框架 被引量:4
19
作者 肖顺陶 周安民 +2 位作者 刘亮 贾鹏 刘露平 《计算机应用》 CSCD 北大核心 2018年第6期1745-1750,共6页
针对Miasm反混淆框架反混淆后的结果是一张图片,无法反编译恢复程序源码的问题,在对底层虚拟机混淆器(OLLVM)混淆策略和Miasm反混淆思路进行深入学习研究后,提出并实现了一种基于符号执行的OLLVM通用型自动化反混淆框架。首先,利用基本... 针对Miasm反混淆框架反混淆后的结果是一张图片,无法反编译恢复程序源码的问题,在对底层虚拟机混淆器(OLLVM)混淆策略和Miasm反混淆思路进行深入学习研究后,提出并实现了一种基于符号执行的OLLVM通用型自动化反混淆框架。首先,利用基本块识别算法找到混淆程序中有用的基本块和无用块;其次,采用符号执行技术确定各个有用块之间的拓扑关系;然后,直接对基本块汇编代码进行指令修复;最后,得到一个反混淆后的可执行文件。实验结果表明,该框架在保证尽量少的反混淆用时前提下,反混淆后的程序与未混淆源程序的代码相似度为96.7%,能非常好地实现x86架构下C/C++文件的OLLVM反混淆。 展开更多
关键词 Miasm 底层虚拟机混淆器 反混淆 符号执行 指令修复 代码相似度
下载PDF
源代码在线评测系统中剽窃检测技术的研究与实现 被引量:7
20
作者 周高嵌 彭四伟 《计算机与信息技术》 2005年第12期85-87,共3页
代码剽窃是程序设计课程中经常出现的一种作弊行为,严重破坏了正常的教学秩序。因此,源代码在线自动评测,不仅要实现代码提交、评测的自动化,也要实现对代码剽窃检测的自动化。本文分析了代码变换的各种方法;研究了目前国内外的剽窃检... 代码剽窃是程序设计课程中经常出现的一种作弊行为,严重破坏了正常的教学秩序。因此,源代码在线自动评测,不仅要实现代码提交、评测的自动化,也要实现对代码剽窃检测的自动化。本文分析了代码变换的各种方法;研究了目前国内外的剽窃检测技术的现状;并结合实际教学环境,给出应用于源代码在线评测系统的代码剽窃自动检测模块的设计方案。 展开更多
关键词 代码剽窃 自动检测 代码变换 代码相似度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部