期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于图神经网络的代码抄袭检测方法
1
作者 陈昌奉 赵宏州 周恺卿 《计算机工程与科学》 CSCD 北大核心 2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网... 随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。 展开更多
关键词 代码抄袭检测 深度语义和结构信息提取 图神经网络 图注意力网络 特征强化
下载PDF
程序代码抄袭检测中串匹配算法的研究 被引量:2
2
作者 曹海英 元元 《信息安全与技术》 2015年第2期34-36,共3页
为了保证程序设计课程实践教学质量,避免学生抄袭,可以检测学生的源程序,代码的相似度是抄袭检测的关键技术。文章介绍了一种串匹配算法——GST算法,包括GST算法的核心思想以及伪代码实现。
关键词 程序代码抄袭检测 GST算法 相似度
下载PDF
基于N-gram的VB源代码抄袭检测方法 被引量:1
3
作者 吴斐 唐雁 补嘉 《重庆理工大学学报(自然科学)》 CAS 2012年第2期86-91,共6页
为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的V... 为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的VB源代码抄袭检测方法检测准确率高于MOSS系统,并具有处理大规模数据的能力。 展开更多
关键词 代码抄袭检测 N-GRAM 相似度计算 并行计算
下载PDF
代码抄袭检测技术研究及在实验教学中的应用 被引量:1
4
作者 吴鑫君 梁宇 易超 《实验科学与技术》 2011年第S1期275-278,共4页
为了辅助教师对学生实验代码抄袭检测。根据已有的检测算法,提出一种以多行为单位,对代码进行标准化、数字化、预处理,并使用基于指纹的方式进行比较的方案。该方案不仅能够检测代码的相似度,同时能够给出抄袭的行数。经过实验教学应用... 为了辅助教师对学生实验代码抄袭检测。根据已有的检测算法,提出一种以多行为单位,对代码进行标准化、数字化、预处理,并使用基于指纹的方式进行比较的方案。该方案不仅能够检测代码的相似度,同时能够给出抄袭的行数。经过实验教学应用,该方法能够检测大部分学生抄袭的情况,能够实际应用。 展开更多
关键词 程序相似度 程序指纹 实验代码抄袭 抄袭检测
下载PDF
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具 被引量:1
5
作者 李国繁 张峰 刘聪 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有... 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%. 展开更多
关键词 代码抄袭检测 跨语言 抽象语法树 伪孪生网络
下载PDF
基于抽象语法树的代码抄袭检测方法的改进 被引量:1
6
作者 刘飞翔 龙冬冬 +1 位作者 欧幸茹 陈昌奉 《吉首大学学报(自然科学版)》 CAS 2022年第6期20-25,共6页
针对传统基于抽象语法树的代码抄袭检测方法中存在的检测准确率不高及无法检测语义层面抄袭的问题,设计了一种基于改进抽象语法树的代码抄袭检测方法,该方法通过TF-IDF加权简化的语法树提高检测准确率.利用加权简化的抽象语法树设计特... 针对传统基于抽象语法树的代码抄袭检测方法中存在的检测准确率不高及无法检测语义层面抄袭的问题,设计了一种基于改进抽象语法树的代码抄袭检测方法,该方法通过TF-IDF加权简化的语法树提高检测准确率.利用加权简化的抽象语法树设计特征提取和相似度计算方法实现对语义抄袭的部分检测,实验结果表明,该改进方法比传统的基于抽象语法树的检测方法的准确率更高,且能有效检测出部分基于语义层面的代码抄袭. 展开更多
关键词 代码抄袭 抄袭检测 抽象语法树
下载PDF
基于AST的程序代码抄袭检测方法研究
7
作者 朱良梅 洪晓彬 《电脑知识与技术》 2023年第16期61-64,共4页
为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特... 为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特征序列的节点频度,生成特征向量,通过向量聚类划分“抄袭团伙”,在“抄袭团伙”内比对特征序列计算程序相似度。实验结果表明,该方法能有效检测多种抄袭行为,尤其是对等价控制结构替换的抄袭行为,检测效果明显优于JPlag系统。 展开更多
关键词 代码抄袭检测 代码相似度检测 抽象语法树 聚类
下载PDF
高教程序代码作业抄袭检测的方法研究与实践 被引量:5
8
作者 于俊 李雅洁 +4 位作者 程礼磊 连顺 谭昶 丁德成 刘淇 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第8期1048-1057,共10页
学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性... 学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性乃至损坏学风.为此以智能且自动化方式找出学生作业的相似之处,分析学生抄袭的总体情况为目的,将人工智能算法和数据处理分析技术相结合,提出一种学生作业抄袭检测方法.首先,分析学生提交的程序代码作业的复杂情况,设计作业数据预处理流程.然后,具体提出了基于KR和Winnowing的程序代码作业相似度检测算法,与传统检测方法相比通过代码格式化等改进手段提升了学生作业相似检测的精准度,并在大批量作业检测实践中,研究优化算法增加了不同学生之间作业相似结果的区分度.为了验证相似度计算部分的有效性和实用性,进一步设计了相关的模拟实验流程(包括与JPlag检测系统的对比),给出在相同实验数据集上不同抄袭类型下的相似度计算结果.最后,依托于科大讯飞博思智慧在线学习平台对该研究进行了真实场景的实际应用.实验结果以及实际应用都表明,该程序代码作业抄袭检测方法,对高校学生程序代码作业相似度检测有效,具有很高的应用价值. 展开更多
关键词 程序代码抄袭检测 相似度检测 在线智慧教育
下载PDF
程序代码转换技术的研究与实现 被引量:1
9
作者 裴冬梅 聂建忠 赵凤荣 《内蒙古煤炭经济》 2010年第6期118-119,共2页
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,... 程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,MOSS,YAP等等,但是这些系统中对如何把程序代码进行转换成串的,并没有详细的介绍。本文针对这种情况设计了一个实验系统来实现程序代码转换技术,并进行了验证。 展开更多
关键词 程序代码转换技术 程序代码抄袭检测技术 词表 字符串匹配算法
下载PDF
面向代码相似度检测的指纹选取方法 被引量:4
10
作者 黄柳柳 黄河燕 史树敏 《计算机工程与应用》 CSCD 北大核心 2010年第27期169-171,共3页
代码相似度检测是代码抄袭检测的核心组成部分,对于营造良好的学习氛围、提高知识产权保护意识具有重要作用。总结了应用指纹技术检测代码相似度的基本思路,分析了几种常见的指纹选取方法的优缺点,提出一种改进的面向代码相似度检测的... 代码相似度检测是代码抄袭检测的核心组成部分,对于营造良好的学习氛围、提高知识产权保护意识具有重要作用。总结了应用指纹技术检测代码相似度的基本思路,分析了几种常见的指纹选取方法的优缺点,提出一种改进的面向代码相似度检测的指纹选取方法。该方法能够从疑似抄袭代码集中去除由代码编写规则产生的虚假相似代码对,有效获得代码之间准确的相似度值。 展开更多
关键词 相似度检测 代码抄袭 选取策略 数字指纹
下载PDF
基于多特征值的源代码相似性检测技术 被引量:1
11
作者 展佳俊 赵逢禹 艾均 《计算机技术与发展》 2021年第1期103-109,共7页
在软件开发的过程中,开发人员通过复制粘贴式的开发方式或者模块化的开发方式来完成需求是十分常见的,这两种开发方式可以提高开发效率,但同时会导致软件系统中出现大量的相同代码或者相似代码,大量的相似代码会给软件维护等方面带来很... 在软件开发的过程中,开发人员通过复制粘贴式的开发方式或者模块化的开发方式来完成需求是十分常见的,这两种开发方式可以提高开发效率,但同时会导致软件系统中出现大量的相同代码或者相似代码,大量的相似代码会给软件维护等方面带来很大的困难,这也是最常见的重构对象。源代码相似性度量是指利用一定的检测方法分析程序源代码间的相似程度。该技术被应用于代码抄袭检测、代码克隆检测、软件知识产权保护、代码复用等多个领域。为了提高代码相似性度量的准确性,提出了一种基于多特征值的源代码相似性检测技术。构建了源代码注释、型构、代码文本语句与结构中特征提取的方法,并给出了源代码相似度检测的度量模型。通过与权威的代码相似检测系统Moss进行对比实验,结果表明该方法可以更准确地检测出相似代码。 展开更多
关键词 代码相似 代码抄袭 抽象语法树 代码特征提取 余弦相似度
下载PDF
基于本地代理和索引信息的代码侵权检测方法 被引量:1
12
作者 寨亮 张刚 赵逢禹 《软件导刊》 2017年第6期5-10,共6页
开源软件越来越丰富,企业开发人员可以方便地通过复用开源代码提高开发效率。但是开源代码的许可证非常复杂,未加管理的代码复用可能给企业带来严重的法律风险。通过侵权检测发现潜在侵权风险是企业自我保护的重要手段,然而一般企业都... 开源软件越来越丰富,企业开发人员可以方便地通过复用开源代码提高开发效率。但是开源代码的许可证非常复杂,未加管理的代码复用可能给企业带来严重的法律风险。通过侵权检测发现潜在侵权风险是企业自我保护的重要手段,然而一般企业都没有能力维护互联网级别的开源代码库,而使用第三方检测系统需要提供企业自己的源码,可能造成企业技术秘密泄露。为解决上述问题,提出了一种基于本地代理的代码侵权检测方案,该方案仅需要对外提交代码的结构和索引信息即可,无需提供完整的源码,既保护了企业源码隐私,又避免了企业维护大量开源代码库的额外负担,实现了高效的侵权检测。 展开更多
关键词 侵权检测 哈希值 索引 代码抄袭 克隆检测 本地代理
下载PDF
一种基于编码习惯的SQL语句抄袭检测算法 被引量:1
13
作者 葛文馨 魏永山 《软件》 2019年第11期4-8,共5页
为了检测出数据库实验课程中结构化查询语言(StructuredQueryLanguage,SQL)语句代码的抄袭行为,发现因SQL语句篇幅较短,使用现有的技术进行代码检测却没有得到预期的结果,于是提出了一种基于编码习惯的SQL语句抄袭检测算法。获取学生历... 为了检测出数据库实验课程中结构化查询语言(StructuredQueryLanguage,SQL)语句代码的抄袭行为,发现因SQL语句篇幅较短,使用现有的技术进行代码检测却没有得到预期的结果,于是提出了一种基于编码习惯的SQL语句抄袭检测算法。获取学生历史的编码数据并分类,判定待检测代码的类别并将其与之类别相同的代码依照学生的编码习惯进行特征提取,进而得到特征矩阵并对比代码之间的相似程度,对涉嫌抄袭的代码进行过滤,判断该代码是否为该学生编写。实验结果表明,该算法能够有效地判断出学生的抄袭行为,同时也解决因编码篇幅较短而带来的难以检测是否为抄袭代码这一问题。 展开更多
关键词 编码习惯 代码抄袭检测 朴素贝叶斯 SQL
下载PDF
程序代码集到特征矩阵文本特征提取算法的研究
14
作者 孙令成 肖铁军 《计算机与数字工程》 2023年第10期2363-2368,2378,共7页
论文基于Verilog语言,从词法分析识别单词开始,结合TF-IDF算法获取代码的文本特征值,其次通过语法分析,使用语法树节点的哈弗曼值作为代码的结构特征值,联合使用文本特征值和结构特征值构成代码向量,然后再对代码向量使用奇异值分解获... 论文基于Verilog语言,从词法分析识别单词开始,结合TF-IDF算法获取代码的文本特征值,其次通过语法分析,使用语法树节点的哈弗曼值作为代码的结构特征值,联合使用文本特征值和结构特征值构成代码向量,然后再对代码向量使用奇异值分解获取其潜在语义空间,最后通过潜在语义空间上余弦相似度获取学生代码之间的相似度值。实现了一种高效的程序代码集到特征矩阵文本特征提取算法,为线上教学教育体系提供了更好的教学质量保障,在经过7种课程实验文件的测试后,最终选取相似度前20%作为阈值,其抄袭检测正确率高达96.7%,表明该算法从编译层的角度实现了抄袭检测,效率较高,且对于学生代码作业的抄袭检测率效果较好,可以帮助教师更好地完成教学工作。 展开更多
关键词 代码抄袭 代码分析 TF-IDF 奇异值分解 余弦相似度
下载PDF
分布式程序设计实验平台的设计与应用 被引量:5
15
作者 杨春明 杜炯 王磊 《实验室研究与探索》 CAS 北大核心 2012年第8期54-58,共5页
针对程序设计类课程教学中基本技能训练不足、代码抄袭严重等问题,提出并设计了分布式程序设计实验平台。该平台在Linux环境下自动测评学生提交的代码,采用Moss系统用以检测程序抄袭,利用Python及源软件开发并部署。对平台的性能评估及... 针对程序设计类课程教学中基本技能训练不足、代码抄袭严重等问题,提出并设计了分布式程序设计实验平台。该平台在Linux环境下自动测评学生提交的代码,采用Moss系统用以检测程序抄袭,利用Python及源软件开发并部署。对平台的性能评估及应用效果表明,分布式环境下的实验平台能满足大规模并发请求下的快速响应要求,提高了学生的程序设计综合能力。 展开更多
关键词 程序设计 代码抄袭 实验平台 分布式
下载PDF
相似度检测技术在计算机实验教学中的应用研究
16
作者 张华 周学权 +2 位作者 张淼 郑宏珍 初佃辉 《电子技术与软件工程》 2017年第21期144-145,共2页
计算机实验教学平台是现代实验教学改革的一个重要内容。然而,在以往的实验教学模式中,仅凭教师检查很难发现学生作业是否抄袭。为了解决此问题,本文将基于数字指纹的代码相似度检测算法应用到程序设计实验教学平台中。实践表明,学生之... 计算机实验教学平台是现代实验教学改革的一个重要内容。然而,在以往的实验教学模式中,仅凭教师检查很难发现学生作业是否抄袭。为了解决此问题,本文将基于数字指纹的代码相似度检测算法应用到程序设计实验教学平台中。实践表明,学生之间的抄袭现象得到控制,教师的评判工作量也大大降低。 展开更多
关键词 相似度检测 实验教学 代码抄袭
下载PDF
华为诉讼考量中国政府
17
作者 江海客 《知识经济》 2003年第3期6-13,共8页
业界早已传言思科要告华为,2003年春节前夕,这一传言变成了现实。 美国当地时间1月23日,思科宣布已经向位于得克萨斯州Marshall的联邦法庭提起诉讼,指控华为公司非法盗用思科的知识产权,包括源代码和软件设计方案,并指控华为抄袭思科拥... 业界早已传言思科要告华为,2003年春节前夕,这一传言变成了现实。 美国当地时间1月23日,思科宣布已经向位于得克萨斯州Marshall的联邦法庭提起诉讼,指控华为公司非法盗用思科的知识产权,包括源代码和软件设计方案,并指控华为抄袭思科拥有知识产权的文件和资料,并侵犯思科其它多项专利。 消息一出,全球舆论哗然。这是思科和华为的一场正面冲突,也是中美两国顶级企业的一次正面冲突。这场官司被称为中美最大的知识产权案。 与美国一边倒的舆论倾向不同,中国国内质疑和批判华为的声音不绝于耳。上至政府官员消极的表态,下至黎民百姓的对国外企业的盲从,已经使中国这个成功的企业面临尴尬的境地。 此情此景,让每一个关心比族企业成长的人感到不安,为此本刊刊出这篇文章。让人们对这场官司有一个理性的认识。 展开更多
关键词 华为公司 非法盗用知识产权行为 知识产权保护 思科公司 代码抄袭行为 美国 IT业 中国
下载PDF
有惊且险,不慎踩中思科“哑雷”步步为营,3COM支持华为挺进北美——华为与思科官司的最新进展
18
作者 王湘 《科技经济市场》 2003年第7期38-40,共3页
北京时间6月7日,美国德克萨斯州地区法院签署一份初步禁令,禁止华为停止使用部分软件,但该禁令不影响华为新版本产品的推广和未来业务的发展。这即是宣告:思科利用知识产权手段阻止竞争对手进入其市场、阻碍华为在关键市场成长的目的已... 北京时间6月7日,美国德克萨斯州地区法院签署一份初步禁令,禁止华为停止使用部分软件,但该禁令不影响华为新版本产品的推广和未来业务的发展。这即是宣告:思科利用知识产权手段阻止竞争对手进入其市场、阻碍华为在关键市场成长的目的已经失败——思科则称,“裁决是思科的重大胜利。” 展开更多
关键词 中国企业 华为公司 思科公司 美国 知识产权保护 抄袭代码行为 侵犯知识产权案
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部