期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于AST的程序代码抄袭检测方法研究
1
作者
朱良梅
洪晓彬
《电脑知识与技术》
2023年第16期61-64,共4页
为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特...
为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特征序列的节点频度,生成特征向量,通过向量聚类划分“抄袭团伙”,在“抄袭团伙”内比对特征序列计算程序相似度。实验结果表明,该方法能有效检测多种抄袭行为,尤其是对等价控制结构替换的抄袭行为,检测效果明显优于JPlag系统。
展开更多
关键词
代码抄袭检测
代码
相似度
检测
抽象语法树
聚类
下载PDF
职称材料
程序代码抄袭检测中串匹配算法的研究
被引量:
2
2
作者
曹海英
元元
《信息安全与技术》
2015年第2期34-36,共3页
为了保证程序设计课程实践教学质量,避免学生抄袭,可以检测学生的源程序,代码的相似度是抄袭检测的关键技术。文章介绍了一种串匹配算法——GST算法,包括GST算法的核心思想以及伪代码实现。
关键词
程序
代码抄袭检测
GST算法
相似度
下载PDF
职称材料
基于N-gram的VB源代码抄袭检测方法
被引量:
1
3
作者
吴斐
唐雁
补嘉
《重庆理工大学学报(自然科学)》
CAS
2012年第2期86-91,共6页
为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的V...
为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的VB源代码抄袭检测方法检测准确率高于MOSS系统,并具有处理大规模数据的能力。
展开更多
关键词
源
代码抄袭检测
N-GRAM
相似度计算
并行计算
下载PDF
职称材料
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具
4
作者
李国繁
张峰
刘聪
《小型微型计算机系统》
CSCD
北大核心
2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有...
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%.
展开更多
关键词
代码抄袭检测
跨语言
抽象语法树
伪孪生网络
下载PDF
职称材料
基于图神经网络的代码抄袭检测方法
5
作者
陈昌奉
赵宏州
周恺卿
《计算机工程与科学》
2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网...
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。
展开更多
关键词
代码抄袭检测
深度语义和结构信息提取
图神经网络
图注意力网络
特征强化
下载PDF
职称材料
高教程序代码作业抄袭检测的方法研究与实践
被引量:
3
6
作者
于俊
李雅洁
+4 位作者
程礼磊
连顺
谭昶
丁德成
刘淇
《中国科学技术大学学报》
CAS
CSCD
北大核心
2020年第8期1048-1057,共10页
学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性...
学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性乃至损坏学风.为此以智能且自动化方式找出学生作业的相似之处,分析学生抄袭的总体情况为目的,将人工智能算法和数据处理分析技术相结合,提出一种学生作业抄袭检测方法.首先,分析学生提交的程序代码作业的复杂情况,设计作业数据预处理流程.然后,具体提出了基于KR和Winnowing的程序代码作业相似度检测算法,与传统检测方法相比通过代码格式化等改进手段提升了学生作业相似检测的精准度,并在大批量作业检测实践中,研究优化算法增加了不同学生之间作业相似结果的区分度.为了验证相似度计算部分的有效性和实用性,进一步设计了相关的模拟实验流程(包括与JPlag检测系统的对比),给出在相同实验数据集上不同抄袭类型下的相似度计算结果.最后,依托于科大讯飞博思智慧在线学习平台对该研究进行了真实场景的实际应用.实验结果以及实际应用都表明,该程序代码作业抄袭检测方法,对高校学生程序代码作业相似度检测有效,具有很高的应用价值.
展开更多
关键词
程序
代码抄袭检测
相似度
检测
在线智慧教育
下载PDF
职称材料
一种基于编码习惯的SQL语句抄袭检测算法
被引量:
1
7
作者
葛文馨
魏永山
《软件》
2019年第11期4-8,共5页
为了检测出数据库实验课程中结构化查询语言(StructuredQueryLanguage,SQL)语句代码的抄袭行为,发现因SQL语句篇幅较短,使用现有的技术进行代码检测却没有得到预期的结果,于是提出了一种基于编码习惯的SQL语句抄袭检测算法。获取学生历...
为了检测出数据库实验课程中结构化查询语言(StructuredQueryLanguage,SQL)语句代码的抄袭行为,发现因SQL语句篇幅较短,使用现有的技术进行代码检测却没有得到预期的结果,于是提出了一种基于编码习惯的SQL语句抄袭检测算法。获取学生历史的编码数据并分类,判定待检测代码的类别并将其与之类别相同的代码依照学生的编码习惯进行特征提取,进而得到特征矩阵并对比代码之间的相似程度,对涉嫌抄袭的代码进行过滤,判断该代码是否为该学生编写。实验结果表明,该算法能够有效地判断出学生的抄袭行为,同时也解决因编码篇幅较短而带来的难以检测是否为抄袭代码这一问题。
展开更多
关键词
编码习惯
代码抄袭检测
朴素贝叶斯
SQL
下载PDF
职称材料
程序代码转换技术的研究与实现
被引量:
1
8
作者
裴冬梅
聂建忠
赵凤荣
《内蒙古煤炭经济》
2010年第6期118-119,共2页
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,...
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,MOSS,YAP等等,但是这些系统中对如何把程序代码进行转换成串的,并没有详细的介绍。本文针对这种情况设计了一个实验系统来实现程序代码转换技术,并进行了验证。
展开更多
关键词
程序
代码
转换技术
程序
代码抄袭检测
技术
词表
字符串匹配算法
下载PDF
职称材料
题名
基于AST的程序代码抄袭检测方法研究
1
作者
朱良梅
洪晓彬
机构
广州工商学院工学院
出处
《电脑知识与技术》
2023年第16期61-64,共4页
基金
广州工商学院2022年校级科研项目(项目编号:KYYB202235)。
文摘
为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特征序列的节点频度,生成特征向量,通过向量聚类划分“抄袭团伙”,在“抄袭团伙”内比对特征序列计算程序相似度。实验结果表明,该方法能有效检测多种抄袭行为,尤其是对等价控制结构替换的抄袭行为,检测效果明显优于JPlag系统。
关键词
代码抄袭检测
代码
相似度
检测
抽象语法树
聚类
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
程序代码抄袭检测中串匹配算法的研究
被引量:
2
2
作者
曹海英
元元
机构
河套学院理学系
出处
《信息安全与技术》
2015年第2期34-36,共3页
文摘
为了保证程序设计课程实践教学质量,避免学生抄袭,可以检测学生的源程序,代码的相似度是抄袭检测的关键技术。文章介绍了一种串匹配算法——GST算法,包括GST算法的核心思想以及伪代码实现。
关键词
程序
代码抄袭检测
GST算法
相似度
Keywords
detecting plagiarism program code
gst arithmetic
similarity
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于N-gram的VB源代码抄袭检测方法
被引量:
1
3
作者
吴斐
唐雁
补嘉
机构
西南大学计算机与信息科学学院
出处
《重庆理工大学学报(自然科学)》
CAS
2012年第2期86-91,共6页
文摘
为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的VB源代码抄袭检测方法检测准确率高于MOSS系统,并具有处理大规模数据的能力。
关键词
源
代码抄袭检测
N-GRAM
相似度计算
并行计算
Keywords
source code plagiarism detection
N-gram
similarity measure
parallel computing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具
4
作者
李国繁
张峰
刘聪
机构
山东科技大学计算机科学与工程学院
山东省智慧矿山信息技术重点实验室
山东理工大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第7期1562-1568,共7页
基金
国家自然科学基金项目(U1931207,61902222,31671588)资助
山东省泰山学者计划项目(tsqn201909109,ts20190936)资助
+2 种基金
教育部人文社会科学研究青年基金项目(19YJCZH240)资助
山东省科技发展基金项目(2016ZDJS021A11,ZR2017MF027)资助
山东科技大学优秀教学团队建设计划项目(JXTD20180503)资助.
文摘
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%.
关键词
代码抄袭检测
跨语言
抽象语法树
伪孪生网络
Keywords
source code plagiarism detection
across language
abstract syntax tree
pseudo-siamese network
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于图神经网络的代码抄袭检测方法
5
作者
陈昌奉
赵宏州
周恺卿
机构
吉首大学计算机科学与工程学院
出处
《计算机工程与科学》
2024年第10期1815-1824,共10页
基金
国家自然科学基金(62266019)
湖南省教育厅科学研究项目(21C0363)。
文摘
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。
关键词
代码抄袭检测
深度语义和结构信息提取
图神经网络
图注意力网络
特征强化
Keywords
code plagiarism detection
deep semantic and structural information extraction
graph neural network
graph attention network
feature enhancement
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
高教程序代码作业抄袭检测的方法研究与实践
被引量:
3
6
作者
于俊
李雅洁
程礼磊
连顺
谭昶
丁德成
刘淇
机构
中国科学技术大学计算机科学与技术学院
科大讯飞股份有限公司
南京谦萃智能科技服务有限公司
出处
《中国科学技术大学学报》
CAS
CSCD
北大核心
2020年第8期1048-1057,共10页
基金
国家自然科学基金(61922073)
中央高校基本科研业务费专项(WK2150110021)资助.
文摘
学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性乃至损坏学风.为此以智能且自动化方式找出学生作业的相似之处,分析学生抄袭的总体情况为目的,将人工智能算法和数据处理分析技术相结合,提出一种学生作业抄袭检测方法.首先,分析学生提交的程序代码作业的复杂情况,设计作业数据预处理流程.然后,具体提出了基于KR和Winnowing的程序代码作业相似度检测算法,与传统检测方法相比通过代码格式化等改进手段提升了学生作业相似检测的精准度,并在大批量作业检测实践中,研究优化算法增加了不同学生之间作业相似结果的区分度.为了验证相似度计算部分的有效性和实用性,进一步设计了相关的模拟实验流程(包括与JPlag检测系统的对比),给出在相同实验数据集上不同抄袭类型下的相似度计算结果.最后,依托于科大讯飞博思智慧在线学习平台对该研究进行了真实场景的实际应用.实验结果以及实际应用都表明,该程序代码作业抄袭检测方法,对高校学生程序代码作业相似度检测有效,具有很高的应用价值.
关键词
程序
代码抄袭检测
相似度
检测
在线智慧教育
Keywords
plagiarism detection for program code
similarity detection
online wisdom education
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于编码习惯的SQL语句抄袭检测算法
被引量:
1
7
作者
葛文馨
魏永山
机构
山东科技大学计算机科学与工程学院
出处
《软件》
2019年第11期4-8,共5页
基金
山东省自然科学基金(项目编号:ZR2011FQ028)
文摘
为了检测出数据库实验课程中结构化查询语言(StructuredQueryLanguage,SQL)语句代码的抄袭行为,发现因SQL语句篇幅较短,使用现有的技术进行代码检测却没有得到预期的结果,于是提出了一种基于编码习惯的SQL语句抄袭检测算法。获取学生历史的编码数据并分类,判定待检测代码的类别并将其与之类别相同的代码依照学生的编码习惯进行特征提取,进而得到特征矩阵并对比代码之间的相似程度,对涉嫌抄袭的代码进行过滤,判断该代码是否为该学生编写。实验结果表明,该算法能够有效地判断出学生的抄袭行为,同时也解决因编码篇幅较短而带来的难以检测是否为抄袭代码这一问题。
关键词
编码习惯
代码抄袭检测
朴素贝叶斯
SQL
Keywords
Coding behavior
Code plagiarism detection
Naive bayesian
SQL
分类号
TP311.11 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
程序代码转换技术的研究与实现
被引量:
1
8
作者
裴冬梅
聂建忠
赵凤荣
机构
内蒙古师范大学计算机与信息工程学院
出处
《内蒙古煤炭经济》
2010年第6期118-119,共2页
文摘
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,MOSS,YAP等等,但是这些系统中对如何把程序代码进行转换成串的,并没有详细的介绍。本文针对这种情况设计了一个实验系统来实现程序代码转换技术,并进行了验证。
关键词
程序
代码
转换技术
程序
代码抄袭检测
技术
词表
字符串匹配算法
Keywords
Program code token technique
Program detecting technique
vocable table
Character String arithmetic
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于AST的程序代码抄袭检测方法研究
朱良梅
洪晓彬
《电脑知识与技术》
2023
0
下载PDF
职称材料
2
程序代码抄袭检测中串匹配算法的研究
曹海英
元元
《信息安全与技术》
2015
2
下载PDF
职称材料
3
基于N-gram的VB源代码抄袭检测方法
吴斐
唐雁
补嘉
《重庆理工大学学报(自然科学)》
CAS
2012
1
下载PDF
职称材料
4
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具
李国繁
张峰
刘聪
《小型微型计算机系统》
CSCD
北大核心
2022
0
下载PDF
职称材料
5
基于图神经网络的代码抄袭检测方法
陈昌奉
赵宏州
周恺卿
《计算机工程与科学》
2024
下载PDF
职称材料
6
高教程序代码作业抄袭检测的方法研究与实践
于俊
李雅洁
程礼磊
连顺
谭昶
丁德成
刘淇
《中国科学技术大学学报》
CAS
CSCD
北大核心
2020
3
下载PDF
职称材料
7
一种基于编码习惯的SQL语句抄袭检测算法
葛文馨
魏永山
《软件》
2019
1
下载PDF
职称材料
8
程序代码转换技术的研究与实现
裴冬梅
聂建忠
赵凤荣
《内蒙古煤炭经济》
2010
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部