期刊文献+
共找到126篇文章
< 1 2 7 >
每页显示 20 50 100
HCRVD: A Vulnerability Detection System Based on CST-PDG Hierarchical Code Representation Learning
1
作者 Zhihui Song Jinchen Xu +1 位作者 Kewei Li Zheng Shan 《Computers, Materials & Continua》 SCIE EI 2024年第6期4573-4601,共29页
Prior studies have demonstrated that deep learning-based approaches can enhance the performance of source code vulnerability detection by training neural networks to learn vulnerability patterns in code representation... Prior studies have demonstrated that deep learning-based approaches can enhance the performance of source code vulnerability detection by training neural networks to learn vulnerability patterns in code representations.However,due to limitations in code representation and neural network design,the validity and practicality of the model still need to be improved.Additionally,due to differences in programming languages,most methods lack cross-language detection generality.To address these issues,in this paper,we analyze the shortcomings of previous code representations and neural networks.We propose a novel hierarchical code representation that combines Concrete Syntax Trees(CST)with Program Dependence Graphs(PDG).Furthermore,we introduce a Tree-Graph-Gated-Attention(TGGA)network based on gated recurrent units and attention mechanisms to build a Hierarchical Code Representation learning-based Vulnerability Detection(HCRVD)system.This system enables cross-language vulnerability detection at the function-level.The experiments show that HCRVD surpasses many competitors in vulnerability detection capabilities.It benefits from the hierarchical code representation learning method,and outperforms baseline in cross-language vulnerability detection by 9.772%and 11.819%in the C/C++and Java datasets,respectively.Moreover,HCRVD has certain ability to detect vulnerabilities in unknown programming languages and is useful in real open-source projects.HCRVD shows good validity,generality and practicality. 展开更多
关键词 Vulnerability detection deep learning CST-PDG code representation tree-graph-gated-attention network cross-language
下载PDF
HawkEyes Plagiarism Detection System
2
作者 Leilei Kong Jie Li +4 位作者 Feng Zhao Haoliang Qi Zhongyuan Han Yong Han ZhiMao Lu 《国际计算机前沿大会会议论文集》 2015年第1期134-135,共2页
The high-obfuscation plagiarism detection in big data environment,such as the paraphrasing and cross-language plagiarism, is often difficult for anti-plagiarism system because the plagiarism skills are becoming more a... The high-obfuscation plagiarism detection in big data environment,such as the paraphrasing and cross-language plagiarism, is often difficult for anti-plagiarism system because the plagiarism skills are becoming more and more complex. This paper proposes HawkEyes, a plagiarism detection system implemented based on the source retrieval and text alignment algorithms which developed for the international competition on plagiarism detection organized by CLEF. The text alignment algorism in HawkEyes gained the first place in PAN@CLEF2012. In the demonstration, we will present our system implemented on PAN@CLEF2014 training data corpus. 展开更多
关键词 plagiarism detection system SOURCE RETRIEVAL TEXT ALIGNMENT
下载PDF
Plagiarism Detection in Homework Based on Image Hashing
3
作者 Ying Chen Liping Gan +3 位作者 Shiqing Zhang Wenping Guo Yuelong Chuang and Xiaoming Zhao 《国际计算机前沿大会会议论文集》 2017年第2期100-102,共3页
The problem of high similarity in homework has troubled teachers with time. Previous plagiarism detection systems are mainly realized by string matching which has a limitation, i.e., image homework cannot be detected.... The problem of high similarity in homework has troubled teachers with time. Previous plagiarism detection systems are mainly realized by string matching which has a limitation, i.e., image homework cannot be detected. To this issue, we propose a new method of plagiarism detection in homework. First,we get fingerprint features of image homework by converting text homework into images. Then, we use image hashing algorithm and hamming distance to calculate the similarity of these features. Finally, we perform the empirical study on course of Computer Network Experiment, the test shows that our method not only reliably keeps the detection speedily, but also consistently ensures precision and false positive rate. 展开更多
关键词 plagiarism detection IMAGE fingerprinting IMAGE HASHING Hamming DISTANCE
下载PDF
Exploring Attentive Siamese LSTM for Low-Resource Text Plagiarism Detection
4
作者 Wei Bao Jian Dong +2 位作者 Yang Xu Yuanyuan Yang Xiaoke Qi 《Data Intelligence》 EI 2024年第2期488-503,共16页
Low-resource text plagiarism detection faces a significant challenge due to the limited availability of labeled data for training.This task requires the development of sophisticated algorithms capable of identifying s... Low-resource text plagiarism detection faces a significant challenge due to the limited availability of labeled data for training.This task requires the development of sophisticated algorithms capable of identifying similarities and differences in texts,particularly in the realm of semantic rewriting and translation-based plagiarism detection.In this paper,we present an enhanced attentive Siamese Long Short-Term Memory(LSTM)network designed for Tibetan-Chinese plagiarism detection.Our approach begins with the introduction of translation-based data augmentation,aimed at expanding the bilingual training dataset.Subsequently,we propose a pre-detection method leveraging abstract document vectors to enhance detection efficiency.Finally,we introduce an improved attentive Siamese LSTM network tailored for Tibetan-Chinese plagiarism detection.We conduct comprehensive experiments to showcase the effectiveness of our proposed plagiarism detection framework. 展开更多
关键词 Text plagiarism detection Low resource Siamese Long Short-Term Memory Tibetan-Chinese
原文传递
ChatGPT生成中文学术内容分析——以情报学领域为例 被引量:2
5
作者 郭鑫 王一博 王继民 《图书馆论坛》 北大核心 2024年第3期134-143,共10页
学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGP... 学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGPT生成视作一个二元分类任务,采用朴素贝叶斯、支持向量机、随机森林算法进行文本分类实验,并使用SHAP方法对文本结构特征的重要性进行分析。研究发现:ChatGPT在描述有具体时间节点的事实性信息和引用政策文件或研究报告等方面表现较弱,生成引言的篇幅较集中,撰写论文相较于人类更加“循规蹈矩”;查重工具通常无法准确检测出ChatGPT生成内容的原创性,但分类模型可以比较容易地区分出引言是否由ChatGPT生成,平均句子长度、词汇多样性和文本长度是影响分类结果最重要的文本结构特征。 展开更多
关键词 ChatGPT 论文写作 情报学 文本分类 查重检测
下载PDF
基于Simhash算法的题库查重系统的设计与实现
6
作者 熊良钰 邓伦丹 《科学技术创新》 2024年第9期91-94,共4页
Simhash算法是一种基于局部敏感哈希(LSH)的技术,以其快速的计算速度和高度的查重准确性而知名。该算法通过将文本特征转换为二进制码,进而通过计算这些二进制码之间的汉明距离来评估文本的相似度。在文本去重和重复文档检测等多个领域,... Simhash算法是一种基于局部敏感哈希(LSH)的技术,以其快速的计算速度和高度的查重准确性而知名。该算法通过将文本特征转换为二进制码,进而通过计算这些二进制码之间的汉明距离来评估文本的相似度。在文本去重和重复文档检测等多个领域,Simhash算法已经展现出了显著的效果。鉴于此,将Simhash算法应用于题库查重具有很高的可行性和实际应用价值。 展开更多
关键词 Simhash算法 汉明距离 题库查重系统 文本相似度计算 哈希函数
下载PDF
区块链下社交网络用户抄袭识别方案
7
作者 李莉 杨春艳 +1 位作者 朱江文 胡荣磊 《计算机应用》 CSCD 北大核心 2024年第1期242-251,共10页
针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为... 针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为文本相似度检测提供依据。在Merkle树和布隆过滤器结构的基础上,设计了新的索引结构BHMerkle,减少了区块构建和查询时的计算开销,实现了对交易的快速定位。同时提出多特征权重Simhash算法,提高了词权计算的准确性并提高签名值匹配阶段的效率,从而对具有抄袭行为的恶意用户进行识别,并通过奖惩机制遏制恶意行为的发生。抄袭识别方案在不同主题的新闻数据集上的平均准确率为94.8%,平均召回率为88.3%,相较于多维度Simhash算法和基于信息熵加权的Simhash(E-Simhash)算法,平均准确率分别提升了6.19、4.01个百分点,平均召回率分别提升了3.12、2.92个百分点。实验结果表明,所提方案在抄袭文本的查询及检测效率方面均有所提升,且在抄袭识别方面具有较高的准确性。 展开更多
关键词 区块链 抄袭识别 Simhash算法 相似度检测 社交网络
下载PDF
SQL-Detector:基于编码特征的SQL习题抄袭检测技术
8
作者 许嘉 莫晓琨 +2 位作者 于戈 吕品 韦婷婷 《计算机科学与探索》 CSCD 北大核心 2022年第9期2030-2040,共11页
结构化查询语言(SQL)是学好数据库技术的关键。然而,大量教学实践表明学生在做SQL习题时存在抄袭现象。现有针对SQL习题的抄袭检测方案或是简单将学生提交的SQL代码进行相似性匹配来发现抄袭问题,或是利用学生在SQL编码习惯上的简单差... 结构化查询语言(SQL)是学好数据库技术的关键。然而,大量教学实践表明学生在做SQL习题时存在抄袭现象。现有针对SQL习题的抄袭检测方案或是简单将学生提交的SQL代码进行相似性匹配来发现抄袭问题,或是利用学生在SQL编码习惯上的简单差异特征来发现抄袭的作业,均没能很好地利用学生书写SQL代码时所展现出的丰富编码特征来实现高精确度的抄袭检测。鉴于此,提出了基于编码特征的SQL习题抄袭检测技术,命名为SQL-Detector。首先,从SQL特性出发提出了面向特定SQL习题的学生习题编码特征和面向编码习惯的学生泛化编码特征,从而实现对学生的画像。其次,通过对学生的习题编码特征进行聚类分析识别出抄袭群体。最后,通过比较学生的习题泛化编码特征与其历史泛化编码特征之间的一致性来判定抄袭者与被抄袭者。利用真实课堂实践收集到的SQL习题答题数据进行实验评估,结果表明SQL-Detector技术对于SQL习题的抄袭检测精确度比相关最好的技术平均提高了14.0%。 展开更多
关键词 SQL习题 抄袭检测 编码习惯 编码特征 层次聚类
下载PDF
基于预训练Transformer语言模型的源代码剽窃检测研
9
作者 钱亮宏 王福德 孙晓海 《吉林大学学报(信息科学版)》 CAS 2024年第4期747-753,共7页
为解决源代码剽窃检测的问题,以及针对现有方法需要大量训练数据且受限于特定语言的不足,提出了一种基于预训练Transformer语言模型的源代码剽窃检测方法,其结合了词嵌入,相似度计算和分类模型。该方法支持多种编程语言,不需要任何标记... 为解决源代码剽窃检测的问题,以及针对现有方法需要大量训练数据且受限于特定语言的不足,提出了一种基于预训练Transformer语言模型的源代码剽窃检测方法,其结合了词嵌入,相似度计算和分类模型。该方法支持多种编程语言,不需要任何标记为剽窃的训练样本,即可达到较好的检测性能。实验结果表明,该方法在多个公开数据集上取得了先进的检测效果,F1值接近。同时,对特定的能获取到较少标记为剽窃训练样本的场景,还提出了一种结合有监督学习分类模型的方法,进一步提升了检测效果。该方法能广泛应用于缺乏训练数据、计算资源有限以及语言多样的源代码剽窃检测场景。 展开更多
关键词 源代码剽窃检测 TRANSFORMER 模型 预训练模型 机器学习 深度学习
下载PDF
计算机专业考核材料抄袭检测系统设计
10
作者 朱良梅 《计算机应用文摘》 2024年第9期63-66,共4页
计算机专业考查类课程的考核材料中普遍存在抄袭现象,严重影响了对教学效果的评估和对学生能力的培养。传统的手工甄别方式费时费力,因此文章设计了一款抄袭检测系统,可以一站式实现对实验报告和代码的抄袭检测,从而提高作业查重效率,... 计算机专业考查类课程的考核材料中普遍存在抄袭现象,严重影响了对教学效果的评估和对学生能力的培养。传统的手工甄别方式费时费力,因此文章设计了一款抄袭检测系统,可以一站式实现对实验报告和代码的抄袭检测,从而提高作业查重效率,辅助教师教学,打击作业抄袭的不良风气。 展开更多
关键词 计算机专业 考核资料 抄袭检测
下载PDF
图片作业的抄袭检测方法研究与对应实现
11
作者 胡易 王琛云 《信息与电脑》 2024年第7期10-12,共3页
随着电子化作业逐渐替代传统的纸质作业,传媒艺术类学科中提交的图片创作类作业也日益增多。针对这些作业中常见的抄袭手段,本文深入剖析并提出了一系列针对性的检测方法,在实际教学环境中进行了应用测试。最终,形成一套实践操作的检测... 随着电子化作业逐渐替代传统的纸质作业,传媒艺术类学科中提交的图片创作类作业也日益增多。针对这些作业中常见的抄袭手段,本文深入剖析并提出了一系列针对性的检测方法,在实际教学环境中进行了应用测试。最终,形成一套实践操作的检测流程,利用计算机技术实现了对图片类作业的快速查重。这套系统能够辅助教师高效地识别相似度较高的作业,从而提升教学质量和管理效率。 展开更多
关键词 图片查重 哈希算法 深度学习
下载PDF
Idea plagiarism detection with recurrent neural networks and vector space model 被引量:1
12
作者 Azra Nazir Roohie Naaz Mir Shaima Qureshi 《International Journal of Intelligent Computing and Cybernetics》 EI 2021年第3期321-332,共12页
Purpose-Natural languages have a fundamental quality of suppleness that makes it possible to present a single idea in plenty of different ways.This feature is often exploited in the academic world,leading to the theft... Purpose-Natural languages have a fundamental quality of suppleness that makes it possible to present a single idea in plenty of different ways.This feature is often exploited in the academic world,leading to the theft of work referred to as plagiarism.Many approaches have been put forward to detect such cases based on various text features and grammatical structures of languages.However,there is a huge scope of improvement for detecting intelligent plagiarism.Design/methodology/approach-To realize this,the paper introduces a hybrid model to detect intelligent plagiarism by breaking the entire process into three stages:(1)clustering,(2)vector formulation in each cluster based on semantic roles,normalization and similarity index calculation and(3)Summary generation using encoder-decoder.An effective weighing scheme has been introduced to select terms used to build vectors based on K-means,which is calculated on the synonym set for the said term.If the value calculated in the last stage lies above a predefined threshold,only then the next semantic argument is analyzed.When the similarity score for two documents is beyond the threshold,a short summary for plagiarized documents is created.Findings-Experimental results show that this method is able to detect connotation and concealment used in idea plagiarism besides detecting literal plagiarism.Originality/value-The proposed model can help academics stay updated by providing summaries of relevant articles.It would eliminate the practice of plagiarism infesting the academic community at an unprecedented pace.The model will also accelerate the process of reviewing academic documents,aiding in the speedy publishing of research articles. 展开更多
关键词 Natural language processing Vector space model Recurrent neural networks plagiarism detection
原文传递
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具
13
作者 李国繁 张峰 刘聪 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有... 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%. 展开更多
关键词 代码抄袭检测 跨语言 抽象语法树 伪孪生网络
下载PDF
Research on MLChecker Plagiarism Detection System
14
作者 Haihao Yu Chengzhe Huang +3 位作者 Leilei Kong Xu Sun Haoliang Qi Zhongyuan Han 《国际计算机前沿大会会议论文集》 2020年第2期176-181,共6页
Plagiarism detection system plays an essential role in education quality improvement by helping teachers to detect plagiarism.Using a number of measures customized to determine occurrences of plagiarism is the most co... Plagiarism detection system plays an essential role in education quality improvement by helping teachers to detect plagiarism.Using a number of measures customized to determine occurrences of plagiarism is the most common approach for plagiarism detection tool.It is simple and effective,while it lacks flexibility when applied in more complicated situations.This paper proposes the MLChecker,a smart plagiarism detection system,to provide more flexible detection tactics.An automatic plagiarism dataset construction method was exploited in MLChecker to dynamically update the plagiarism detection algorithms according to different detection tasks.And the full-process quality management functions were also provided by MLChecker.The result shows that the detection accuracy is raised by 56%.Compared with traditional plagiarism detection tools,MLChecker is with higher accuracy and efficiency. 展开更多
关键词 plagiarism plagiarism detection system plagiarism dataset MLChecker
原文传递
操作系统课程实验平台设计与实践
15
作者 苏铅坤 颜庆茁 郭晓曦 《福建电脑》 2023年第5期77-82,共6页
操作系统是计算机相关专业最重要课程之一。实验课是操作系统教学的重要环节。针对现有实验平台不友好、学生实验课普遍不专心、代码抄袭严重、实验结果反馈不及时等问题,本文提出构建一个友好的本地服务器作为操作系统实验平台,并通过... 操作系统是计算机相关专业最重要课程之一。实验课是操作系统教学的重要环节。针对现有实验平台不友好、学生实验课普遍不专心、代码抄袭严重、实验结果反馈不及时等问题,本文提出构建一个友好的本地服务器作为操作系统实验平台,并通过统计学生服务器在线时长进行更有效的出勤考核,通过记录学生文件的变化来甄别抄袭行为,使用程序辅助评分及时给学生反馈。实践表明,综合使用这些方法可以很好地敦促学生认真完成实验,进而提升教学效果。 展开更多
关键词 操作系统 实验平台 有效出勤 抄袭检测
下载PDF
自然语言文档复制检测研究综述 被引量:69
16
作者 鲍军鹏 沈钧毅 +1 位作者 刘晓东 宋擒豹 《软件学报》 EI CSCD 北大核心 2003年第10期1753-1760,共8页
复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了... 复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了目前已知各种文本复制检测系统的检测方法和技术特点,并比较了各系统关键技术的异同,最后指出了文本复制检测技术的发展思路. 展开更多
关键词 复制检测 剽窃 知识产权保护 信息检索
下载PDF
基于编译优化和反汇编的程序相似性检测方法 被引量:28
17
作者 赵长海 晏海华 金茂忠 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2008年第6期711-715,共5页
提出了基于编译优化和反汇编的程序相似性检测方法,能够检测出标识符重命名、增加冗余语句、等价的控制结构替换等12种学生常用的抄袭手段.基于该方法,设计和实现了一个程序相似性检测系统BuaaSim,采用编译优化和反汇编技术将源程序转... 提出了基于编译优化和反汇编的程序相似性检测方法,能够检测出标识符重命名、增加冗余语句、等价的控制结构替换等12种学生常用的抄袭手段.基于该方法,设计和实现了一个程序相似性检测系统BuaaSim,采用编译优化和反汇编技术将源程序转化为汇编指令集合,删除和替换汇编指令中对程序本质特征影响不大的易变元素,使用一个与指令顺序无关的决策函数计算程序相似度;还给出一个简单有效的聚类算法,从程序集合中聚类出相似的程序子集.通过与著名的JPlag系统针对两份典型的抄袭样本集进行评测对比,表明本文方法的检测效果具有明显的优势. 展开更多
关键词 抄袭 程序相似性 相似性检测 编译优化
下载PDF
基于局部词频指纹的论文抄袭检测算法 被引量:10
18
作者 秦玉平 冷强奎 +1 位作者 王秀坤 王春立 《计算机工程》 CAS CSCD 北大核心 2011年第6期193-194,197,共3页
提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程... 提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程度上克服了现有论文抄袭检测算法检测精度低的缺点,具有较快的检测速度。 展开更多
关键词 抄袭检测 数字指纹 局部词频 相似度
下载PDF
基于篇章结构相似度的复制检测算法 被引量:28
19
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期125-130,共6页
学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题... 学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题的数学模型.在分析论文篇章结构的基础上,利用数字指纹和词频统计等技术,经编程实现,用于论文的全抄、部分抄袭和拼抄等抄袭现象的初步检测.与基于全文数字指纹和基于全文词频统计的检测方法相比较,更适用于要求较准确的论文复制检测. 展开更多
关键词 学术论文 复制检测 抄袭识别 数字指纹 词频统计 篇章结构
下载PDF
基于XML的C代码抄袭检测算法 被引量:15
20
作者 钟美 张丽萍 刘东升 《计算机工程与应用》 CSCD 北大核心 2011年第8期215-218,235,共5页
主要研究一种基于XML文本的C代码抄袭检测算法。将C程序源代码转化为XML文本,提取XML文本各行标记的属性,计算XML文本行的相似值,得到程序对的相似度。并对抄袭检测算法实行分类测试:按十二种抄袭手段分类;按复杂语义和复杂数据结构分... 主要研究一种基于XML文本的C代码抄袭检测算法。将C程序源代码转化为XML文本,提取XML文本各行标记的属性,计算XML文本行的相似值,得到程序对的相似度。并对抄袭检测算法实行分类测试:按十二种抄袭手段分类;按复杂语义和复杂数据结构分类。测试结果对比验证了抄袭检测算法的有效性。 展开更多
关键词 XML文本 C代码 相似度 抄袭检测算法
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部