期刊文献+

基于AST的多语言代码抄袭检测方法研究 被引量:3

AST-Based Multi-Language Plagiarism Detection Method
下载PDF
导出
摘要 为了检测程序设计类课程中出现的作业抄袭行为,提出一种基于抽象语法树的抄袭检测方法.该方法根据多种语言的文法文件,用语法分析工具生成对应的抽象语法树(AST),利用计算生物学中序列匹配算法进行程序相似度计算,提取程序相似部分的AST特征,生成空间向量,通过聚类分析找出"抄袭团伙".实验结果表明,该方法对抄袭行为具有较好的检测效果,能准确地找出"抄袭团伙". To detect plagiarism on programming course,AST-based plagiarism detection method is proposed.First,parsing the code generated the corresponding Abstract Syntax Tree(AST).Biology sequence matching algorithms are used to calculate the similarity of the program.Find the similar part of the code,and then extract the AST feature in this part.Generated vector space model,and then find "copycluster" by clustered the feature.Experiments show that this method has a good effect on the detection of plagiarism and can find the "copy cluster" accurate.
出处 《内蒙古师范大学学报(自然科学汉文版)》 CAS 北大核心 2012年第4期385-392,共8页 Journal of Inner Mongolia Normal University(Natural Science Edition)
基金 国家自然科学基金资助项目(60940027) 内蒙古自然科学基金资助项目(2010MS0906)
关键词 抄袭检测 抽象语法树 序列匹配 聚类分析 plagiarism detection AST sequence alignment cluster analysis
  • 相关文献

参考文献14

二级参考文献102

  • 1程金宏,刘东升.程序代码相似度自动度量技术研究综述[J].内蒙古师范大学学报(自然科学汉文版),2006,35(4):457-461. 被引量:13
  • 2邓爱萍,徐国梁,肖奔.基于串匹配方法的源代码复制检测技术研究[J].科学技术与工程,2007,7(10):2251-2254. 被引量:9
  • 3吕宝忠 钟扬 高莉萍.分子进化与系统发育[M].北京:高等教育出版社,2002.202-206.
  • 4Smith T F,Wateman M S,Fitch W M.Comparative biosequence metrics[J].J Mol Evol, 1981,18 : 38-46.
  • 5Davie B,Charny A,Bennet J,et al.An expedited forwarding PHB[C/OL].IETF Internet Draft.[2000-03].http://www.ietforg/internet-drafts/draft-ietf-diff-serv-rfc2598his-02.txt.
  • 6Mount D W.Bioinformatics : Sequence and genome analysis[M].USA: Cold Spring Harbor Laboratory Press,2002:53-54.
  • 7Nwwdleman S B ,Wunsch C D.A general method applicable to the search for similarities in the amino acid sequence of two proteins[J]. J Mol Biol, 1970,48:443-453.
  • 8Smith T,Wateman M.Identification of common molecular sequence[J]. Journal of Molecular Biology, 1981,147:195-197.
  • 9Ahschul S F,Madden T L,Schaffer A A,et al.Capped BLAST and PSI-BLAST:A new generation of protein database search programs[J]. Nucleic Acids Res,1997,25:3389-3402.
  • 10Matthias R. Effective clone detection without language barriers [ D]. Switzerland: Institut fur lnformatik und angewandte Mathematik ,Bern University ,2005.

共引文献60

同被引文献13

引证文献3

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部