期刊文献+

基于AST的程序代码抄袭检测方法研究

下载PDF
导出
摘要 为了打击程序设计类课程学生抄袭作业的不良学风,提出了基于抽象语法树(AST)的程序代码抄袭检测方法。首先通过语法分析生成程序的AST,然后遍历AST,通过节点过滤、等价控制结构转换、赋予节点语义信息等手段,构造程序的特征序列;统计特征序列的节点频度,生成特征向量,通过向量聚类划分“抄袭团伙”,在“抄袭团伙”内比对特征序列计算程序相似度。实验结果表明,该方法能有效检测多种抄袭行为,尤其是对等价控制结构替换的抄袭行为,检测效果明显优于JPlag系统。
出处 《电脑知识与技术》 2023年第16期61-64,共4页 Computer Knowledge and Technology
基金 广州工商学院2022年校级科研项目(项目编号:KYYB202235)。
  • 相关文献

参考文献3

二级参考文献20

  • 1刘涛,吴功宜,陈正.一种高效的用于文本聚类的无监督特征选择算法[J].计算机研究与发展,2005,42(3):381-386. 被引量:37
  • 2彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量:44
  • 3BEZDEK J C. Pattern recognition with fuzzy objective function algorithms [ M]. New York: Plenum Press, 1981.
  • 4HAND D, MANNILA H, SMYTH P. Principles of data mining [ M]. Cambridge: MIT Press, 2001.
  • 5TAN PANG-NING, STEINBACH M, KUMAR V. Introduction to data mining [M]. Boston, MA: Addison-Wesley, 2006.
  • 6CHEN DUO, LI XUE. An adaptive cluster validity index for the fuzzy C-means [ J]. International Journal of Computer Science and Network Security, 2007, 7(2) : 146 - 156.
  • 7KAUFMAN L, ROUSSEEUW P J. Finding groups in data: an introduction to cluster analysis [ M]. New York: John Wiley & Sons, 1990.
  • 8UCI Machine Leaming Repository [ EB/OL]. [ 2010 -02 -25]. http://www, isc. uci. edu/- mlearrc/MLRepository, html.
  • 9Prechelt L, Malpohl G, Philippsen M. Finding plagiarisms among a set of programs with JPlag [ J]. Journal of Universal Computer Science,2002,8( 11 ) :1016 - 1038
  • 10Emetic K, Moritz K. JPlag: a system that finds similarities among multiple sets of source code files [ EB/OL ]. 2005 [ 2008-04-05 ]. http ://www. ipd. uni-karlsruhe, de/jplag/

共引文献146

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部