-
题名程序代码相似度检测技术的研究与实现
- 1
-
-
作者
卫军超
耿楠
-
机构
西北农林科技大学信息工程学院
-
出处
《电脑知识与技术(过刊)》
2017年第2X期39-40,共2页
-
基金
西安交通工程学院校级教改项目(编号:150006B)
-
文摘
针对传统相似度算法应用在程序设计课程作业检测中精度较低这一问题,通过研究最长公共子序列等算法,发现其优缺点,在分析的基础上,结合结构度量技术和属性技术两种技术,提出一种性能较好的程序相似度计算方法。方法首先对源程序进行初步处理,将程序中的注释语句和空格删除,再次确定常用元素及常用结构,然后利用Lex统计、抽取程序元素;利用开源代码ucc生成语法树,之后抽取相应的语法结构;最后生成特征向量,并计算代码相似度。实验结果表明该方法比最长公共子序列算法精度提高了10.6%。
-
关键词
属性计数法
结构度量技术
相似度度量
-
Keywords
attribute counting
structure measurement
similarity measurement
-
分类号
TP311.1-4
[自动化与计算机技术—计算机软件与理论]
G642
[文化科学—高等教育学]
-
-
题名程序代码相似度检测技术的研究与实现
- 2
-
-
作者
卫军超
耿楠
-
机构
西北农林科技大学信息工程学院
-
出处
《信息与电脑》
2017年第3期99-101,107,共4页
-
基金
西安交通工程学院校级教改项目(项目编号:150006B)
-
文摘
针对传统相似度算法应用在程序设计课程作业检测中精度较低这一问题,通过研究最长公共子序列等算法,发现其优缺点,并提出了一种属性计数和结构度量技术相结合的程序相似度计算方法。该方法首先对源程序进行初步处理,将程序中的注释语句和空格删除,再确定常用元素及常用结构,然后利用Lex统计、抽取程序元素;利用开源代码ucc生成语法树,之后抽取相应的语法结构;最后生成特征向量,并计算代码相似度。实验结果表明该方法比最长公共子序列算法精度提高了10.6%。
-
关键词
属性计数法
结构度量技术
相似度度量
-
Keywords
attribute counting method
structure measurement technique
similarity measure
-
分类号
TP311.11
[自动化与计算机技术—计算机软件与理论]
-