-
题名基于后缀数组的克隆检测
被引量:7
- 1
-
-
作者
史庆庆
张丽萍
尹丽丽
刘东升
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2013年第9期123-127,共5页
-
基金
内蒙古自然科学基金资助项目(2011MS0906)
-
文摘
程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD,用其检测29款C语言开源软件。实验结果表明,SaCD能快速有效地检测软件中的Type-1和Type-2语句克隆,其检测速度比传统的克隆检测工具CCFinderx快了近20倍。
-
关键词
克隆代码
克隆检测
token串
后缀数组
重复子串
DC3算法
-
Keywords
clone code
clone detection
token string
suffix array
repeated substring
DC3 algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于后缀数组检测函数克隆
被引量:3
- 2
-
-
作者
侯敏
张丽萍
史庆庆
刘东升
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第4期1082-1085,共4页
-
基金
内蒙古自然科学基金资助项目(2011MS0906)
国家自然科学基金资助项目(61363017)
-
文摘
为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以实现该方法,并检测了24款C语言的开源软件。实验结果的分析验证了FCD能高效检测软件中的函数克隆。
-
关键词
函数克隆
克隆检测
token串
后缀数组
公共函数前缀
-
Keywords
function clone
clone detection
token string
suffix array
public function prefix
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于串匹配方法的源代码复制检测技术研究
被引量:9
- 3
-
-
作者
邓爱萍
徐国梁
肖奔
-
机构
湖南大学计算机与通信学院
湖南人文科技学院计算机科学系
-
出处
《科学技术与工程》
2007年第10期2251-2254,共4页
-
基金
湖南省重点建设学科资助
-
文摘
无论在商业软件还是在学生程序设计作业中,程序代码的抄袭都是一种普遍存在的现象。对程序代码进行复制检测是一个复杂的计算过程。探讨了源代码复制检测技术的现状,提出了对学生程序设计作业进行源代码复制检测的一种实现方案。
-
关键词
源代码
复制检测
标记串
相似度
-
Keywords
source code copy detection token string similarity
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名程序代码转换技术的研究与实现
被引量:1
- 4
-
-
作者
裴冬梅
聂建忠
赵凤荣
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《内蒙古煤炭经济》
2010年第6期118-119,共2页
-
文摘
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,MOSS,YAP等等,但是这些系统中对如何把程序代码进行转换成串的,并没有详细的介绍。本文针对这种情况设计了一个实验系统来实现程序代码转换技术,并进行了验证。
-
关键词
程序代码转换技术
程序代码抄袭检测技术
词表
字符串匹配算法
-
Keywords
Program code token technique
Program detecting technique
vocable table
Character string arithmetic
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于XML的标记串提取算法
- 5
-
-
作者
钟美
-
机构
成都东软学院
-
出处
《现代计算机(中旬刊)》
2016年第8期46-49,共4页
-
文摘
研究一种基于XML的标记串提取算法。从C语言全集中挑选出部分能代表程序结构的关键结构,总结出常见抄袭方式;根据不同的关键结构设计不同的标记串提取算法,将关键结构的结构信息存储于XML文本中;对此算法进行相关测试,测试结果验证算法的有效性。
-
关键词
XML
C程序
标记串提取算法
-
Keywords
XML
C Program
Extraction Algorithm for token string
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Java的字符串分解器的研究与实现
- 6
-
-
作者
程艳芬
-
机构
武汉理工大学
-
出处
《交通与计算机》
2006年第3期120-122,126,共4页
-
文摘
论述了字符串分解器的原理,指出Java中字符串分解器的优缺点,给出了如何轻松地编写一个强大的字符串分解器的开发方案。根据该方案,能够迅速编写复杂的字符串分解器,节省大量的开发时间。
-
关键词
字符分解器
标记
类
-
Keywords
string tokenizer
token
class
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-