-
题名基于后缀数组的克隆检测
被引量:7
- 1
-
-
作者
史庆庆
张丽萍
尹丽丽
刘东升
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2013年第9期123-127,共5页
-
基金
内蒙古自然科学基金资助项目(2011MS0906)
-
文摘
程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD,用其检测29款C语言开源软件。实验结果表明,SaCD能快速有效地检测软件中的Type-1和Type-2语句克隆,其检测速度比传统的克隆检测工具CCFinderx快了近20倍。
-
关键词
克隆代码
克隆检测
token串
后缀数组
重复子串
DC3算法
-
Keywords
clone code
clone detection
token string
suffix array
repeated substring
DC3 algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于后缀数组检测函数克隆
被引量:3
- 2
-
-
作者
侯敏
张丽萍
史庆庆
刘东升
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第4期1082-1085,共4页
-
基金
内蒙古自然科学基金资助项目(2011MS0906)
国家自然科学基金资助项目(61363017)
-
文摘
为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以实现该方法,并检测了24款C语言的开源软件。实验结果的分析验证了FCD能高效检测软件中的函数克隆。
-
关键词
函数克隆
克隆检测
token串
后缀数组
公共函数前缀
-
Keywords
function clone
clone detection
token string
suffix array
public function prefix
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-