代码克隆检测方法研究进展

Research Progress of Code Clone Detection

下载PDF

导出

摘要代码克隆检测问题是软件工程领域一个基础的研究课题,在代码片段推荐、软件项目维护等应用领域发挥着重要的作用。随着在线代码库中代码规模的快速增长,以及信息检索、机器学习领域的快速发展,代码克隆检测的研究也取得新的进展。介绍代码克隆检测的基本概念与主流方法,重点介绍近几年基于信息检索、机器学习的代码克隆检测的主要方法,对基于token的融合信息检索与深度学习的方法进行实验。 In software engineering, code clone detection has been a basic research topic, which can be applied to several applications, e.g. code snippets recommending and software project maintenance. In recent years, with the blossom of online code repositories, and the rapid development of information retrieval and machine learning, the research of code clone detection has also been benefited from that. Introduces the basic definitions and main approaches, and focuses on the approaches published in recent years. Conducts experiments on token-based method.

作者王婷牟永敏张志华 WANG Ting;MU Yong-min;ZHANG Zhi-hua(School of Computer, Beijing Information Science and Fechnology University, Beijing 100101)

机构地区北京信息科技大学计算机学院

出处《现代计算机》 2019年第13期32-38,共7页 Modern Computer

基金北京市自然科学基金(重点研究专题项目)(No.Z160002) 网络文化与数字传播北京市重点实验室开放课题(No.ICDD2017XX)

关键词代码克隆检测软件工程机器学习信息检索 Code Clone Detection Software Engineering Information Retrieval Machine Learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP311.5 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1田振洲,刘烃,郑庆华,佟菲菲,吴定豪,朱森存,陈恺.软件抄袭检测研究综述[J].信息安全学报,2016,1(3):52-76. 被引量：12
2熊浩,晏海华,郭涛,黄永刚,郝永乐,李舟军.代码相似性检测技术:研究综述[J].计算机科学,2010,37(8):9-14. 被引量：23

二级参考文献73

1曹羽中,金茂忠,刘超.克隆代码检测技术综述[J].计算机工程与科学,2006,28(z2):9-13. 被引量：6
2Bilenko M,Mooney R J.Adaptive duplicate detection using learnable string similarity measure[C] ∥Proceeding of ninth ACM SIGKDD international conference on Knowledge disco-very and data mining.2003:39-48,.
3Baker B S.On finding duplication and near duplication in large software systems[C] ∥Proceedings of 2nd Working Conference on Reverse Engineering.1995:86-95.
4Mayrand J,Leblanc C,Merlo E M.Automatic detection of function clones in a software system using metrics[C] ∥Proceeding of International Conference on Software Maintenance (ICSM).1996.
5Rieger M.Effective clone detection without language barriers[D].Bern University,Switzerland,2005.
6Georgina C,Mike J.Source-code plagiarism:A UK academic perspective[R].RR-422.Department of computer Science,University of Warwick,2006.
7Sheard J,Dick M,Markham S,et al.Cheating and plagiarism:perceptions and practices of first year it students[C] ∥Procee-dings of the 7th Annual SIGCSE Conference on Innovation and Technology in Computer Science Education.2002:183-187.
8McCabe D.Levels of Cheating and Plagiarism Remain High[OL].Center for Academic Integrity.Duke University,2005.http://academicintegrity.org.
9Halstead,Howard M.Elements of Software Science[Z].Elsevier,1977.
10Ottenstein K J.An Algorithmic Approach to the Detection and Prevention of Plagiarism[J].SIGCSE Bulletin,1977,8(4):30-41.

共引文献32

1张丽萍,刘东升,李彦臣,钟美.一种基于AST的代码抄袭检测方法[J].计算机应用研究,2011,28(12):4616-4620. 被引量：8
2吴世忠,郭涛,董国伟,王嘉捷.软件漏洞分析技术进展[J].清华大学学报（自然科学版）,2012,52(10):1309-1319. 被引量：28
3冯君远,赖明钦,李启良.C语言源代码抄袭识别的研究[J].福建电脑,2013,29(5):34-36. 被引量：2
4石野,黄龙和,车天阳,高斯,王健.基于语法树的程序相似度判定方法[J].吉林大学学报（信息科学版）,2014,32(1):95-100. 被引量：7
5许能闯,袁健,高喜龙.含代码的IT社区答案质量评价模型[J].小型微型计算机系统,2019,40(1):158-163. 被引量：1
6张亚芹,杨鹤标.基于Zhang-Shasha算法的存储过程相似性匹配[J].计算机应用研究,2014,31(9):2692-2695. 被引量：1
7朱波,郑虹,孙琳琳,杨友星.基于AST的程序代码相似性度量研究[J].吉林大学学报（信息科学版）,2015,33(1):99-104. 被引量：6
8董启海,王亚刚.基于划分的二进制文件相似性比较方法[J].计算机应用,2015,35(10):2896-2900. 被引量：1
9刘军娜,邢琪,赵卫东.程序相似度检测算法[J].计算机与数字工程,2015,43(12):2145-2149. 被引量：2
10李冬艳,方若晨,许凯,唐菱,吴国玺.基于相似度匹配的反抄袭算法的研究[J].华北科技学院学报,2016,13(5):60-64. 被引量：1

1沈雷,左芸,解群,李翔.国产化平台自主可控测试工具研究设计[J].数字技术与应用,2019,37(2):154-158. 被引量：3
2陈秋远,李善平,鄢萌,夏鑫.代码克隆检测研究进展[J].软件学报,2019,30(4):962-980. 被引量：19
3杜伟安.建筑工程质量检测问题探析[J].安徽建筑,2019,26(5):140-141. 被引量：4
4穆婉,程学芳,张雪,柳莹,刘皋林,吕迁洲,张吉刚,李晓宇.扁柏双黄酮对肝细胞癌HepG2细胞增殖和凋亡的影响[J].中南药学,2019,17(3):399-404. 被引量：4
5李妍.化工原料质量检验检测问题分析[J].化工管理,2019(13):40-41. 被引量：3
6胡少聪.基于深度学习的人脸识别方法研究[J].电子科技,2019,32(6):82-86. 被引量：13
7刘志伟,邢永旭,于澔,李涛,张晓东.企业级海量代码的检索与管理技术[J].软件学报,2019,30(5):1498-1509. 被引量：4
8余红星,申国伟,郭春.一种基于自动特征工程与压缩感知的网络隧道检测方法[J].计算机与现代化,2019,0(6):1-8.
9陈广,杨震.基于卷积特征的光纤缺陷检测方法[J].中国惯性技术学报,2019,27(1):95-100. 被引量：5
10王国庆,丁昊,刘宁波,李雪腾.海杂波谱的机理及时变特性分析[J].海军航空工程学院学报,2019,34(2):181-186.

现代计算机

2019年第13期

浏览历史

内容加载中请稍等...

代码克隆检测方法研究进展

参考文献2

二级参考文献73

共引文献32

相关作者

相关机构

相关主题

浏览历史