基于Zhang-Shasha算法的存储过程相似性匹配被引量：1

Study on similarity matching of store procedure based on Zhang-Shasha algorithm

下载PDF

导出

摘要 Zhang-Shasha算法在度量有序树的距离以及相似度应用中具有独特的优势。针对学习者存储过程作业自动评估的问题,提出了一种基于Zhang-Shasha算法的存储过程相似性匹配的解决方法,关键在于如何把存储过程块转换成算法要求的有序树形式。采用词法分析和语法分析把存储过程转换成语法树,再转换成有序二叉树。通过分析转换所得的二叉树属于RB型树,Zhang-Shasha-R算法在计算此类型树的距离和相似度时具有较高的效率。分析实验结果,该方法的准确率较高,且随着实验中题量的增加,评估的准确率逐步提高。 Zhang-Shasha algorithm has a unique advantage in editing distance between ordered trees and similarity measure- ment. Aiming at the problem of automatic assessment of the learners＇ stored procedure assignments, the paper put forward a solution for similarity matching of stored procedure block based on Zhang-Shasha algorithm. It was the key that how to convert the stored procedure block to the form of ordered tree required by the algorithm. Through lexical analysis and syntax analysis it transformed the stored procedure block into the abstract syntax tree, and then further convert to an ordered binary tree. Ac- cording to the analysis, the resulting binary tree belonged to right branch tree. Zhang-Shasha-R algorithm has higher efficiency in calculating the distance and similarity of this kind of tree. The experimental results show that this method has a high accura- cy rate, and with the increasing number of exercises in the experiment, the accuracy of the assessment increases gradually.

作者张亚芹杨鹤标

机构地区江苏大学计算机科学与通信工程学院

出处《计算机应用研究》 CSCD 北大核心 2014年第9期2692-2695,共4页 Application Research of Computers

关键词 Zhang—Shasha算法存储过程相似性匹配 Zhang-Shasha algorithm stored procedure similarity matching

分类号 TP311.5 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1熊浩,晏海华,郭涛,黄永刚,郝永乐,李舟军.代码相似性检测技术:研究综述[J].计算机科学,2010,37(8):9-14. 被引量：23

二级参考文献69

1曹羽中,金茂忠,刘超.克隆代码检测技术综述[J].计算机工程与科学,2006,28(z2):9-13. 被引量：6
2Bilenko M,Mooney R J.Adaptive duplicate detection using learnable string similarity measure[C] ∥Proceeding of ninth ACM SIGKDD international conference on Knowledge disco-very and data mining.2003:39-48,.
3Baker B S.On finding duplication and near duplication in large software systems[C] ∥Proceedings of 2nd Working Conference on Reverse Engineering.1995:86-95.
4Mayrand J,Leblanc C,Merlo E M.Automatic detection of function clones in a software system using metrics[C] ∥Proceeding of International Conference on Software Maintenance (ICSM).1996.
5Rieger M.Effective clone detection without language barriers[D].Bern University,Switzerland,2005.
6Georgina C,Mike J.Source-code plagiarism:A UK academic perspective[R].RR-422.Department of computer Science,University of Warwick,2006.
7Sheard J,Dick M,Markham S,et al.Cheating and plagiarism:perceptions and practices of first year it students[C] ∥Procee-dings of the 7th Annual SIGCSE Conference on Innovation and Technology in Computer Science Education.2002:183-187.
8McCabe D.Levels of Cheating and Plagiarism Remain High[OL].Center for Academic Integrity.Duke University,2005.http://academicintegrity.org.
9Halstead,Howard M.Elements of Software Science[Z].Elsevier,1977.
10Ottenstein K J.An Algorithmic Approach to the Detection and Prevention of Plagiarism[J].SIGCSE Bulletin,1977,8(4):30-41.

共引文献22

1张丽萍,刘东升,李彦臣,钟美.一种基于AST的代码抄袭检测方法[J].计算机应用研究,2011,28(12):4616-4620. 被引量：8
2吴世忠,郭涛,董国伟,王嘉捷.软件漏洞分析技术进展[J].清华大学学报（自然科学版）,2012,52(10):1309-1319. 被引量：28
3冯君远,赖明钦,李启良.C语言源代码抄袭识别的研究[J].福建电脑,2013,29(5):34-36. 被引量：2
4石野,黄龙和,车天阳,高斯,王健.基于语法树的程序相似度判定方法[J].吉林大学学报（信息科学版）,2014,32(1):95-100. 被引量：7
5许能闯,袁健,高喜龙.含代码的IT社区答案质量评价模型[J].小型微型计算机系统,2019,40(1):158-163. 被引量：1
6朱波,郑虹,孙琳琳,杨友星.基于AST的程序代码相似性度量研究[J].吉林大学学报（信息科学版）,2015,33(1):99-104. 被引量：6
7董启海,王亚刚.基于划分的二进制文件相似性比较方法[J].计算机应用,2015,35(10):2896-2900. 被引量：1
8刘军娜,邢琪,赵卫东.程序相似度检测算法[J].计算机与数字工程,2015,43(12):2145-2149. 被引量：2
9李冬艳,方若晨,许凯,唐菱,吴国玺.基于相似度匹配的反抄袭算法的研究[J].华北科技学院学报,2016,13(5):60-64. 被引量：1
10王卉.一种C程序代码相似度检测方法[J].福建电脑,2018,34(6):111-112. 被引量：1

同被引文献12

1乔朝飞,赵仁亮,陈军,陈云浩.基于Voronoi内邻近的等高线树生成法[J].武汉大学学报（信息科学版）,2005,30(9):801-804. 被引量：11
2陈军,周晓光.基于拓扑联动的增量更新方法研究——以地籍数据库为例[J].测绘学报,2008,37(3):322-329. 被引量：48
3邢汉发,周晓光,许礼林.基于线/线拓扑关系的局部变化等高线融合[J].武汉大学学报（信息科学版）,2010,35(11):1322-1326. 被引量：5
4宋敦江,岳天祥,杜正平.等高线树构建及高保真DEM构建[J].中国图象图形学报,2011,16(7):1255-1261. 被引量：5
5刘涛,杜清运,闫浩文.空间点群目标相似度计算[J].武汉大学学报（信息科学版）,2011,36(10):1149-1153. 被引量：22
6张尧,樊红,黄旺.基于Delaunay三角网的等高线树生成方法[J].测绘学报,2012,41(3):461-467. 被引量：21
7刘涛,杜清运,毛海辰.空间线群目标相似度计算模型研究[J].武汉大学学报（信息科学版）,2012,37(8):992-995. 被引量：29
8安晓亚,杨云,刘平芝.基于拓扑谓词的空间拓扑关系相似性度量模型与应用[J].地球信息科学学报,2013,15(2):159-165. 被引量：15
9郑宇志,张青年.基于拓扑及空间相似性的面实体匹配方法研究[J].测绘科学技术学报,2013,30(5):510-514. 被引量：17
10李国辉,许文帅,龙毅,周侗,高朝.面向等高线与河流冲突处理的多约束移位方法[J].测绘学报,2014,43(11):1204-1210. 被引量：11

引证文献1

1郭文月,刘海砚,孙群,余岸竹,季晓林.利用树编辑距离的等高线拓扑相似性度量方法[J].测绘科学技术学报,2019,36(1):79-85. 被引量：3

二级引证文献3

1舒新峰,贾敬霞,何孝敏,付稳稳.面向语句分值的C程序静态评分方法[J].计算机工程与设计,2021,42(5):1331-1338.
2龚追飞,魏传佳.基于拓扑相似和XGBoost的复杂网络链路预测方法[J].计算机科学,2021,48(12):226-230. 被引量：3
3王荣,闫浩文,禄小敏.多尺度等高线簇拓扑关系定量表达方法研究[J].武汉大学学报（信息科学版）,2022,47(4):579-588. 被引量：1

1孙浩军.关于有序二叉树高度的一个结论[J].河北省科学院学报,1998,15(2):13-16.
2王晓静,吴亚坤,毛红艳,田宝勇.迭代骨架化算法在汉字图像识别中的分析与应用[J].辽宁大学学报（自然科学版）,2013,40(3):227-232. 被引量：8
3谷秾.机器翻译特点研究及其发展分析[J].人间,2015,0(33):84-84.
4叶红良.SQLServer2000到Oracle11G存储过程转换技术探究[J].数字技术与应用,2017,35(1):48-48.
5王化群,郭显久,于红,彭玉旭.几种可转换环签名方案的安全性分析和改进[J].电子与信息学报,2009,31(7):1732-1735. 被引量：4
6王化群,张力军,赵君喜.一种新的基于双线性对的环签名方案[J].仪器仪表学报,2006,27(10):1309-1312. 被引量：2
7张学军.两个改进的指定验证者签名方案[J].计算机工程与应用,2009,45(1):10-12. 被引量：1
8宋志鹏,任佳.基于有序二叉树的多模式匹配算法[J].计算机安全,2009(10):63-65.
9张兴茂,谭汉松.一种基于有序二叉树的变量池的设计和应用[J].科技广场,2008(10):55-58.
10吴选忠.Zhang快速并行细化算法的扩展[J].福建工程学院学报,2006,4(1):89-92. 被引量：20

计算机应用研究

2014年第9期

浏览历史

内容加载中请稍等...

基于Zhang-Shasha算法的存储过程相似性匹配被引量：1

参考文献1

二级参考文献69

共引文献22

同被引文献12

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Zhang-Shasha算法的存储过程相似性匹配 被引量：1

参考文献1

二级参考文献69

共引文献22

同被引文献12

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Zhang-Shasha算法的存储过程相似性匹配被引量：1