一种基于PowerBuilder环境字符串相似度算法
摘要
最小编辑距离能直接反映两个字符串的相似程度,而字符串的相似度比较在数据挖掘和数据查询方面多有应用。通过相似度比对,可更自动化地整理、规范文本,提高信息模糊查询的命中率。本文详细介绍了"LD"算法的原理,并完成了PowerBuilder环境下的具体编码。
出处
《数字技术与应用》
2017年第3期140-141,共2页
Digital Technology & Application
参考文献3
-
1杜军强,杨波.云计算中加密数据的模糊关键字搜索方法[J].计算机工程与应用,2015,51(5):146-152. 被引量:9
-
2黄林晟,邓志鸿,唐世渭,王文清,陈凌.基于编辑距离的中文组织机构名简称-全称匹配算法[J].山东大学学报(理学版),2012,47(5):43-48. 被引量:14
-
3米琳.基于q-gram的字符串相似性查询研究[J].现代计算机,2014,20(4):12-16. 被引量:4
二级参考文献32
-
1车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量:65
-
2钟良伍,郑方.基于中文机构名简称的检索方法研究[J].中文信息学报,2007,21(1):38-42. 被引量:7
-
3NIRENBURG S, DOMASHNEV C, GRANNES D J. Two approaches of matching in example-based machine translation [J].//Proceedings of the 5th International Conference on Theoretical and Methodological Issues in Machine Translation. [S l. ] : [s. n. ], 1993:47-57.
-
4RISTAD E S, YIANILOS P N. Learning string-edit distance [J]. IEEE PAMI, 1998, 20(5) :522-532.
-
5SALTON G, WONG A, YANG Chungshu. A vector space model for automatic indexing [J]. Communications of the ACM, 1995, 18( 11 ) :613-620.
-
6LI Sujian, ZHANG Jian, HUANG Xiong, et al. Semantic computation in Chinese question-answering system [J ]. J Comput Sci Technol, 2002, 17 (6) :933-939.
-
7CHATTERJEE N. A statistical approach for similarity measurement between sentences for EBMT [ C ]//Proceedings of Symposium on Translation Support Systems. Washington: IEEE Computer Society, 1999:15-17.
-
8Jokinen P, Ukkonen E. Two Algorithms for Approximate String Matching in Static Texts[M]. Mathematical Foundations of Computer Science 1991. Springer Berlin Heidelberg, 1991:240-248.
-
9Burkhardt S, Crauser A, Ferragina P, et al. Q-gram Based Database Searching Using a Suffix Array ( QUASAR ) [C]. Proceedings of the Third Annual International Conference on Computational Molecular Biology. ACM,1999:77-83.
-
10Gravano L, Ipeirotis P G, Jagadish H V, et al. Approximate String Joins in a Database(almost)for Free[C]. VLDB. 2001, 1:491-500.
共引文献24
-
1唐坚,刘海燕.作战文书中部队番号的自动识别方法[J].兵器装备工程学报,2020,0(2):143-147. 被引量:1
-
2王继民,徐波,朱跃龙,汪卫军,李士进,万定生.基于相似性搜索的水利普查数据融合[J].水利信息化,2014(2):30-35.
-
3高学东,黄月.异质对象协同实体解析的联合聚类算法[J].系统工程理论与实践,2015,35(4):997-1004. 被引量:2
-
4杨航,侯琼煌.基于Q-Gram的数据库模式匹配算法[J].信息技术,2015,39(8):139-142. 被引量:1
-
5盖森,刘建忠,熊伟,张心悦,李江鹏.自然语言空间查询中应用编辑距离的规则匹配模型[J].测绘科学技术学报,2015,32(4):416-421. 被引量:1
-
6李圣文,凌微,龚君芳,周长征.一种基于熵的文本相似性计算方法[J].计算机应用研究,2016,33(3):665-668. 被引量:13
-
7孙晓玲,郑勉,李伟勤,罗恩韬.位置信息记录中基于期望最大化的名称消重算法[J].计算机科学,2016,43(3):238-241.
-
8韦相和,张宏.机会社会网络用户信息资源加密仿真研究[J].计算机仿真,2016,33(12):270-273. 被引量:3
-
9张俊玲,耿光刚,延志伟,李晓东.基于网页信息和分词的中文机构名全称和简称提取方法[J].计算机应用研究,2017,34(4):972-976. 被引量:3
-
10胡晓燕.云计算存储数据动态访问控制方法研究与仿真[J].计算机仿真,2017,34(3):365-368. 被引量:21
-
1刘少彬,彭慧波,蔺华庆,王全红.基于网络蜘蛛和LD算法的钓鱼网站检测技术[J].自动化与仪器仪表,2015(6):165-166. 被引量:2
-
2刘庆海,刘光凤,杨德艳,梁倩.谈C语言上机考试的自动评分[J].电脑知识与技术,2012,8(9X):6517-6519.
-
3程玉胜,梁辉,王一宾,任勇.结合关键词微变和LD算法的文本相似性研究[J].计算机工程与应用,2016,52(8):70-73.
-
4肖雨,崔荣一,怀丽波.一种融合位置信息的字符串相似度度量方法[J].计算机应用研究,2015,32(11):3287-3290. 被引量:3
-
5王磊.小波变换在数字水印中的应用[J].科技信息,2013,0(34):194-195.
-
6李彬.计算字符串相似度的矩阵算法[J].现代电子技术,2007,30(24):106-108. 被引量:7
-
7姜华,韩安琪,王美佳,王峥,吴雲玲.基于改进编辑距离的字符串相似度求解算法[J].计算机工程,2014,40(1):222-227. 被引量:72
-
8张志强.应用CAD系统调用AutoCAD及其它系统[J].长沙水电师院学报(自然科学版),1996,11(3):279-283.
-
9杜利峰,牛永洁.字符串相似度在自动评分系统中的应用[J].电子设计工程,2011,19(7):42-44. 被引量:11
-
10马千里,于忠清,刘涛.Gray World算法在菜品识别中的应用[J].青岛大学学报(自然科学版),2009,22(1):72-75. 被引量:2