一种改进的Wu-Manber多模式匹配算法及应用被引量：10

An Improved Wu-Manber Multiple-pattern Matching Algorithm and Its Application

下载PDF

导出

摘要本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。 The Wu-Manber multiple-pattern matching algorithm does not work well when some patterns are suffix of other patterns. To solve the problem, an improved algorithm is introduced which reduces the number of comparisons during pattern matching and leads to a faster matching algorithm. The text retrieval experiments use 52,067 passages which are randomly selected from TREC2000. Three algorithms including the Wu-Manber algorithm, the improved algorithm and the algorithm simply breaks halfway, are compared and the results show that the improved algorithm can steadily reduce the number of character comparisons and thus work more efficiently.

作者孙晓山王强关毅王晓龙

机构地区哈尔滨工业大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2006年第2期47-52,共6页 Journal of Chinese Information Processing

基金国家自然科学基金重点基金资助(60435020) 哈尔滨工业大学校基金资助项目(HIT2002.71)

关键词计算机应用中文信息处理多模式匹配后缀模式字符串匹配全文检索信息检索 computer application Chinese information processing multiple-pattern matching sutffix pattern string matching full text retrieval information retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Knuth DE,Morris JH,Pratt VR.Fast pattern matching in sirings[J].SIAM J Comput,1977,6(2):323-350.
2Boyer RS,Moore JS.A fast string searching algorithm[J].Communications of the ACM.1977,20(10):762-772.
3Karp R.M.,Rabin M.O.,Efficient randomized pattern-matching algorithms[J].IBM Journal Res Dev.1987,31(2):249-260.
4A.V.Aho,M.J.Corasick.Efficient String Matching:An Aid to Bibliographic Search[J].Communications of the ACM,1975,18(6):333-340.
5BeateCommentz-Walter.A string matching algorithm fast on the average[A].In:Proceedingsofthe6thColloquium,on Automata,Languages and Programming[C].Springer-Verlag,London,UK.1979,118-132.
6S.Wu,U.Manber.A Fast Algorithm For Multi-Pattern Searching[J].Technical Report TR-94-17,University of Arizona.1994,1-11.
7王素琴,邹旭楷.一种优化的并行汉字／字符串匹配算法[J].中文信息学报,1995,9(1):49-53. 被引量：4
8陈开渠,赵洁,彭志威.快速中文字符串模糊匹配算法[J].中文信息学报,2004,18(2):58-65. 被引量：23
9ES de Moura.Fast and flexible word searching on compressed text[A].ACM Transactions on Information Systems,2000.
10张鑫,谭建龙,程学旗.一种改进的Wu-Manber多关键词匹配算法[J].计算机应用,2003,23(7):29-31. 被引量：27

二级参考文献18

1[1]Sellers, P.. The theory and computation of evolutionary distance: pattern recognition. Journal of Algorithms[J], 1980,1:359-373.
2[2]Baeza-Yates, R.A.,Gonnet, G.H.: A new approach to text searching, Communications of the ACM[J]. 35(10):74-82.
3[3]Wu, S., Manber, U.. Fast text searching allowing errors, Communications of the ACM[J]. 35(10):83-91.
4[4]Baeza-Yates, R.A., Navarro, G.. Faster approximate string matching. Algorithmica[J], 23(2):1999,127-158.
5[5]Myers, G.: A fast bit-vector algorithm for approximate string matching based on dynamic programming. Journal of the ACM[J], 46(3):1999,395-415.
6[6]Chang, W., Marr, T.. Approximate string matching and local similarity[A]. In: Proc. 5th Combinational Pattern Matching (CPM94) [C], LNCS 807, pages 1994,259-271.
7[7]Navarro, G., Baeza-Yates, R.A.. Very fast and simple approximate string matching. Information Processing Letters[J], 1999,72:65-70.
8[8]Navarro, G., Raffinot, M.. Fast and flexible string matching by combining bit-parallelism and suffix automata. ACM Journal of Experimental Algorithmics (JEA) [J], 2000,5(4).
9[9]Sutinen, E., Tarhio, J.. On using q-gram locations in approximate string matching[A]. In: Proc. European Symposium on Algorithms (ESA95) [C], LNCS 979, 1995,327-340.
10[10]Tarhio, J., Ukkonen, E.. Approximate Boyer-Moore string matching. SIAM Journal on computing[J], 1993,22(2):243-260.

共引文献49

1王俊超,刘晨帆,徐明世,纪山,兰伟.语义相似性度量技术在地名匹配研究中的应用[J].辽宁工程技术大学学报（自然科学版）,2012,31(6):871-874. 被引量：6
2Jin Shu(1),Liu Fengyu(2)(1.NAEG System Integration Engineering Co.Ltd,Nanjing,210003,P.R.China,2.Nanjing University of Science & Technology,Computer Science Department,210094,P.R.China).A Parallel String Searching Algorithm for Information Filtering[J].工程科学（英文版）,2007,5(3):82-90.
3代六玲,黄河燕,陈肇雄.一种改进的多模式串匹配算法[J].模式识别与人工智能,2006,19(1):47-51. 被引量：4
4杨东红,徐恪,崔勇.改进的Wu-Manber多模式串匹配算法[J].清华大学学报（自然科学版）,2006,46(4):555-558. 被引量：13
5范立新,谢晓能,吴飞.基于过滤的中文多模式近似字符串匹配算法[J].计算机工程,2006,32(20):48-50. 被引量：5
6范立新.改进的中文近似字符串匹配算法[J].计算机工程与应用,2006,42(34):172-174. 被引量：8
7袁世忠,曹旻,王燕燕.基于WM算法的多模式匹配改进算法WMN[J].计算机工程与应用,2007,43(15):128-130. 被引量：6
8王静帆,邬晓钧,夏云庆,郑方.中文信息检索系统的模糊匹配算法研究和实现[J].中文信息学报,2007,21(6):59-64. 被引量：17
9吴冰,云晓春,高琪.基于网络的恶意代码检测技术[J].通信学报,2007,28(11):87-91. 被引量：8
10莫德敏,刘耀军.Wu-Manber算法在大规模模式串下的改进[J].晋中学院学报,2008,25(3):86-90. 被引量：2

同被引文献47

1宋华,戴一奇.一种用于内容过滤和检测的快速多关键词识别算法[J].计算机研究与发展,2004,41(6):940-945. 被引量：22
2程伟,刘玉军,卢泽新.最佳比较序字符串匹配算法研究和应用[J].计算机工程与设计,2004,25(9):1430-1432. 被引量：5
3贺龙涛,方滨兴,余翔湛.一种时间复杂度最优的精确串匹配算法[J].软件学报,2005,16(5):676-683. 被引量：25
4王素琴,邹旭楷.一种优化的并行汉字／字符串匹配算法[J].中文信息学报,1995,9(1):49-53. 被引量：4
5胡和平,曾庆锐,路松峰.中文词聚类研究[J].计算机工程与科学,2006,28(1):122-124. 被引量：9
6李雪梅,代六玲,童新海,王雄.对QS串匹配算法的一种改进[J].计算机应用与软件,2006,23(3):108-109. 被引量：2
7吕晓华,贾宇波,孙麒.一种基于多层模糊模式的频繁项集剪枝算法的优化[J].浙江理工大学学报（自然科学版）,2006,23(1):50-55. 被引量：3
8周霆,张伟,张泽洪.基于关联规则的映射聚类算法[J].微电子学与计算机,2006,23(3):26-29. 被引量：9
9杨东红,徐恪,崔勇.改进的Wu-Manber多模式串匹配算法[J].清华大学学报（自然科学版）,2006,46(4):555-558. 被引量：13
10陈瑜,陈国龙.Wu-Manber算法性能分析及其改进[J].计算机科学,2006,33(6):203-205. 被引量：13

引证文献10

1潘伟,郑刚.基于聚类模式的多数据源匹配的实现[J].计算机技术与发展,2007,17(1):76-78.
2莫德敏,刘耀军.Wu-Manber算法在大规模模式串下的改进[J].晋中学院学报,2008,25(3):86-90. 被引量：2
3莫德敏,刘耀军.Wu-Manber算法的一种综合改进[J].太原师范学院学报（自然科学版）,2008,7(2):72-75.
4蒋辉,张宇弘.一种改进的W-M多模式匹配算法[J].机电工程,2008,25(9):25-27.
5莫德敏,刘耀军.一种改进的Wu-Manber多关键字匹配算法[J].中文信息学报,2009,23(1):30-34. 被引量：4
6刘萍,刘燕兵,郭莉,方滨兴.串匹配算法中模式串与文本之间关系的研究[J].软件学报,2010,21(7):1503-1514. 被引量：16
7何慧敏,刘燕兵,谭建龙,郭莉.一种基于子串识别的多模式串匹配算法[J].计算机应用与软件,2011,28(11):10-14. 被引量：1
8汪永进,顾乃杰,任开新.一种按字长匹配的Wu-Manber多模式匹配算法[J].小型微型计算机系统,2013,34(7):1650-1653. 被引量：2
9黄逸之,尹香兰.Wu_Manber算法的综合改进[J].微型机与应用,2014,33(19):8-11.
10王一霈,石春,戴上静,吴刚.一种改进的针对中文编码的Wu-Manber多模式匹配算法[J].小型微型计算机系统,2015,36(4):778-781. 被引量：4

二级引证文献29

1李冬梅.基于外围轮廓的自适应块大小视频压缩算法及其在视频压缩中的应用[J].晋中学院学报,2009,26(3):86-89.
2郑乃千.利用EXCEL做复杂的方差分析[J].晋中学院学报,2009,26(3):90-92.
3吴旭,贡华,李汪根,方群.基于特征串匹配的X射线荧光光谱仪数据采集[J].计算机工程,2012,38(2):250-252.
4刘许刚,黄海,马宏.一种基于分段匹配的字符串匹配算法[J].计算机应用与软件,2012,29(3):128-131. 被引量：9
5郑天明,王韬,郭世泽,李华,赵新杰.改进的空间协议识别算法[J].通信学报,2012,33(5):183-190. 被引量：6
6罗玺,罗红,王晓东,刘洪坤.病毒特征检测中改进的多模式匹配算法[J].计算机应用研究,2012,29(10):3828-3830. 被引量：2
7韩光辉,曾诚.KMP算法的理论研究[J].微电子学与计算机,2013,30(4):30-33. 被引量：7
8韩光辉,曾诚.BM算法中函数shift的研究[J].计算机应用,2013,33(8):2379-2382. 被引量：5
9肖建田.SSE-CMM评价证据的自动获取研究[J].现代计算机（中旬刊）,2013(7):16-19.
10张健,冯飞,刘宇,马红烨.基于本体概念相似度的网页排序算法研究[J].情报学报,2013,32(11):1174-1183. 被引量：1

1马计,王国平,杨明.基于CUDA的Wu-Manber多模式匹配算法[J].计算机系统应用,2012,21(3):51-54. 被引量：1
2董迎亮,玄雪花,王德民.基于WM算法改进的多模式匹配算法[J].吉林大学学报（信息科学版）,2011,29(4):383-387. 被引量：6
3张研.VC++编程实现多模式的全文检索[J].电脑编程技巧与维护,2011(19):72-75.
4陈瑜,陈国龙.Wu-Manber算法性能分析及其改进[J].计算机科学,2006,33(6):203-205. 被引量：13
5陈凯,冯全源.一个频繁闭项集高效挖掘算法[J].计算机与数字工程,2005,33(9):52-56. 被引量：1
6莫德敏,刘耀军.一种改进的Wu-Manber多关键字匹配算法[J].中文信息学报,2009,23(1):30-34. 被引量：4
7莫德敏,刘耀军.Wu-Manber算法在大规模模式串下的改进[J].晋中学院学报,2008,25(3):86-90. 被引量：2
8秦晓明,牛全营,吴淼.入侵检测系统中模式匹配算法的优化研究[J].计算机与现代化,2009(4):5-7. 被引量：2
9田峥,田建伟,薛海伟,漆文辉.一种基于多模匹配的敏感邮件实时检测方法[J].湖南电力,2015,35(1):29-33.
10莫德敏,刘耀军.Wu-Manber算法的一种综合改进[J].太原师范学院学报（自然科学版）,2008,7(2):72-75.

中文信息学报

2006年第2期

浏览历史

内容加载中请稍等...

一种改进的Wu-Manber多模式匹配算法及应用被引量：10

参考文献10

二级参考文献18

共引文献49

同被引文献47

引证文献10

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

一种改进的Wu-Manber多模式匹配算法及应用 被引量：10

参考文献10

二级参考文献18

共引文献49

同被引文献47

引证文献10

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

一种改进的Wu-Manber多模式匹配算法及应用被引量：10