-
题名基于过滤的中文多模式近似字符串匹配算法
被引量:5
- 1
-
-
作者
范立新
谢晓能
吴飞
-
机构
浙江大学计算机学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期48-50,58,共4页
-
文摘
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。
-
关键词
近似字符串匹配
中文字符串匹配
多模式匹配
位并行运算
过滤
-
Keywords
Approximate string match
Chinese string match
Multiple patterns match
Bit-parallel calculation
Filtering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的中文近似字符串匹配算法
被引量:8
- 2
-
-
作者
范立新
-
机构
绍兴文理学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第34期172-174,207,共4页
-
文摘
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复杂度为O(!+n),而在最佳情况下的时间复杂度与BPM-BM算法一致。
-
关键词
近似字符串匹配
位并行运算
过滤
编辑距离
中文字符串匹配
-
Keywords
approximate string matching
bit-parallel
filter
edit distance
chinese string matching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-