-
题名适用于PDF文本内容的高效模式匹配算法
- 1
-
-
作者
朱玲玉
王旌舟
陈庆春
-
机构
西南交通大学
-
出处
《通信技术》
2018年第3期641-646,共6页
-
文摘
高效、准确地对PDF文档文本内容中的敏感信息脱敏,成功的关键在于敏感词的有效匹配。因此,对经典单模式匹配BM算法、QS算法进行研究分析,结合PDF文本内容编码的规则,提出了一种适用于PDF文档的模式匹配算法。该算法利用BM算法的坏字符表的计算规则、QS算法的下一字符思想,结合已匹配的信息及PDF编码规则,使其最大跳跃距离为m+4,减少了匹配次数,提高了匹配效率。分析验证表明,该算法匹配效率相对于BM算法、QS算法有一定提高。
-
关键词
模式匹配
BM算法
QS算法
PDF编码
-
Keywords
pattern matching
BM algorithm
QS algorithm
PDF coding
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
TP301.6
[自动化与计算机技术—计算机系统结构]
-