题名 一种针对DFA状态爆炸的正则表达式匹配方法
被引量:4
1
作者
王翔
卢毓海
马伟
刘燕兵
机构
中国科学院大学网络空间安全学院
中国科学院信息工程研究所
信息内容安全技术国家工程实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第4期148-156,共9页
基金
国家重点研发计划(2016YFB0800303)
中国科学院信息工程研究所基础前沿项目(Y7Z0351101)
文摘
针对基于确定有限状态自动机的匹配引擎在大规模、复杂规则下会出现状态爆炸的问题,提出正则表达式子串抽取算法。通过将子串抽取算法应用于DFA状态爆炸场景,设计基于子串抽取的正则匹配引擎。实验结果表明,该算法在单个规则上运行时间可达10 ms量级,抽取率高达99%,同时匹配引擎具有较好的稳定性和可拓展性,且匹配速度优于相关开源匹配引擎。
关键词
正则表达式
确定有限自动机
状态爆炸
子串抽取
匹配引擎
Keywords
regular expression
Deterministic Finite Automaton(DFA)
state explosion
substring extraction
matching engine
分类号
TP39
[自动化与计算机技术—计算机应用技术]
题名 串的快速连续弱哈希及其应用
被引量:1
2
作者
徐泽明
侯紫峰
机构
中国科学院计算技术研究所
中国科学院研究生院
联想研究院
出处
《软件学报》
EI
CSCD
北大核心
2011年第3期353-365,共13页
文摘
提出串的快速连续弱哈希(fast continuous weak Hash,简称FCWH),并研究它在理论和工程上的应用.首先提出FCWH的概念,从代数结构角度统一规划该类哈希的构造框架;然后对哈希冲突概率进行理论分析和实验数据分析,推广并加强了Rabin的相关工作;最后,通过推广串匹配的Karp-Rabin算法,应用FCWH解决顺序抽取公共子串问题(sequential extraction of common substrings,简称SECS),并据此设计快速同步协议X-Sync来解决当今宽带网络和云计算环境下文档多版本内容的实时备份检索.
关键词
快速连续弱哈希(FCWH)
串匹配
顺序抽取 公共子串 (SECS)
快速同步(X-Sync)
有限群
有限环
有限域
Keywords
fast continuous weak Hash (FCWH)
string-matching
sequential extraction of common substrings(SECS)
express synchronization (X-Sync)
finite group
finite ring
finite field
分类号
TP301
[自动化与计算机技术—计算机系统结构]