-
题名基于并行字符索引的多步长正则表达式匹配算法
被引量:8
- 1
-
-
作者
丁麟轩
黄昆
张大方
-
机构
湖南大学信息科学与工程学院
中国科学院计算技术研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第3期681-690,共10页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2012CB315805)
国家自然科学基金项目(61173167
61100171)
-
文摘
深度包检测(deep packet inspection,DPI)是网络入侵检测与防御系统(network intrusion detection and prevention system,NIDPS)的核心.基于三态内容可寻址存储器(ternary content addressable memory,TCAM)的正则表达式匹配算法提高了数据包的处理速度,成为DPI技术的一个重要研究方向.TCAM具有查找速度快、存储空间小等特性,且能耗与存储空间成正比.由于DFA的存储空间开销比较大,且存储空间大小随着DFA步长数的增加而指数倍增,基于TCAM的DFA面临高能耗的问题,特别是多步长DFA.提出一种基于并行字符索引的多步长正则表达式匹配算法(multi-stride parallel character-indexed DFA,PCIDFA),对确定型有限自动机(deterministic finite automaton,DFA)构造并行字符索引,通过比特位图取交集,减少匹配时激活的TCAM块数,显著降低TCAM能耗.实验结果表明:与多步长DFA相比,多步长PCIDFA在TCAM能耗上减少了99.8%以上,在TCAM存储空间开销上减少了48.5%-65.3%,在吞吐量上提高了1.9-2.6倍.
-
关键词
正则表达式匹配
三态内容可寻址存储器
并行字符索引
分块存储
低能耗
-
Keywords
regular expression matching
ternary content addressable memory(TCAM)
parallel character index
block-based storage
low power
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于TCAM的低能耗正则表达式匹配算法
被引量:4
- 2
-
-
作者
丁麟轩
黄昆
张大方
-
机构
湖南大学信息科学与工程学院
中国科学院计算技术研究所
-
出处
《通信学报》
EI
CSCD
北大核心
2014年第8期162-168,178,共8页
-
基金
国家重点基础研究发展规划("973"计划)基金资助项目(2012CB315805)
国家自然科学基金资助项目(61173167
61100171)~~
-
文摘
提出一种基于字符索引的正则表达式匹配算法,对确定型有限自动机(DFA,deterministic finite automaton)的字母表和状态进行分离存储,构建字符索引,减少匹配时激活的TCAM块数,显著降低TCAM能耗。实验结果表明:与DFA相比,基于字符索引的DFA(CIDFA,character-indexed DFA)在能耗上平均减少了92.7%,在存储空间开销上平均减少了32.0%,在吞吐量上平均提高了57.9%。
-
关键词
正则表达式匹配
字符索引
分块存储
低能耗
-
Keywords
regular expression matching
character index
block-based storage
low power
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-