-
题名高性能正则表达式匹配算法评估
被引量:4
- 1
-
-
作者
金军航
张大方
黄昆
-
机构
湖南大学软件学院
湖南大学计算机与通信学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第19期269-271,共3页
-
基金
国家自然科学基金资助项目(60673155
90718008)
-
文摘
为对现有的高性能正则表达式匹配算法进行综合比较与分析,实现诸如DFA、D2FA、CD2FA、mDFA及XFA等最新算法,采用Snort规则集综合评估这些算法的存储空间和匹配时间。实验结果表明,在存储空间方面,与mDFA相比,XFA的存储空间减少84.9%89.9%;在匹配效率方面,与mDFA相比,XFA的匹配时间增加了38.9%174.6%;XFA在存储空间和匹配效率上具有良好的可伸缩性,即当规则数增加到8倍时,mDFA的存储空间增长了64倍,而XFA的存储空间仅增加了16倍,匹配时间仅增加了61.3%。
-
关键词
正则表达式匹配
确定有限自动机
扩展有限自动机
性能评估
-
Keywords
regular expression matching
deterministic finite automaton
extended finite automaton
performance evaluation
-
分类号
N945
[自然科学总论—系统科学]
-
-
题名包对探测统计模型与测量精度分析
- 2
-
-
作者
刘俊
张大方
金军航
-
机构
湖南大学计算机与通信学院
湖南大学软件学院
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第4期1438-1442,1459,共6页
-
基金
国家自然科学基金资助项目(60673155
60703097)
-
文摘
包对模型(PGM)是探测可用带宽的主要方法。该方法存在以下问题,影响其推广应用:模型没有精确的数学模型描述,原有模型假设流量包长看做无限小,与实际网络情况不符合;没有定量方法计算探测精度、样本容量,给测量带来不便;没有分析互联网数据包突发性对测量带来的影响。为解决以上问题,通过对包对模型进行数学建模的方法,证明了模型正确性;定量分析了测量精度;确定了样本数计算公式;分析了数据包突发性对探测造成的影响;最后对以上分析进行了仿真实验验证,提高了可用带宽测试技术的精度和可信度。
-
关键词
计算机网络
可用带宽探测
包对模型
-
Keywords
computer network
available bandwidth probing
probe gap model(PGM)
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名一种面向深度数据包检测的紧凑型正则表达式匹配算法
被引量:12
- 3
-
-
作者
黄昆
张大方
谢高岗
金军航
-
机构
湖南大学计算机与通信学院
湖南大学软件学院
中国科学院计算技术研究所
-
出处
《中国科学:信息科学》
CSCD
2010年第2期356-370,共15页
-
基金
国家自然科学基金(批准号:90718008
60673155)
国家重点基础研究发展计划(批准号:2007CB310702)资助项目
-
文摘
深度数据包检测(Deep Packet Inspection,DPI)采用正则表达式匹配算法,将每个数据包内容与一组预定义的特征进行匹配.正则表达式匹配算法是一种多模式特征匹配算法,采用确定型有限自动机(Deterministic Finite Automaton,DFA)表示一组正则表达式特征,实现一次内容扫描可匹配多个特征.基于硬件的正则表达式匹配算法面临存储空间需求大等挑战,即片上嵌入式存储器难以存储日益增长的DFA存储空间需求,从而限制了DPI的性能和可伸缩性.近年来,Smith等人提出了一种基于扩展有限自动机(eXtended Finite Automaton,XFA)的正则表达式匹配算法,即在状态上增加辅助变量和简单操作指令,消除了DFA状态空间爆炸问题,从状态方面减少存储空间需求.为了进一步减少XFA存储空间需求,本文提出了一种基于紧凑型有限自动机(Compact Finite Automaton,CFA)的正则表达式匹配算法,称为紧凑型正则表达式匹配算法.CFA是一种存储高效的有限自动机,即从迁移边方面减少XFA存储空间需求.在CFA构建过程,本文提出了基于优先级的迁移边压缩方法,融合相同目的状态最多的迁移边,从而减少存储空间需求;在CEA匹配过程,本文提出了基于位图的迁移边查找方法,并行查找不同优先级的迁移边子集,从而确保匹配效率.Snort特征规则集的实验结果表明:与XFA相比,CFA在迁移边条数上减少了88.2%,在存储空间大小上减少了83%,在匹配时间上减少了12%.
-
关键词
网络安全
深度数据包检测
特征匹配
有限自动机
正则表达式
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
TP393.08
[自动化与计算机技术—计算机应用技术]
-