一种高效的正则表达式匹配方法被引量：5

An efficient regular expression matching method

下载PDF

导出

摘要为实现网络安全检测中大规模正则表达式的匹配,分析了在从非确定型有限自动机(NFA)到确定型有限自动机(DFA)的子集构造过程中导致状态爆炸性增长的原因,并提出了一种高效的正则表达式匹配方法。这种方法通过将部分DFA状态转变成受限的NFA状态来消除状态数量的剧烈增长,并会形成一种DFA状态与受限的NFA状态交替出现的有限自动机,称为DNFA。DNFA将DFA与NFA结合在一起,实现匹配速度与内存空间占用的平衡,其多层结构也更加适合复杂正则表达式规则。实验结果表明,上述方法可以在大大减少内存需求的情况下,实现正则表达式的高效匹配。 To realize the large-scale regular expression matching in network security inspection, the cause of the state ＂explosion＂ during the subset construction process from the nondeterministic finite automation （NFA） to the deter- ministic finite automation （DFA） is analyzed, and then the DNFA, an efficient regular expression matching method is proposed. This method avoids the dramatic growth of the states by transforming part DFA states into limited NFA states, thus the DNFA, a finite automation with the DFA state-limited NFA alternation, is formed. The DNFA takes advantage of the high processing efficiency of the DFA and the compact representation of the NFA to achieve a better trade-off between the memory space and the matching time. It can make a fine granularity splitting of rule set, and its multi-level structure is more suitable for complex regular expression rules in network applications. The experimental result shows that this proposal can provide a high throughout with a moderate memory requirement.

作者张树壮吴志刚罗浩

机构地区北京邮电大学网络技术研究院

出处《高技术通讯》 CAS CSCD 北大核心 2014年第6期551-557,共7页 Chinese High Technology Letters

基金科技支撑计划(2012BAH37B02 2012BAH42B02) 863计划(2012AA03001) 242计划(2013A012 2013A133)资助项目

关键词深度包检测正则表达式子集分割有限自动机混合自动机 deep packet inspection, regular expression, subset splitting, finite automaton, hybrid finite automaton

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献30

1杨桢,赵燕平,朱东华.基于正则表达式的信息抽取系统在国防技术监测中的应用[J].北京理工大学学报,2006,26(z1):74-78. 被引量：9
2陈一航,薛质.一种针对网络入侵检测系统的字符串匹配算法[J].计算机应用与软件,2005,22(4):5-6. 被引量：4
3翁芳芳,林俐,杨以涵.CIM模型与关系模型的一种映射方法的探讨[J].现代电力,2005,22(4):20-24. 被引量：14
4佘石泉,周肆清.正则表达式在编程题自动阅卷中的应用[J].计算机技术与发展,2007,17(7):244-246. 被引量：16
5王功明,吴华瑞,赵春江,杨宝祝.正则表达式在电子政务客户端校验中的应用[J].计算机工程,2007,33(9):269-271. 被引量：16
6弗里德尔.精通正则表达式[M].南京:东南大学出版社,2005.
7袁一鸣,张麟,王承民,王璞,王强,连鸿波,蒋传文.图模一体化技术及其在电网规划软件系统中的应[J].东北电力大学学报,2009,29(2):1-4. 被引量：7
8宗德才.操作题自动评分系统的设计与实现[J].计算机工程与设计,2010,31(5):1156-1160. 被引量：30
9姚振军,黄德根,纪翔宇.正则表达式在汉英对照中国文化术语抽取中应用[J].大连理工大学学报,2010,50(2):291-295. 被引量：9
10秦学勇.基于相似度计算的主观题阅卷系统设计[J].安徽建筑工业学院学报（自然科学版）,2010,18(4):77-80. 被引量：5

引证文献5

1周昌权.基于JS正则表达式校验应用于考生报名系统[J].电脑编程技巧与维护,2015(12):26-26.
2李伟.基于网络设备配置指令集的自动阅卷系统设计与实现[J].现代计算机,2016,22(19):73-76.
3郑炜,蔺军,黄月明,冯晨,吴潇雪.应用过程间分析技术的并行错误模式匹配方法[J].西北工业大学学报,2017,35(1):148-153.
4吴伟,张伟.OCS系统参数逆向导出技术研究及应用[J].新技术新工艺,2018(2):55-58.
5朱俊.基于规则分组的DFA正则表达式匹配算法[J].湖南工程学院学报（自然科学版）,2021,31(2):49-53. 被引量：2

二级引证文献2

1关兴义,赵敏,伍文昌.一种基于DFA的短文本信息过滤算法[J].软件导刊,2023,22(4):103-108. 被引量：2
2邢如意.基于发布订阅机制的实时消息系统设计与实现[J].现代信息科技,2023,7(21):28-31.

1吴绍根,李洛.入侵检测系统中模式匹配自动机的构造研究[J].微型电脑应用,2006,22(5):10-12.
2吴绍根,李洛.一种构造入侵检测系统模式匹配自动机的方法[J].安徽电气工程职业技术学院学报,2006,11(1):84-87.
3郭菲.基于限定步长的消息队列并发程序可达性算法分析[J].电脑编程技巧与维护,2014(6):6-8.
4魏强,李云照,褚衍杰.基于图划分的正则表达式分组算法[J].计算机工程,2012,38(18):137-139. 被引量：3
5Barry Wellman,陶涵.日趋社会化的计算机网络[J].世界科学,2002,24(6):35-37.
6徐龙琴.DWT域的关系数据库鲁棒性盲水印算法研究[J].计算机工程与应用,2010,46(22):153-156. 被引量：1
7丁亦喆,魏刃佳,刘博,吴振强.移动互联网中一种移动学习方案的设计与原型实现[J].计算机工程与科学,2015,37(2):288-293. 被引量：6
8董晶,刘庆晖.二维二方向有限自动机的识别能力研究[J].北京理工大学学报,2012,32(11):1129-1133.
9李威杰,华保健,李曦.支持正则表达式的密文检索方案的研究[J].计算机应用与软件,2017,34(3):306-311. 被引量：3
10潘章明,陈尹立.面向大数据集的共享近邻聚类研究[J].小型微型计算机系统,2014,35(1):50-54. 被引量：5

高技术通讯

2014年第6期

浏览历史

内容加载中请稍等...

一种高效的正则表达式匹配方法被引量：5

同被引文献30

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种高效的正则表达式匹配方法 被引量：5

同被引文献30

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种高效的正则表达式匹配方法被引量：5