期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
一种基于DFA的短文本信息过滤算法 被引量:2
1
作者 关兴义 赵敏 伍文昌 《软件导刊》 2023年第4期103-108,共6页
有关信息过滤的算法应用广泛,随着微信、微博等社交平台的迅速发展,短文本信息在网络通信中占据了主流,针对短文本信息的过滤也越来越重要。通过比较BF算法、KMP算法、AC算法等经典模式匹配算法的优缺点,选择更适合短文本过滤的DFA算法... 有关信息过滤的算法应用广泛,随着微信、微博等社交平台的迅速发展,短文本信息在网络通信中占据了主流,针对短文本信息的过滤也越来越重要。通过比较BF算法、KMP算法、AC算法等经典模式匹配算法的优缺点,选择更适合短文本过滤的DFA算法。介绍DFA算法基本原理,提出一种基于DFA的改进算法,改进后的算法通过敏感词预处理和过滤过程优化来提高检测率。实验结果表明,相比于SWDT-IFA算法,改进后的算法对中文对话数据集检测的查准率提高了3%,误报率降低了0.87%,具有较高的应用价值。 展开更多
关键词 短文本 信息过滤 dfa 模式匹配 TRIE树
下载PDF
高速邮件监控审计研究 被引量:5
2
作者 吴刚 王旭仁 张信杰 《计算机工程与设计》 CSCD 北大核心 2010年第6期1195-1197,1201,共4页
为了满足企业级高速网络中邮件监控需求,提出了基于内存映射和libnids改进框架的邮件监控审计方案。该方案首先通过改进libnids库内核、用户级缓存和内存映射文件技术减小I/O开销,高效捕获存、储原始邮件数据,然后对邮件协议进行了深入... 为了满足企业级高速网络中邮件监控需求,提出了基于内存映射和libnids改进框架的邮件监控审计方案。该方案首先通过改进libnids库内核、用户级缓存和内存映射文件技术减小I/O开销,高效捕获存、储原始邮件数据,然后对邮件协议进行了深入地分析,将捕获的数据简化封装成MIME格式,采用多线程技术对其进行还原,最后采用基于Wu_Manber多模式匹配算法对还原的邮件内容进行审计,生成强大的审计报表。测试结果表明,该系统能为企业管理部门提供一个高效的邮件监管工具。 展开更多
关键词 邮件审计 libnids库 多线程 有限状态自动机 模式匹配
下载PDF
基于电子舌技术的卷烟主流烟气味觉识别 被引量:19
3
作者 顾永波 肖作兵 +7 位作者 刘强 李智宇 冒德寿 冯涛 田怀香 许建营 侯春 李海涛 《烟草科技》 EI CAS 北大核心 2011年第8期48-51,共4页
为考察电子舌对不同卷烟烟气味觉的识别效果,利用电子舌系统检测了6个烤烟型和3个混合型卷烟样品主流烟气水处理液的味觉特征,并对其传感器响应信号进行了主成分分析(PCA)和判别因子分析(DFA)。结果表明:①前2维主成分对卷烟品种的味觉... 为考察电子舌对不同卷烟烟气味觉的识别效果,利用电子舌系统检测了6个烤烟型和3个混合型卷烟样品主流烟气水处理液的味觉特征,并对其传感器响应信号进行了主成分分析(PCA)和判别因子分析(DFA)。结果表明:①前2维主成分对卷烟品种的味觉识别贡献率达84.82%;②前2维DFA对卷烟品种的味觉识别贡献率达95.42%。结论:在模式识别中,DFA法的区分效果优于PCA法;电子舌能区分不同香型卷烟味觉特征,有望成为一种辅助的卷烟感官质量评价方法。 展开更多
关键词 电子舌 主成分分析 判别因子分析 主流烟气 模式识别
下载PDF
基于有限自动机的模式匹配算法及其应用研究 被引量:5
4
作者 李钢 吴燎原 +1 位作者 张仁斌 张佑生 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第12期2772-2775,共4页
针对质量统计过程控制(SPC)中的异常模式快速匹配问题,提出了基于确定有限自动机(DFA)的模式匹配算法,给出了能利用DFA进行匹配的基于多维输入数据的模式串定义。在分析常规质量控制图中的八种异常模式的基础上,给出了基于DFA的模式串... 针对质量统计过程控制(SPC)中的异常模式快速匹配问题,提出了基于确定有限自动机(DFA)的模式匹配算法,给出了能利用DFA进行匹配的基于多维输入数据的模式串定义。在分析常规质量控制图中的八种异常模式的基础上,给出了基于DFA的模式串匹配算法。该算法在企业计算机辅助质量控制系统(CAQCS)中得到了成功的应用,表明它适于解决SPC中的异常模式的匹配问题,且有简单、快速和准确的特点。 展开更多
关键词 异常模式匹配 确定有限自动机 多维 常规控制图
下载PDF
基于改进BM算法的确定型有穷自动机的设计 被引量:4
5
作者 殷超 李大兴 《微计算机信息》 北大核心 2008年第7期215-216,236,共3页
通过对有穷自动机理论与BM算法进行分析,设计了一个基于改进BM算法的确定型有穷自动机的模型.该模型描述了向基于改进BM算法的确定型有穷自动机输入文本字符串,自动机输出TRUE,说明文本串中存在与模式串相匹配的字符;自动机输出FALSE,... 通过对有穷自动机理论与BM算法进行分析,设计了一个基于改进BM算法的确定型有穷自动机的模型.该模型描述了向基于改进BM算法的确定型有穷自动机输入文本字符串,自动机输出TRUE,说明文本串中存在与模式串相匹配的字符;自动机输出FALSE,说明文本串中不存在与模式串相匹配的字符串.并给出了对比实验及分析. 展开更多
关键词 确定型有穷自动机 BM算法 模式匹配
下载PDF
工程图尺寸标注识别的研究与实现 被引量:10
6
作者 闵卫东 唐泽圣 唐龙 《计算机学报》 EI CSCD 北大核心 1994年第1期9-15,共7页
本文提出了一个识别与理解工程图尺寸标注的算法.根据国标GB4458-84的规定,尺寸标注可分为27种模式和48种子模式.本文提出了箭头匹配的概念,总结了9种箭头匹配模式和15种箭头匹配的前趋分析模式.一个基于9种箭头... 本文提出了一个识别与理解工程图尺寸标注的算法.根据国标GB4458-84的规定,尺寸标注可分为27种模式和48种子模式.本文提出了箭头匹配的概念,总结了9种箭头匹配模式和15种箭头匹配的前趋分析模式.一个基于9种箭头匹配模式的网状文法被用于描述尺寸标注,文中给出了与之相对应的有限确定自动机DFA及尺寸标注识别的实例. 展开更多
关键词 工程图 尺寸标注 识别
下载PDF
正则表达式匹配引擎性能分析 被引量:11
7
作者 邓凯元 姜磊 《计算机与现代化》 2011年第7期105-107,110,共4页
正则表达式具有强大的描述能力,在计算机领域,正则表达式匹配技术应用十分广泛。目前,已经有多个正则表达式匹配引擎,在实际应用中,对于不同的匹配规则集和正则语法,不同的匹配引擎会有不同的性能表现。本文通过对PCRE、Greta、Boost、... 正则表达式具有强大的描述能力,在计算机领域,正则表达式匹配技术应用十分广泛。目前,已经有多个正则表达式匹配引擎,在实际应用中,对于不同的匹配规则集和正则语法,不同的匹配引擎会有不同的性能表现。本文通过对PCRE、Greta、Boost、RE2四种常用正则表达式匹配引擎的性能测试,给出在不用的正则语法情况下的匹配速度,并深入分析不同坏境下适用的正则表达式匹配引擎。对实际系统设计中正则表达式库的选择有指导意义。 展开更多
关键词 正则表达式 PCRE 模式匹配 NFA dfa
下载PDF
深度包检测中一种高效的正则表达式压缩算法 被引量:28
8
作者 徐乾 鄂跃鹏 +1 位作者 葛敬国 钱华林 《软件学报》 EI CSCD 北大核心 2009年第8期2214-2226,共13页
提出一种基于确定的有穷状态自动机(deterministic finite automaton,简称DFA)的正则表达式压缩算法.首先,定义了膨胀率DR(distending rate)来描述正则表达式的膨胀特性.然后基于DR提出一种分片的算法RECCADR(regular expressions cut a... 提出一种基于确定的有穷状态自动机(deterministic finite automaton,简称DFA)的正则表达式压缩算法.首先,定义了膨胀率DR(distending rate)来描述正则表达式的膨胀特性.然后基于DR提出一种分片的算法RECCADR(regular expressions cut and combine algorithm based on DR),有效地选择出导致DFA状态膨胀的片段并隔离,降低了单个正则表达式存储需求.同时,基于正则表达式的组合关系提出一种选择性分群算法REGADR(regular expressions group algorithm based on DR),在可以接受的存储需求总量下,通过选择性分群大幅度减少了状态机的个数,有效地降低了匹配算法的复杂性. 展开更多
关键词 正则表达式 确定的有穷状态自动机(deterministic finite automaton 简称dfa) 深度包检测(deep packet inspection 简称DPI) 多模式匹配算法 入侵检测
下载PDF
基于正则表达式的深度包检测算法 被引量:14
9
作者 丁晶 陈晓岚 吴萍 《计算机应用》 CSCD 北大核心 2007年第9期2184-2186,2193,共4页
在深入分析了DFA状态数对算法性能影响的基础上,提出了一种新的基于正则表达式的深度包检测算法,该算法保证在任意有限的系统资源下算法的时间复杂度空间复杂度最小。在Linux下实现了该算法,并对基于L7-filter模式集合的网络数据包进行... 在深入分析了DFA状态数对算法性能影响的基础上,提出了一种新的基于正则表达式的深度包检测算法,该算法保证在任意有限的系统资源下算法的时间复杂度空间复杂度最小。在Linux下实现了该算法,并对基于L7-filter模式集合的网络数据包进行了大量检测实验。结果表明,与已有的正则表达式算法比较,该算法的时间复杂度和空降复杂度最小。 展开更多
关键词 深度包检测 模式匹配 正则表达式 确定性有限自动机
下载PDF
一组提高存储效率的深度包检测算法 被引量:14
10
作者 于强 霍红卫 《软件学报》 EI CSCD 北大核心 2011年第1期149-163,共15页
随着深度包检测规则数目的剧烈增长,为了适应网络处理的需求,必须对表示正则表达式的DFA(deterministic finite automata,确定的有限自动机)进行高效的存储.一方面,对DFA的状态点数目进行压缩,提出了一种复合的FSM(有限自动机)的构造方... 随着深度包检测规则数目的剧烈增长,为了适应网络处理的需求,必须对表示正则表达式的DFA(deterministic finite automata,确定的有限自动机)进行高效的存储.一方面,对DFA的状态点数目进行压缩,提出了一种复合的FSM(有限自动机)的构造方法,通过对正则表达转化成DFA的状态点数目复杂度的分析,将不同复杂度的正则表达式采用不同的方式构建DFA,使得所有平方级和指数级复杂度的状态点数目降低到了线性级.另一方面,对DFA的状态转移数目进行压缩,给出了一种高效的压缩算法,即WD2FA(weighted delayed input DFA,带权延迟DFA)算法,对于任意复杂度的正则表达式都可以将状态转移数目压缩为原来的5%左右,相对于D2FA(delayed input DFA,延迟的DFA)有更好的压缩能力,并且使得D2FA是WD2FA在权值为0情况下的特例.实验结果表明,有限自动机的状态点数目能够控制在线性级,并且在状态点压缩的基础上将状态转移数目压缩为原来的7%. 展开更多
关键词 深度包检测 正则表达式 多模式匹配 复合的FSM D2FA(delayed input dfa) WD2FA(weighted DELAYED inputdfa)
下载PDF
一种快速高效的模式匹配算法的应用研究 被引量:6
11
作者 王杰 刘亚宾 孙珂珂 《计算机工程与应用》 CSCD 北大核心 2008年第32期93-95,185,共4页
提出一种高性能的模式匹配算法——MAC算法,它通过使用从确定性有限状态机(DFA)中得到的特征等同态,在保证高速匹配的前提下,极大地减少了内存需求。同时,该算法具有高度的灵活性,即通过调整就可以适应不同的特定性能和资源限制的要求... 提出一种高性能的模式匹配算法——MAC算法,它通过使用从确定性有限状态机(DFA)中得到的特征等同态,在保证高速匹配的前提下,极大地减少了内存需求。同时,该算法具有高度的灵活性,即通过调整就可以适应不同的特定性能和资源限制的要求。在软件使用环境中的实验结果表明,MAC算法的内存使用性能相对目前先进的模式匹配算法提高了1.51~2.40倍。 展开更多
关键词 MAC算法 网络入侵检测系统 模式匹配 确定性有限状态机 非确定性有限状态机
下载PDF
基于多模式匹配的数字识别有限自动机的设计
12
作者 应建健 《台州学院学报》 2006年第6期21-23,共3页
基于有限自动机的多模式匹配算法(DFSA算法),设计出同时识别多种数的有限自动机。并给出便于实现的状态图和关键c++代码。
关键词 多模式匹配 有限自动机 确定化 状态转换表
下载PDF
面向用户意图的SQL注入检测方法 被引量:1
13
作者 毛辰宇 郭帆 叶继华 《江西师范大学学报(自然科学版)》 CAS 北大核心 2016年第4期386-391,共6页
Web程序安全的首要威胁是SQL注入攻击,动态分析技术可有效防御此类攻击.提出面向用户意图的检测方法,在程序发布前预先定义Web程序期望的所有数据库操作,在运行时拦截提交至数据库的操作,阻止不符合意图的操作.设计并实现描述数据库操... Web程序安全的首要威胁是SQL注入攻击,动态分析技术可有效防御此类攻击.提出面向用户意图的检测方法,在程序发布前预先定义Web程序期望的所有数据库操作,在运行时拦截提交至数据库的操作,阻止不符合意图的操作.设计并实现描述数据库操作意图的语言SQLIDL,将开发者提供的允许操作集合解释为以确定有限自动机(DFA)表示的字符串集合,并支持表名、列名、列值及存储过程名的正则表示.在Securi Bench测试集的实验表明,该方法可有效检测现有SQL攻击模式且运行开销较小. 展开更多
关键词 SQL注入 动态分析 有限自动机 攻击模式
下载PDF
基于分布式存储的正则表达式匹配算法设计与实现 被引量:3
14
作者 李璋 杜慧敏 张丽果 《计算机科学》 CSCD 北大核心 2013年第3期74-76,99,共4页
深度包检测(Deep Packet Inspection,DPI)是一种先进的包过滤技术,广泛应用于防火墙中。基于正则表达式的模式匹配算法已成为实现DPI的重要方法之一,传统的正则表达式匹配算法的时间复杂度较高,不能实时进行网络安全的防护。为了提高正... 深度包检测(Deep Packet Inspection,DPI)是一种先进的包过滤技术,广泛应用于防火墙中。基于正则表达式的模式匹配算法已成为实现DPI的重要方法之一,传统的正则表达式匹配算法的时间复杂度较高,不能实时进行网络安全的防护。为了提高正则表达式匹配算法的实时性,提出一种基于分布式存储的正则表达式匹配并行算法,该算法通过对数据进行步长计数,采用分布式存储,实现了并行处理。实验分析表明,与传统的串行算法相比,该算法匹配速度至少提高5倍,能够有效降低算法时间复杂度,提高匹配效率。 展开更多
关键词 正则表达式 模式匹配算法 确定型有限状态机 深度包检测 分布式存储
下载PDF
深度包检测中一种正则表达式匹配算法的改进 被引量:1
15
作者 张巍 陈佼 赵美凯 《现代电子技术》 北大核心 2015年第5期87-92,共6页
网络数据包内容检测技术已在网络安全、网络监视、HTTP负载均衡等方面得到广泛的应用,因此,对快速数据包内容的检测就变得异常重要。在数据包内容检测过程中,数据包的净载数据要通过一系列已经定义好的正则表达式模式进行数据匹配。在此... 网络数据包内容检测技术已在网络安全、网络监视、HTTP负载均衡等方面得到广泛的应用,因此,对快速数据包内容的检测就变得异常重要。在数据包内容检测过程中,数据包的净载数据要通过一系列已经定义好的正则表达式模式进行数据匹配。在此,阐述目前数据包检测存在的问题,如传统数据包检测应用程序要求很大的内存空间去存储相应的正则表达式模式,提出一种大大降低对内存空间使用的改进算法。通过将该改进算法应用到以DFA为基础的包检测应用程序中,说明经过真实网络数据来检测算法的改进成果。结果表明了改进算法的有效性。 展开更多
关键词 正则表达式 深度包检测 dfa模式 内存使用
下载PDF
基于正则表达式的协议识别方案 被引量:5
16
作者 王艳 李冬梅 《软件导刊》 2009年第2期47-49,共3页
随着网络服务大量使用随机端口号,传统的基于端口号的协议识别方法不再适用。设计了一种基于正则表达式的协议识别方案。将NFA匹配引擎转换为DFA匹配引擎,提出了构造最优DFA状态数的算法,该算法保证在任意有限的系统资源下具有最小的时... 随着网络服务大量使用随机端口号,传统的基于端口号的协议识别方法不再适用。设计了一种基于正则表达式的协议识别方案。将NFA匹配引擎转换为DFA匹配引擎,提出了构造最优DFA状态数的算法,该算法保证在任意有限的系统资源下具有最小的时间复杂度和空间复杂度。 展开更多
关键词 协议识别 正则表达式 最优dfa状态数 模式匹配
下载PDF
基于FPGA改进电路的高性能正则表达式匹配算法 被引量:1
17
作者 卓艳男 刘强 +1 位作者 姜磊 戴琼 《计算机应用》 CSCD 北大核心 2016年第4期927-930,共4页
针对正则表达式匹配过程中吞吐率低及逻辑资源占用数多的问题,提出一种完全基于现场可编程门阵列(FPGA)逻辑电路的改进确定有限自动机(DFA)匹配算法。首先,该算法统计了DFA中每个状态的大多数转移边都会集中指向相同状态特征的结果... 针对正则表达式匹配过程中吞吐率低及逻辑资源占用数多的问题,提出一种完全基于现场可编程门阵列(FPGA)逻辑电路的改进确定有限自动机(DFA)匹配算法。首先,该算法统计了DFA中每个状态的大多数转移边都会集中指向相同状态特征的结果,随后根据正则表达式的转移矩阵为DFA的每个状态设置一条默认的转移边,最后进行逻辑电路简化处理,并采用L7-filter规则集进行实测。实验结果表明,改进后的DFA方案与非确定有限自动机(NFA)方案相比,有10%~60%的规则获得了更高的吞吐率,62%~87%的规则占用了更少的逻辑资源。 展开更多
关键词 正则表达式 现场可编程门阵列 模式匹配 确定性有穷状态自动机
下载PDF
一种快速且节约存储器的多模式匹配算法
18
作者 张国军 林南晖 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1521-1527,共7页
同时对数百个模式进行比较的多模式匹配算法是入侵侦测/预防系统的一项关键技术.但是在Gbps级的高速网络中,多模式匹配速度仍是一个瓶颈.提出一个基于确定性有限自动机(DFA)的算法,能在一个周期内处理多个字符.该算法将DFA的头部抽取出... 同时对数百个模式进行比较的多模式匹配算法是入侵侦测/预防系统的一项关键技术.但是在Gbps级的高速网络中,多模式匹配速度仍是一个瓶颈.提出一个基于确定性有限自动机(DFA)的算法,能在一个周期内处理多个字符.该算法将DFA的头部抽取出来,构造一个子DFA,称为HeadDFA(HDFA),将其余部分构成另一个子DFA—GeneralDFA(GDFA).针对这两个子DFA,分别设计了两套硬件,并让它们同时运行,然后根据当前状态和各自的匹配情况决定取用哪套硬件的结果.这样不仅可以提高匹配速度,还可以利用两个子DFA之间的联系较大地减小其存储需求. 展开更多
关键词 模式匹配 内容过滤 回滚机制 确定性有限状态机 算法
下载PDF
基于图划分的正则表达式分组算法 被引量:3
19
作者 魏强 李云照 褚衍杰 《计算机工程》 CAS CSCD 2012年第18期137-139,共3页
针对多条正则表达式转换为确定型有限自动机带来的状态空间膨胀问题,借鉴图划分的思想,提出一种改进的分组算法。与原分组算法相比,该算法在分组数相同时状态数平均减少30%,在某些情况下能获得更少的分组数。实验结果证明,该算法能有效... 针对多条正则表达式转换为确定型有限自动机带来的状态空间膨胀问题,借鉴图划分的思想,提出一种改进的分组算法。与原分组算法相比,该算法在分组数相同时状态数平均减少30%,在某些情况下能获得更少的分组数。实验结果证明,该算法能有效降低匹配算法的复杂度。 展开更多
关键词 深度包检测 模式匹配 正则表达式 确定型有限自动机 分组算法 图划分
下载PDF
网络入侵检测中多模式匹配的状态编码方法 被引量:3
20
作者 吴碧海 赵有健 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期612-615,共4页
为了减少网络入侵检测系统的硬件实现方案中自动机占用的存储容量,提出了一种自动机状态的编码方法。该方法通过对自动机状态重新进行编号,使得多个状态能够用一个通配编号来表示,这样自动机中具有相同输入和下一状态的多条变迁就能被... 为了减少网络入侵检测系统的硬件实现方案中自动机占用的存储容量,提出了一种自动机状态的编码方法。该方法通过对自动机状态重新进行编号,使得多个状态能够用一个通配编号来表示,这样自动机中具有相同输入和下一状态的多条变迁就能被聚合为一条,大大减小了需要存储的变迁数目。可以证明状态编码方法能够将变迁数目减小到理论上最小值同时保证自动机恒定的处理速率。实验表明,对于常见特征串集,该方法可以将变迁数目减小98.9%以上。 展开更多
关键词 网络入侵检测系统 多模式匹配 状态编码 自动机
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部