期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种时间复杂度最优的精确串匹配算法 被引量:25
1
作者 贺龙涛 方滨兴 余翔湛 《软件学报》 EI CSCD 北大核心 2005年第5期676-683,共8页
现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地... 现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(logσm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用. 展开更多
关键词 后缀自动机 有限状态自动机 LDM算法 串匹配 复杂度分析
下载PDF
基于混合策略的单模式匹配算法 被引量:3
2
作者 刘传汉 王永成 +1 位作者 刘德荣 李党林 《上海交通大学学报》 EI CAS CSCD 北大核心 2007年第1期36-41,共6页
结合后缀有限自动机和正向有限自动机的优点,提出了两个单模式匹配算法.算法中,无论是后缀自动机还是正向有限自动机,只要扫描到的模式前缀长度R>0或者超过模式长度的1/2时,使用正向有限自动机继续向右进行扫描;否则都滑动m-R个字符... 结合后缀有限自动机和正向有限自动机的优点,提出了两个单模式匹配算法.算法中,无论是后缀自动机还是正向有限自动机,只要扫描到的模式前缀长度R>0或者超过模式长度的1/2时,使用正向有限自动机继续向右进行扫描;否则都滑动m-R个字符,使用后缀自动机反向扫描模式串的前缀.两个算法的最差、最好时间复杂度分别为O(n)和O(n/m).结果表明,在短模式的情况下,两个算法的平均时间复杂度均好于RF和LDM,在小字符集长模式或大字符集短模式的情况下它们的平均性能好于BM. 展开更多
关键词 模式匹配 LDM算法 后缀自动机 有限状态自动机 时间复杂度
下载PDF
一种入侵检测系统的模式匹配算法 被引量:4
3
作者 韩忠秋 刘晓洁 +3 位作者 李涛 梁刚 龚勋 姚隽兮 《计算机应用研究》 CSCD 北大核心 2009年第8期3033-3035,共3页
提出了一种基于后缀树自动机的模式匹配算法,匹配中应用后缀启发机制进行启发跳跃,忽略不必要的比较。实验表明,该方法与传统模式匹配方法相比能有效地加快模式匹配的速度,提高入侵检测效率。
关键词 入侵检测系统 模式匹配 后缀树 自动机
下载PDF
基于后缀自动机的轨迹模式挖掘方法 被引量:1
4
作者 王兴 蒋新华 +1 位作者 蔡伟文 廖律超 《计算机应用研究》 CSCD 北大核心 2016年第2期409-412,416,共5页
基于交通路网研究移动对象轨迹预测,将序列分析方法和马尔可夫统计模型结合,提出了一种基于后缀自动机的变阶马尔可夫模型挖掘方法。该方法根据移动对象的历史轨迹数据进行学习训练,计算轨迹序列上下文的概率特征,建立序列的后缀自动机... 基于交通路网研究移动对象轨迹预测,将序列分析方法和马尔可夫统计模型结合,提出了一种基于后缀自动机的变阶马尔可夫模型挖掘方法。该方法根据移动对象的历史轨迹数据进行学习训练,计算轨迹序列上下文的概率特征,建立序列的后缀自动机模型,结合当前实际轨迹数据,动态自适应预测将来的位置信息。实验结果表明:相比固定阶马尔可夫模型,随着阶数的增加(L≥2),固定阶马尔可夫模型预测的精度逐步降低,而该方法能动态自适应,精度保持在81.3%左右,取得较好的预测效果;同时,该方法只需线性的时间和空间开销,大大降低了存储空间和时间,能实现大规模数据的在线学习。 展开更多
关键词 定阶马尔可夫模型 变阶马尔可夫模型 后缀字典树 后缀自动机 轨迹模式 轨迹预测
下载PDF
基于组合策略的单模式串精确匹配算法 被引量:1
5
作者 许秀林 胡克瑾 《计算机应用》 CSCD 北大核心 2008年第1期232-235,共4页
以仅使用后缀有限自动机的RF算法作为参照对象,对采用组合策略的LDM、ILDM1、ILDM2等算法时间复杂度进行了比较研究。实验表明,LDM和ILDM1算法的时间复杂度要差于RF算法,即组合策略是失效的。实验还发现,ILDM2算法中把模式前缀长度R是... 以仅使用后缀有限自动机的RF算法作为参照对象,对采用组合策略的LDM、ILDM1、ILDM2等算法时间复杂度进行了比较研究。实验表明,LDM和ILDM1算法的时间复杂度要差于RF算法,即组合策略是失效的。实验还发现,ILDM2算法中把模式前缀长度R是否超过模式长度m的1/2作为正向有限自动机暂停匹配的条件,对于中小字母表的模式串的匹配也不是最佳策略。 展开更多
关键词 模式匹配 LDM算法 后缀自动机 有限状态自动机
下载PDF
基于后缀数组改进的全文索引结构研究
6
作者 刘畅 张猛 《吉林大学学报(信息科学版)》 CAS 2013年第2期183-186,共4页
为在网络数据中搜索到所需相关数据,通过对基于后缀数组的全文索引结构的改进研究,设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构———加权有向词图。通过实验证明,加权有向词图在相同问题规模下能降低存储空间,同时... 为在网络数据中搜索到所需相关数据,通过对基于后缀数组的全文索引结构的改进研究,设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构———加权有向词图。通过实验证明,加权有向词图在相同问题规模下能降低存储空间,同时不影响检索的效率,是一种更为高效的全文索引结构。 展开更多
关键词 后缀自动机 全文索引结构 加权有向词图
下载PDF
一种带稀疏间隙约束的并行模式匹配算法 被引量:4
7
作者 周开来 陈红 +2 位作者 熊子绎 李翠平 孙辉 《软件学报》 EI CSCD 北大核心 2018年第12期3799-3819,共21页
带通配符的模式匹配是一个经典的研究问题,带有可变间隙约束的模式匹配是近年来比较热门的研究方向.为适应某些查询精度要求较高的应用领域,提出一种在稀疏间隙约束条件下求解模式匹配完备解的算法SGPM-SAI(pattern matching with spars... 带通配符的模式匹配是一个经典的研究问题,带有可变间隙约束的模式匹配是近年来比较热门的研究方向.为适应某些查询精度要求较高的应用领域,提出一种在稀疏间隙约束条件下求解模式匹配完备解的算法SGPM-SAI(pattern matching with sparse gaps constraint based on suffix automaton index).SGPM-SAI通过对文本串预处理,建立一种称为W-SAM的图索引结构,然后对模式串分段查找End Pos集合,最后以集合归并求交的方法得到模式匹配的完备解.实验结果表明:在不考虑预处理时间的情况下,相比几种最典型的模式匹配算法(KMP,BM,AC,suffixarray),SGPM-SAI算法性能优势显著,至少高出3~5倍.通过与SAIL算法的最新优化版本(SAIL-Gen)进行比较,在稀疏间隙约束条件下,SGPM-SAI的性能要显著优于SAIL-Gen算法.此外,为有效利用现代处理器的大规模并行处理单元,提出了并行优化后的算法Parallel SGPM-SAI.实验结果表明:Parallel SGPM-SAI算法的加速效果显著,且具有良好的并行可扩展性,能够充分利用现代众核处理器的高并行计算优势. 展开更多
关键词 模式匹配 稀疏间隙约束 后缀自动机 并行算法 通配符
下载PDF
一种全文索引的压缩方法
8
作者 杨炜鸿 张猛 《情报科学》 CSSCI 北大核心 2010年第11期1710-1713,共4页
全文索引广泛应用于数据库、数据压缩、模式匹配算法以及信息生物学等领域。本文研究了后缀自动机全文索引结构,针对后缀自动机空间占用大的问题提出了一种边压缩方法。该方法通过后缀链接函数模拟实现自动机的跳转边,从而删除部分跳转... 全文索引广泛应用于数据库、数据压缩、模式匹配算法以及信息生物学等领域。本文研究了后缀自动机全文索引结构,针对后缀自动机空间占用大的问题提出了一种边压缩方法。该方法通过后缀链接函数模拟实现自动机的跳转边,从而删除部分跳转边。在最终的压缩结构中,跳转边的数量与状态数量一致,而在后缀自动机中跳转边的数量是状态数量的一倍。证明了对于因子判定等问题,压缩的后缀自动机与后缀自动机具有相同的时间复杂度。 展开更多
关键词 文本索引 后缀自动机 压缩
原文传递
Aggressive Complex Event Processing with Confidence over Out-of-Order Streams
9
作者 李传文 谷峪 +1 位作者 于戈 Bonghee Hong 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第4期685-696,共12页
In recent years, there has been a growing need for complex event processing (CEP), ranging from supply chain management to security monitoring. In many scenarios events are generated in different sources but arrive ... In recent years, there has been a growing need for complex event processing (CEP), ranging from supply chain management to security monitoring. In many scenarios events are generated in different sources but arrive at the central server out of order, due to the differences of network latencies. Most state-of-the-art techniques process out-of-order events by buffering the events until the total event order within a specified range can be guaranteed. Their main problems are leading to increasing response time and reducing system throughput. This paper aims to build a high performance out-of- order event processing mechanism, which can match events as soon as they arrive instead of buffering them till all arrive. A suffix-automaton-based event matching algorithm is proposed to speed up query processing, and a confidence-based accuracy evaluation is proposed to control the query result quality. The performance of our approach is evaluated through detailed accuracy and response time analysis. As experimental results show, our approach can obviously speed up the query matching time and produce reasonable query results. 展开更多
关键词 complex event processing (CEP) out-of-order suffix-automaton searching-table
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部