期刊文献+
共找到248篇文章
< 1 2 13 >
每页显示 20 50 100
Trie+结构函数式建模、机械化验证及其应用
1
作者 左正康 柯雨含 +3 位作者 黄箐 王玥坤 曾志城 王昌晶 《软件学报》 EI CSCD 北大核心 2024年第9期4242-4264,共23页
Trie结构是一种使用搜索关键字来组织信息的搜索树,可用于高效地存储和搜索字符串集合.Nipkow等人给出了实现Trie的Isabelle建模与验证,然而其Trie在存储和操作时存在大量的冗余,导致空间利用率不高,且仅考虑英文单模式下查找.为此,基... Trie结构是一种使用搜索关键字来组织信息的搜索树,可用于高效地存储和搜索字符串集合.Nipkow等人给出了实现Trie的Isabelle建模与验证,然而其Trie在存储和操作时存在大量的冗余,导致空间利用率不高,且仅考虑英文单模式下查找.为此,基于索引即键值的思想提出了Trie+结构,相较于传统的索引与键值分开存储的结构能减少50%的存储空间,大大提高了空间利用率.并且,对Trie+结构的查找、插入、删除等操作给出了函数式建模及其严格的机械化验证,保证操作的正确性和可靠性.进一步,提出一种匹配算法的通用验证规约,旨在解决一系列的匹配算法正确性验证问题.最后,基于Trie+结构与匹配算法通用验证规约,建模和验证了函数式中英文混合多模式匹配算法,发现并解决了现有研究中的基于完全哈希Trie的多模式匹配算法的模式串前缀终止的Bug.该Trie+结构以及验证规约在提高Trie结构空间利用率和验证匹配算法中,有一定的理论和应用价值. 展开更多
关键词 trie+ 函数式建模 机械化验证 多模式匹配算法
下载PDF
基于扩展Trie树的中文敏感词变体检测
2
作者 赵天舒 沈颖 +2 位作者 李柏岩 刘晓强 朱旻 《智能计算机与应用》 2024年第4期215-221,共7页
网络语言表达方式的随意性和自由性使词语变体在网页上经常出现,给网页信息安全带来了挑战。本文针对中文敏感词变体检测问题,提出一种基于扩展Trie树的敏感词变体快速检测方法。首先,对中文敏感词变体类型进行归类,结合中文敏感词特点... 网络语言表达方式的随意性和自由性使词语变体在网页上经常出现,给网页信息安全带来了挑战。本文针对中文敏感词变体检测问题,提出一种基于扩展Trie树的敏感词变体快速检测方法。首先,对中文敏感词变体类型进行归类,结合中文敏感词特点,通过增强节点内信息和节点间联系构建扩展Trie树;再依据中文变体的生成规则检索Trie树;最后,使用基于BERT的二分类算法对结果进行二次判别,降低误检率。实验表明:该算法精准度达到98.69%,召回率达到94.25%,能够识别常见的中文敏感词变体并在时间效率上满足应用需求。 展开更多
关键词 敏感词 词语变体 trie BERT
下载PDF
基于无冲突哈希Trie树的IP分类算法的研究 被引量:2
3
作者 刘惠义 董志勇 +1 位作者 秦益 郑晓东 《计算机与现代化》 2004年第5期29-31,共3页
随着计算机网络的快速发展,IP分类算法被广泛地应用于路由器、防火墙和流量计费等软件中。本文在基于无冲突哈希Trie树的快速IP分类算法的基础上给出了一组哈希函数,进一步增强了算法的灵活性。
关键词 IP分类算法 哈希函数 GRID of trieS 无冲突哈希trie 路由器 多维匹配
下载PDF
基于遗传算法的文件满TRIE结构最小化问题研究
4
作者 程世辉 《计算机工程》 CAS CSCD 北大核心 2002年第2期147-148,154,共3页
提出了用遗传算法寻求一个检索顺序来构造文件较小或最小的满结构的方法。
关键词 trie结构 trie结构 算法 遗传算法 文件 数据结构 最小化问题 计算机
下载PDF
一种带改进密钥样本函数的Trie树算法
5
作者 董永强 《许昌学院学报》 CAS 2021年第2期98-102,共5页
针对Trie树算法在进行字符搜索会造成内存访问效率低下等问题,提出一种带改进密钥样本函数的Trie树算法.在Trie算法中引入叶节点和分支节点,通过新的搜索方式来改善Trie树的搜索效率,以提升空间利用率,并减少Trie树的搜寻层级.通过对多... 针对Trie树算法在进行字符搜索会造成内存访问效率低下等问题,提出一种带改进密钥样本函数的Trie树算法.在Trie算法中引入叶节点和分支节点,通过新的搜索方式来改善Trie树的搜索效率,以提升空间利用率,并减少Trie树的搜寻层级.通过对多个密钥词搜索结果进行对比,验证了所提出算法是科学合理的. 展开更多
关键词 trie树算法 改进trie树算法 密钥样本函数 搜索效率
下载PDF
基于无冲突哈希Trie树的IP分类算法的研究
6
作者 罗金玲 刘罗仁 《电脑知识与技术》 2007年第4期140-140,共1页
本文提出了一种基于无冲突哈希Trie树的IP分类算法。该算法不仅克服了GridofTries算法在多维IP分类方面的局限性,而且在时间和空闻性能上都优于GridofTries,是目前时间复杂性和空间复杂性方面综合性能比较好的分类算法。
关键词 IP分类算法 无冲突哈希trie GRID oftries
下载PDF
基于哈希和双数组trie树的多层次地址匹配算法 被引量:11
7
作者 徐聪 张丰 +3 位作者 杜震洪 张逸然 陈明 刘仁义 《浙江大学学报(理学版)》 CAS CSCD 2014年第2期217-222,共6页
针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间... 针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间坐标存储在哈希表相应的位置上,加快了空间坐标的检索效率.同时,在地址匹配的过程中,采用双向扫描及哈希运算代替传统的数据库检索方式,提高了地址匹配速率.最后,通过实验对算法的有效性进行了验证. 展开更多
关键词 哈希函数 双数组trie 地址分类 地址规则 地址匹配
下载PDF
双数组Trie树算法优化及其应用研究 被引量:29
8
作者 王思力 张华平 王斌 《中文信息学报》 CSCD 北大核心 2006年第5期24-30,共7页
本文对双数组Trie树(Doub le-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点。这种优化策略可以在保证该算法数据查找效率不变的同时,进一步减少数据稀疏,提高空间利用率。我们基于... 本文对双数组Trie树(Doub le-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点。这种优化策略可以在保证该算法数据查找效率不变的同时,进一步减少数据稀疏,提高空间利用率。我们基于该优化算法实现了一个词典管理程序,并与利用其他索引机制的词典进行了实验对比。实验结果表明,利用优化的双数组Trie树算法的词典不仅在查询速度上优于用其他索引机制的词典,而且存储数据的空间占用也比较小。 展开更多
关键词 计算机应用 中文信息处理 双数组 trie 词典 分词
下载PDF
Trie树路由查找算法在网络处理器中的实现 被引量:11
9
作者 张琦 金胤丞 +1 位作者 李苗 章建雄 《计算机工程》 CAS CSCD 2014年第1期98-102,共5页
Trie树数据结构的实现方法灵活,所需存储器空间小,是实现高速路由查找和分组转发的理想选择。为满足10 Gb/s线速度网络处理器中微引擎的设计要求,提出一种基于最优平衡、多层存储的Trie树路由查找算法。建立一种平衡的压缩树结构,将该... Trie树数据结构的实现方法灵活,所需存储器空间小,是实现高速路由查找和分组转发的理想选择。为满足10 Gb/s线速度网络处理器中微引擎的设计要求,提出一种基于最优平衡、多层存储的Trie树路由查找算法。建立一种平衡的压缩树结构,将该树中相邻的多层节点压缩到一个存储节点中。通过构造特定的数据存储结构来减小树的搜索深度,以空间换取时间,从而提高路由查找速度和分组转发效率。在网络处理器的查找微引擎设计中实现Trie路由查找算法,实验结果表明,单个微引擎的查找速度为4.4 Mb/s,能达到节省存储空间、提高查找效率的效果。 展开更多
关键词 网络处理器 路由查找 最长前缀匹配 路径压缩 trie 算法实现
下载PDF
基于双数组Trie树中文分词研究 被引量:16
10
作者 赵欢 朱红权 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第5期77-80,共4页
对双数组Trie树(Double-Array Trie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个... 对双数组Trie树(Double-Array Trie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个中文分词系统,并与其他几种分词方法进行对比,结果表明,优化后的双数组Trie树插入速度和空间利用率得到了很大提高,且分词查询效率也得到了提高. 展开更多
关键词 自然语言处理 双数组 trie 词典 分词
下载PDF
基于多槽哈夫曼Trie树的规则引擎快速匹配算法 被引量:3
11
作者 罗谦 唐常杰 +1 位作者 于磊 郑皎凌 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2011年第5期102-108,共7页
为了提高机场类企业数据在海量规则集合中的匹配能力,提出了基于多槽哈夫曼Trie树(MSTHTrie)的规则引擎快速匹配算法。该算法充分利用了规则点属性名数与规则条数之间的不对称特性,将对规则的线性比对转换为对多槽的并行比对,从而在稳... 为了提高机场类企业数据在海量规则集合中的匹配能力,提出了基于多槽哈夫曼Trie树(MSTHTrie)的规则引擎快速匹配算法。该算法充分利用了规则点属性名数与规则条数之间的不对称特性,将对规则的线性比对转换为对多槽的并行比对,从而在稳定的空间复杂度下提高了规则引擎的匹配效率。首先对通用规则进行了严格的形式化描述,并在合理假设条件下证明了槽内规则分布命题和动作数定理;然后基于动作数定理提出了简化操作符的MSH tree算法;随之扩展操作类型提出了MSHTrie算法,使规则引擎有了普适性;最后在国内枢纽机场的业务数据上完成对比实验,表明新算法在空间复杂度上较传统线性匹配算法节约了52.6%,匹配性能上与Policytree算法相比提高了21.3%。 展开更多
关键词 规则引擎 匹配 多槽 哈夫曼树 trie
下载PDF
基于Trie树的相似字符串查找算法 被引量:10
12
作者 刘丽霞 张志强 《计算机应用》 CSCD 北大核心 2013年第8期2375-2378,共4页
基于Trie树的相似字符串查找算法是利用编辑距离的阈值来计算每个节点的活跃节点集,已有算法由于存在大量的冗余计算,导致时间复杂度和空间复杂度都比较高。针对这个问题,采用了基于活跃节点的对称性和动态规划算法的思想对已有算法进... 基于Trie树的相似字符串查找算法是利用编辑距离的阈值来计算每个节点的活跃节点集,已有算法由于存在大量的冗余计算,导致时间复杂度和空间复杂度都比较高。针对这个问题,采用了基于活跃节点的对称性和动态规划算法的思想对已有算法进行改进,并对活跃节点集进行了修剪,提出了New-Trie-Stack算法。该算法避免了活跃节点的重复计算,以及已有算法在保存所有已遍历节点的活跃节点集时的空间开销。实验结果表明New-Trie-Stack算法在时间复杂度和空间复杂度上都有明显的下降。 展开更多
关键词 trie 相似字符串 编辑距离 活跃节点 动态规划
下载PDF
基于Trie树的哈希表 被引量:3
13
作者 史长琼 唐铭 +1 位作者 张大方 周恺卿 《计算机应用》 CSCD 北大核心 2010年第8期2193-2196,共4页
受到AC算法与链式哈希的启发,提出了一种基于Trie树的哈希表。该算法通过增加一个后继状态计数器,能够为后续的查找等运算提供更加简单和快速的信息。分析与实验表明该算法具有较高的效率、较强的稳定性,且降低了能耗。
关键词 AC算法 trie 分离位的串匹配 链式哈希表 分段哈希表
下载PDF
基于LE-Trie的防火墙策略检测算法 被引量:4
14
作者 梁建武 龙晓梅 刘军军 《计算机工程》 CAS CSCD 北大核心 2010年第22期134-136,共3页
防火墙策略是一系列具体的规则集合,策略的制定对防火墙功能的发挥至关重要,不能存在异常情况。为此,研究基于惰性展开的Trie数据结构,利用LE-Trie结构存储规则表,提出一种防火墙策略的冲突检测与消除算法。仿真结果表明,与使用普通Tri... 防火墙策略是一系列具体的规则集合,策略的制定对防火墙功能的发挥至关重要,不能存在异常情况。为此,研究基于惰性展开的Trie数据结构,利用LE-Trie结构存储规则表,提出一种防火墙策略的冲突检测与消除算法。仿真结果表明,与使用普通Trie结构的算法相比,该算法具有更高的执行效率。 展开更多
关键词 网络安全 防火墙策略 LE—trie结构 规则冲突
下载PDF
基于双数组Trie树的中文分词词典算法优化研究 被引量:8
15
作者 杨文川 刘健 于淼 《计算机工程与科学》 CSCD 北大核心 2013年第9期127-131,共5页
基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表... 基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表中存放空序列之前的所有空序列个数之和,而后运用iDAT算法进行插入。本算法借鉴了单模式匹配的Sunday算法中的跳跃思想,在适当增加空间开销的基础上,降低了Trie树在动态插入过程中的平均时间复杂度,在实际操作过程中有着良好的性能。 展开更多
关键词 双数组 trie 时间复杂度 分词词典
下载PDF
Dtrie-allpair:高效的集合T-覆盖连接算法 被引量:2
16
作者 贾连印 奚建清 +3 位作者 李孟娟 游进国 刘勇 苗德成 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第6期109-117,共9页
传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任... 传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任何候选集,有效解决了高候选集产生的问题,克服了传统算法因生成并验证候选集而带来的开销.文中还研究了数据库中记录的顺序及记录中元素顺序对Dtrie-allpair算法性能的影响,并在msweb、msnbc两个数据集下对Dtrie-allpair算法与All-pair、PPJoin算法进行对比.结果表明:Dtrie-allpair算法具有明显的优势,覆盖阈值较小时优势更明显;对msweb数据集,阈值为2时,Dtrie-allpair算法的效率相对于All-pair、PPJoin算法提高近两个数量级;通过对数据集进行频率降序和长度升序组合预处理可大幅降低Dtrie-allpair算法访问的trie结点数量,从而显著提升性能. 展开更多
关键词 集合相似度 T-覆盖连接 覆盖阈值 基于trie的动态索引 All-pair算法 PP-Join算法 频率降序 长度升序
下载PDF
一种基于哈希表和Trie树的快速IP路由查找算法 被引量:7
17
作者 崔尚森 张白一 《计算机工程与应用》 CSCD 北大核心 2005年第9期156-158,共3页
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。... Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。算法综合考虑了IP地址的分布特点,兼顾了查找速度、存储空间利用、硬件实现,以及向IPv6过渡等几个因素。具有算法简单、查找速度较快、存储空间利用率较高、易于扩展和便于硬件实现等特点。 展开更多
关键词 路由查找 最长前缀匹配 哈希 trie
下载PDF
基于Trie树的词语左右熵和互信息新词发现算法 被引量:12
18
作者 郭理 张恒旭 +1 位作者 王嘉岐 秦怀斌 《现代电子技术》 北大核心 2020年第6期65-69,共5页
由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字... 由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字符,将每个字与其右邻的字组成二元组;然后利用左右信息熵和互信息进行成词概率的计算,根据计算到的成词概率和词频筛选出新词;并且设计了三个实验,验证了算法的有效性和可行性。实验结果表明,该新词发现算法成词准确率较高,比其他新词发现算法时间效率有较大的提高,对于中文分词结果的优化起到重要的作用。 展开更多
关键词 新词发现算法 左右熵 互信息 trie 算法设计 对比验证
下载PDF
基于随机分布的多比特Trie树IP数据包分类算法研究 被引量:2
19
作者 尚凤军 潘英俊 +1 位作者 潘雪增 毕斌 《通信学报》 EI CSCD 北大核心 2008年第7期109-117,共9页
在无冲突散列算法和多比特Trie树算法的基础上,提出了一种基于随机分布的IP分类算法,该算法的核心有3点:一是基于目的/源端口和协议域构造无冲突散列,由于该三域的组合数目非常少,避免了空间爆炸;二是将目的/源IP连成比特串后分为4块,每... 在无冲突散列算法和多比特Trie树算法的基础上,提出了一种基于随机分布的IP分类算法,该算法的核心有3点:一是基于目的/源端口和协议域构造无冲突散列,由于该三域的组合数目非常少,避免了空间爆炸;二是将目的/源IP连成比特串后分为4块,每块16bit,并将其中一块映射到一随机空间,将随机数和其余3块进行异或,获得分类索引值,并用此值生成多比特Trie树,一般情况下减小了空间和时间复杂度;三是在Trie树终点存放最终分类规则的索引值,为了保证查找到的规则的正确性,对每一个索引值的源/目的IP地址均匹配一次。通过以上3点改进一般要降低算法的时间复杂度和空间复杂度,通过仿真,当对10000条分类规则进行包分类时,该算法的包分类速度可以达到2Mpacket/s,所消耗的最大内存为1MB。 展开更多
关键词 IP分类 查找算法 多比特trie 随机分布
下载PDF
最长前缀匹配查找的索引分离trie树结构及其算法 被引量:5
20
作者 崔尚森 冯博琴 《计算机工程与应用》 CSCD 北大核心 2005年第20期131-134,共4页
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。索引分离trie树结构建立了具有k比特的一级索引,m比特的二级索引和步宽为s、最大深度为m/s的多分支trie树... Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。索引分离trie树结构建立了具有k比特的一级索引,m比特的二级索引和步宽为s、最大深度为m/s的多分支trie树结构。在这种数据结构中进行最长前缀匹配查找的算法复杂度为:O(m/s+2)。它具有算法简单、查找速度快、易于更新、便于向IPv6过渡等特点,是一种综合性能较好的快速最长前缀匹配查找算法。 展开更多
关键词 最长前缀匹配 索引表 trie 快速查找 快速更新
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部