期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于哈希和双数组trie树的多层次地址匹配算法 被引量:11
1
作者 徐聪 张丰 +3 位作者 杜震洪 张逸然 陈明 刘仁义 《浙江大学学报(理学版)》 CAS CSCD 2014年第2期217-222,共6页
针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间... 针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间坐标存储在哈希表相应的位置上,加快了空间坐标的检索效率.同时,在地址匹配的过程中,采用双向扫描及哈希运算代替传统的数据库检索方式,提高了地址匹配速率.最后,通过实验对算法的有效性进行了验证. 展开更多
关键词 哈希函数 双数组trie 地址分类 地址规则 地址匹配
下载PDF
一种基于双数组Trie的B2B规则串提取方法 被引量:1
2
作者 李慧 杨炳儒 +1 位作者 潘丽芳 钱文彬 《计算机科学》 CSCD 北大核心 2013年第5期206-208,223,共4页
针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-Array Trie)的规则串提取方法。该方法针对B2B系统中"参数名:参数值"字符串的规则特征构建规则串,生成双数组Trie树;并优先处理分支结点... 针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-Array Trie)的规则串提取方法。该方法针对B2B系统中"参数名:参数值"字符串的规则特征构建规则串,生成双数组Trie树;并优先处理分支结点最多的子树,来提高存储效率。该方法对搜索文本进行一次扫描就能得到所有规则串;通过在规则中加入约束条件,对候选串进行有效过滤,以提高规则串的提取准确率。实验表明,该方法能够降低传统规则串查找的算法复杂度,查找规则串的时间复杂度是O(n)。 展开更多
关键词 双数组trie 垂直搜索 规则串 B2B系统
下载PDF
基于双数组Trie树法的关键字预处理技术及其在CNC语法检验中的应用 被引量:2
3
作者 王子牛 曹凌菲 王岩 《贵州大学学报(自然科学版)》 2010年第1期49-52,61,共5页
语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控... 语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控机床,参照双数组Trie算法的原理,提出了基于双数组Trie算法的关键字预处理技术,并将其成功地应用在语法检验之中,从而使得对NC代码的语法检测更加准确。 展开更多
关键词 双数组trie树算法 关键字预处理 语法检验 CNC
下载PDF
基于双数组Trie树的渔业领域分词研究
4
作者 高艳萍 于红 +3 位作者 尹祥贵 綦孝姬 王春永 赵志强 《安徽农业科学》 CAS 北大核心 2008年第11期4788-4790,共3页
渔业信息分词对渔业信息系统处理的速度和效率有很大的影响。对汉语词典查询算法进行了分析,用基于双数组Trie树机制的汉语词典实现了渔业信息的分词,并与基于双字Hash机制词典的分词方法进行了试验对比,证明双数组Trie树机制的词典比... 渔业信息分词对渔业信息系统处理的速度和效率有很大的影响。对汉语词典查询算法进行了分析,用基于双数组Trie树机制的汉语词典实现了渔业信息的分词,并与基于双字Hash机制词典的分词方法进行了试验对比,证明双数组Trie树机制的词典比基于双字Hash机制的词典有更高的查询速度。 展开更多
关键词 双数组trie 字Hash 渔业信息处理 词典
下载PDF
基于双数组trie树的多模式复杂事件检测方法 被引量:2
5
作者 黄思猛 程良伦 王涛 《计算机工程与应用》 CSCD 北大核心 2019年第4期91-95,共5页
制造物联网中海量实时数据流急需高效的事件检测与处理方法,高效意味着单位时间内使用较小的存储空间处理更多的输入事件。提出一种基于双数组trie树的多模式复杂事件检测方法,通过构建多模式匹配自动机模型减少查询过程中冗余的检测和... 制造物联网中海量实时数据流急需高效的事件检测与处理方法,高效意味着单位时间内使用较小的存储空间处理更多的输入事件。提出一种基于双数组trie树的多模式复杂事件检测方法,通过构建多模式匹配自动机模型减少查询过程中冗余的检测和计算,并利用双数组trie树充分压缩存储空间,从而提高了复杂事件处理的效率。仿真实验表明,提出的方案相比传统的单模式复杂事件检测,具有较小的空间和时间消耗。 展开更多
关键词 制造物联网 复杂事件处理 多模式匹配 自动机模型 双数组trie
下载PDF
基于双数组Trie树的嵌入式TTS系统研究
6
作者 吴龙 吴健 任红民 《现代机械》 2010年第4期67-70,93,共5页
双数组Trie树是汉字分词的一种比较常用的方法。本文对双数组Trie树作了简要的回顾,设计实现了嵌入式TTS系统中利用双数组Trie进行分词的实现算法,提出了在服务器上构造、调整双数组,在嵌入式系统中使用双数组的方法,并对该方法进行了... 双数组Trie树是汉字分词的一种比较常用的方法。本文对双数组Trie树作了简要的回顾,设计实现了嵌入式TTS系统中利用双数组Trie进行分词的实现算法,提出了在服务器上构造、调整双数组,在嵌入式系统中使用双数组的方法,并对该方法进行了实验分析。 展开更多
关键词 双数组trie 汉字分词 TTS 嵌入式
下载PDF
混合信息双数组的未登录词动态识别模型
7
作者 陈皓宇 洪嘉伟 陈致然 《电脑知识与技术》 2021年第26期1-5,13,共6页
未登录词是影响命名实体识别效果的重要因素,现有分词工具在处理未登录词时不仅识别效果欠佳,且存在识别时间较长等问题。为提高分词效果,在现有分词器基础上结合未登录词识别模型,提出了一种基于改进双数组Trie的混合信息未登录词动态... 未登录词是影响命名实体识别效果的重要因素,现有分词工具在处理未登录词时不仅识别效果欠佳,且存在识别时间较长等问题。为提高分词效果,在现有分词器基础上结合未登录词识别模型,提出了一种基于改进双数组Trie的混合信息未登录词动态识别模型MIDAT,将双数组Trie扩展为字符双数组与概率双数组,利用字符双数组存储字符串词段信息,概率双数组存储字符串节点间的成词概率信息,通过不断识别未登录词,动态更新两个双数组Trie。实验结果表明,在相同的数据集下,结合MIDAT的分词器后对于未登录词的分词效果要优于结巴等常用分词器,同时在时间效率上相比传统的未登录词识别模型提升约8倍。 展开更多
关键词 未登录词 双数组trie 互信息 信息熵 N-GRAM
下载PDF
基于Trie树的京剧术语语义词典 被引量:3
8
作者 乐娟 《计算机工程》 CAS CSCD 北大核心 2011年第S1期30-32,共3页
现有的中文分词系统缺少专业分词组件,难以满足特定领域术语分词的需求,导致专业领域分词精确度较低。为此,提出基于Trie树的京剧术语词典。扩展主流词库,通过定义语义代码的方式建立京剧专业术语之间的语义联系,并利用双数组算法实现T... 现有的中文分词系统缺少专业分词组件,难以满足特定领域术语分词的需求,导致专业领域分词精确度较低。为此,提出基于Trie树的京剧术语词典。扩展主流词库,通过定义语义代码的方式建立京剧专业术语之间的语义联系,并利用双数组算法实现Trie。实验结果表明,加入专业术语词典可以提高系统的分词准确率。 展开更多
关键词 中文分词 分词词典 京剧术语 语义词典 双数组trie
下载PDF
汉语词典的快速查询算法研究 被引量:25
9
作者 李江波 周强 陈祖舜 《中文信息学报》 CSCD 北大核心 2006年第5期31-39,共9页
汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TR IE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法。最后以逐字二分法查询性... 汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TR IE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法。最后以逐字二分法查询性能为基准,使用这两种词典询机制进行了词语直接查询和分词查询两种应用的性能测试。经过实验分析,双数组TR IE机制的词典查询算法在查询速度上提高明显,查询速度约是逐字二分法的5倍。双编码机制的的词典查询算法查询速度有一定提高,而且调整机制更加灵活。 展开更多
关键词 计算计应用 中文信息处理 汉语词典查询 双数组trie 编码算法
下载PDF
一种基于统计的分词标注一体化方法 被引量:3
10
作者 褚颖娜 廖敏 宋继华 《计算机系统应用》 2009年第12期55-58,共4页
分词标注是中文信息处理的基础。传统方法的处理步骤大都是首先对文本进行预处理,得到文本的粗分模型,在此基础上对词语进行词性标注。粗分模型集合的大小取决于采用的分词方法,粗分模型的准确性直接影响着后续处理结果的准确性。提出... 分词标注是中文信息处理的基础。传统方法的处理步骤大都是首先对文本进行预处理,得到文本的粗分模型,在此基础上对词语进行词性标注。粗分模型集合的大小取决于采用的分词方法,粗分模型的准确性直接影响着后续处理结果的准确性。提出一种基于统计的分词标注一体化方法即概率全切分标注模型,该方法的特点是将分词、标注两部分工作融为一体同时进行,在利用全切分获得所有可能分词结果的过程中,计算出每种词串的联合概率,同时利用马尔可夫模型计算出每种词串所有可能标记序列的概率,由此得到最可能的处理结果。该方法提高了结果的召回率和准确率,由于在查询词典时采用的是单次查询双数组Trie树索引,因此效率也很高。 展开更多
关键词 分词标注 粗分模型 双数组trie树索引 马尔可夫标注模型 全切分
下载PDF
高阶哈夫曼算法分析与实现
11
作者 叶叶 《电脑编程技巧与维护》 2011年第1期15-20,共6页
介绍了高阶哈夫曼算法的实现原理,详细讨论了高阶建模、码表保存等技术的理论基础和实现方式,并给出了一个切实可行的应用程序。
关键词 哈夫曼 高阶哈夫曼 trie 双数组trie DELPHI
下载PDF
利用频率特征的Trie树索引快速构造算法
12
作者 张启飞 吴吉义 +2 位作者 李文娟 吕红兵 潘雪增 《北京邮电大学学报》 EI CAS CSCD 北大核心 2013年第2期84-88,共5页
随着物联网技术的日益成熟和云计算标准的确立以及各种智能终端的大规模出现,互联网数据呈指数增加,为数据建立索引至关重要,为此提出一种基于词频的Trie树索引快速构造算法,首先对索引字符串进行排序,然后对排序文件进行预处理,预处理... 随着物联网技术的日益成熟和云计算标准的确立以及各种智能终端的大规模出现,互联网数据呈指数增加,为数据建立索引至关重要,为此提出一种基于词频的Trie树索引快速构造算法,首先对索引字符串进行排序,然后对排序文件进行预处理,预处理生成一个三元组,分别由相同字符横向偏移、纵向偏移及字符组成.快速算法依次扫描预处理数据的每一列,根据三元组的偏移跳过相同的字符前缀.实验结果显示,本算法的时间明显少于传统构造算法,优于Aoe的双数组Trie构造算法. 展开更多
关键词 索引构造 快速算法 trie 字符频率 双数组trie
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部