期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于AC-Trie的在线社交网络文本流热点短语挖掘 被引量:3
1
作者 黄九鸣 吴泉源 +3 位作者 张圣栋 贾焰 刘东 周斌 《电子学报》 EI CAS CSCD 北大核心 2016年第10期2466-2470,共5页
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍... 在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法.此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机.新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%). 展开更多
关键词 文本流 热点短语 ac-trie 文本挖掘 在线社交网络
下载PDF
基于Trie树的哈希表 被引量:3
2
作者 史长琼 唐铭 +1 位作者 张大方 周恺卿 《计算机应用》 CSCD 北大核心 2010年第8期2193-2196,共4页
受到AC算法与链式哈希的启发,提出了一种基于Trie树的哈希表。该算法通过增加一个后继状态计数器,能够为后续的查找等运算提供更加简单和快速的信息。分析与实验表明该算法具有较高的效率、较强的稳定性,且降低了能耗。
关键词 AC算法 TRIE树 分离位的串匹配 链式哈希表 分段哈希表
下载PDF
一种基于Aho-Corasick算法改进的多模式匹配算法 被引量:14
3
作者 陈永杰 吾守尔.斯拉木 于清 《现代电子技术》 北大核心 2019年第4期89-93,共5页
目前互联网中以文本存在的数据非常庞大,针对在如此庞大的文本中如何准确、快速地找到多个不同的目标字符串的问题,在介绍常见的模式匹配算法的优点和缺点基础上,结合Trie速多模式匹配算法。根据对比性实验的结果分析得出,改进AC且匹配... 目前互联网中以文本存在的数据非常庞大,针对在如此庞大的文本中如何准确、快速地找到多个不同的目标字符串的问题,在介绍常见的模式匹配算法的优点和缺点基础上,结合Trie速多模式匹配算法。根据对比性实验的结果分析得出,改进AC且匹配速度大约是AC算法的5倍。 展开更多
关键词 字符串匹配 多模式匹配 TRIE树 双数组 AC算法 匹配速度
下载PDF
一种存储优化的多模式匹配算法
4
作者 段惠超 韩建民 邱晟 《微型机与应用》 2015年第2期14-17,共4页
AC(Aho-Corasick)自动机是经典的多模式匹配算法,但在模式串字符集较大的情况下,AC自动机的存储开销较大。为降低存储开销提出了存储优化的多模式匹配算法SMMA,该算法在Trie树建立阶段利用正向表来存储每个状态的后续状态指针以及失配指... AC(Aho-Corasick)自动机是经典的多模式匹配算法,但在模式串字符集较大的情况下,AC自动机的存储开销较大。为降低存储开销提出了存储优化的多模式匹配算法SMMA,该算法在Trie树建立阶段利用正向表来存储每个状态的后续状态指针以及失配指针,而无需存储字符集所有字符的后继指针,从而压缩了每个状态的储存空间。实验表明,所提出的算法与AC自动机算法在时间效率上相近,但极大地降低了存储开销。 展开更多
关键词 模式匹配 AC自动机 TRIE树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部