期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于AC-Trie的在线社交网络文本流热点短语挖掘 被引量:3
1
作者 黄九鸣 吴泉源 +3 位作者 张圣栋 贾焰 刘东 周斌 《电子学报》 EI CAS CSCD 北大核心 2016年第10期2466-2470,共5页
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍... 在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法.此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机.新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%). 展开更多
关键词 文本流 热点短语 AC-Trie 文本挖掘 在线社交网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部