期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Aho-Corasick自动机算法的概率模型中文分词CPACA算法 被引量:5
1
作者 徐懿彬 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第2期426-433,共8页
Aho-Corasick自动机算法是著名的多模式串匹配算法,它在模式串失配时,通过fail指针转移至有效的后续状态,存在一个或多个有效的后续状态可能。据此特性,该文提出了一种适应于中文分词的自动机算法。该算法使用动态规划的方法,计算上下... Aho-Corasick自动机算法是著名的多模式串匹配算法,它在模式串失配时,通过fail指针转移至有效的后续状态,存在一个或多个有效的后续状态可能。据此特性,该文提出了一种适应于中文分词的自动机算法。该算法使用动态规划的方法,计算上下文匹配概率,转移至最佳的有效后续状态,即实现了基于字符串匹配的机械分词方法与基于统计概率模型的方法结合。实验结果表明,该算法分词准确率高。 展开更多
关键词 AC自动机 中文分词 动态规划 TRIE树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部