期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词共现有向图的中文合成词提取算法 被引量:4
1
作者 刘兴林 郑启伦 马千里 《计算机工程》 CAS CSCD 北大核心 2011年第23期177-180,共4页
分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜... 分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜索多源点长度最长且权重值满足给定条件的路径,该路径所对应的词串即为合成词。实验结果显示,该算法的合成词提取正确率达到91.16%。 展开更多
关键词 合成词提取 词性探测 词共现有向图 自然语言处理 Bellman-Ford算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部