期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进最大匹配算法的中文分词粗分方法 被引量:18
1
作者 周俊 郑中华 张炜 《计算机工程与应用》 CSCD 2014年第2期124-128,共5页
中文粗分和歧义消解是中文分词的两大基本过程。通过引入广义词条和诱导词集,在最大匹配算法基础上提出一种中文分词的粗分方法,以最长广义词匹配为原则进行中文分词,利用诱导词集实现交叉型歧义识别。在保证快速准确切分无歧义汉语语... 中文粗分和歧义消解是中文分词的两大基本过程。通过引入广义词条和诱导词集,在最大匹配算法基础上提出一种中文分词的粗分方法,以最长广义词匹配为原则进行中文分词,利用诱导词集实现交叉型歧义识别。在保证快速准确切分无歧义汉语语句的同时,100%检测并标记有歧义汉语语句中的交叉型歧义,最大程度上简化后续歧义消解过程。通过对含有160万汉字1998年1月人民日报语料测试的结果证明了算法速度、歧义词准确率以及粗分召回率的有效性。 展开更多
关键词 中文分 最大匹配 广义词 诱导
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部