期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
汉语中新词识别方法研究
1
作者 王倩倩 范通让 《河北省科学院学报》 CAS 2014年第2期35-40,共6页
随着互联网和社会的飞速发展,新词不断涌现。识别和整理这些新词语,是中文信息处理中的一个重要研究课题。提出一种新词识别方法,该方法利用基于PAT-Array的重复字符串抽取候选串,提高了新词的召回率。并在此基础上分析新词内部模式,添... 随着互联网和社会的飞速发展,新词不断涌现。识别和整理这些新词语,是中文信息处理中的一个重要研究课题。提出一种新词识别方法,该方法利用基于PAT-Array的重复字符串抽取候选串,提高了新词的召回率。并在此基础上分析新词内部模式,添加了垃圾串过滤机制。单字串过滤主要是运用垃圾词典的方法,多字词模式新词的确定是利用改进的互信息与独立成词概率结合的方法。由此,大幅度提高了新词识别的准确率。 展开更多
关键词 新词 PAT-Array 互信息 垃圾串过滤 内部模式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部