期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文高频词串的抽取及其在语言模型中的应用 被引量:2
1
作者 文娟 王小捷 《北京邮电大学学报》 EI CAS CSCD 北大核心 2009年第5期10-14,共5页
为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型.实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语... 为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型.实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语法模型长距离相依性能较差的缺陷;同时,在模型困惑度、音字转换正确率上均优于已有基于净频次的CFS语言模型. 展开更多
关键词 中文高频词串 字区分 字串切分度 N元模型 音字转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部