期刊文献+

基于2-gram语言模型的哈萨克文语料库校对研究 被引量:1

Kazakh Corpus Proofreading Research Based on 2-gram Language Model
下载PDF
导出
摘要 研究了带有位置信息的2-garm音节模型,根据音节切分后前后音节的位置信息和同现概率来判断非词错误,再根据最短编辑距离和viterbi算法来提供候选词.根据2元单词模型,对输入文本以句子为单位,从判断前后2元单词的同现概率来判断真词错误,并提供候选词. In this paper,it is studying 2-gram syllable model with position information,according to the syllable before and after position information,after syllable segmentation and together present probability to judge non-word errors,then using minimum edit distance algorithm and viterbi algorithm to offer candidate words. Dividing input texts into sentences based on 2-gram word model,so as to judge real word errors by together present probability of 2-gram words before and after,also offering candidate words.
作者 伊力亚尔
出处 《伊犁师范学院学报(自然科学版)》 2010年第3期50-53,共4页 Journal of Yili Normal University:Natural Science Edition
关键词 语料库 2-gram模型 音节切分 VITERBI算法 corpus 2-gram model syllable segmentation viterbi algorithm
  • 相关文献

参考文献10

二级参考文献43

共引文献126

同被引文献1

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部