摘要
汉语到维吾尔语的自动机器翻译有着重要的现实意义。目前对于汉维统计机器翻译方法的研究相对空白。该文提出了一种以维吾尔语为词干词缀粒度的汉维机器翻译方法。该方法利用维吾尔语形态分析后的词干词缀作为翻译的基本单位,并且根据其黏着语特性提出了一种基于有向图的维吾尔语"词干-词缀"语言模型。基于开放语料的实验证明我们的词干词缀翻译模型以及语言模型显著优于之前的基于词粒度的模型。
Machine translation from Chinese to Uyghur has substantial real applications. Focusing on the insuffi- ciently addressed issue, this paper, proposes a novel Chinese-Uyghur translation method employing stems and suffi- xes in Uyghur are used as the basic translation unit. Based on the directed graph, this "stem-suffix" language model is proved to be significant better than previous word based models.
出处
《中文信息学报》
CSCD
北大核心
2015年第3期201-206,共6页
Journal of Chinese Information Processing
基金
国家自然科学基金(61063026
61032008)
国家社会科学基金(10AYY006)
新疆多语种信息技术重点实验室开放课题