期刊文献+

基于维吾尔语词干词缀粒度的汉维机器翻译 被引量:12

Chinese-Uyghur Machine Translation based on smallest Translation Units of Stems and Suffixes
下载PDF
导出
摘要 汉语到维吾尔语的自动机器翻译有着重要的现实意义。目前对于汉维统计机器翻译方法的研究相对空白。该文提出了一种以维吾尔语为词干词缀粒度的汉维机器翻译方法。该方法利用维吾尔语形态分析后的词干词缀作为翻译的基本单位,并且根据其黏着语特性提出了一种基于有向图的维吾尔语"词干-词缀"语言模型。基于开放语料的实验证明我们的词干词缀翻译模型以及语言模型显著优于之前的基于词粒度的模型。 Machine translation from Chinese to Uyghur has substantial real applications. Focusing on the insuffi- ciently addressed issue, this paper, proposes a novel Chinese-Uyghur translation method employing stems and suffi- xes in Uyghur are used as the basic translation unit. Based on the directed graph, this "stem-suffix" language model is proved to be significant better than previous word based models.
出处 《中文信息学报》 CSCD 北大核心 2015年第3期201-206,共6页 Journal of Chinese Information Processing
基金 国家自然科学基金(61063026 61032008) 国家社会科学基金(10AYY006) 新疆多语种信息技术重点实验室开放课题
关键词 维吾尔语 机器翻译 汉维翻译 词干 词缀 形态分析 Uyghur machine translation stem suffix morphologicalanalysis
  • 相关文献

参考文献16

  • 1Batuer AISHAN, Maosong SUN. Uyghur-Chinese Statistical Machine Translation by Incorporating Mor- phological Information [J]. Journal of Computational System, 2010,6(10) :3137-3145.
  • 2赵红梅,吕雅娟,贲国生,等.第七届全国机器翻译研讨会(CWMT2011)评测报告[C]//第七届全国机器翻译研讨会论文集,2011:3-31.
  • 3刘凯,王志洋,于惠,等.2011全国机器翻译研讨会计算所系统描述[C]//第七届全国机器翻译研讨会论文集,2011:46-58.
  • 4Brown P F, Pietra V J D, Pietra S A D, et al. The mathematics of statistical machine translation: Param- eter estimation [J]. Computational linguistics, 1993, 19:263-311.
  • 5Koehn P, Och F J, Marcu D. Statistical phrase-based translation [C]//Proceedings of the 2003 Conference of the North American Chapter of the ACL on Human Language Technology-Volume 1, 2003 : 48-54.
  • 6Chiang D. Hierarchical phrase-based translation [J]. Computational Linguistics, 2007, 33: 201-228.
  • 7Xiong D, Liu Q, Lin S. Maximum entropy based phrase reordering model for statistical machine transla- tion [C]//Proceedings of the Association for Computa- tional Linguistics, 2006: 521-528.
  • 8Liu Y, Liu Q, Lin S. Tree-to-string alignment tem- plate for statistical machine translation [C]//Proceed- ings of the 21st International Conference on Computa- tional Linguistics and the 44th annual meeting of the ACL, 2006:609-616.
  • 9阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量:22
  • 10姜文斌,吴金星,长青,那顺乌日图,刘群,赵理莉.蒙古语词法分析的有向图模型[J].中文信息学报,2011,25(5):94-100. 被引量:3

二级参考文献37

共引文献44

同被引文献119

引证文献12

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部