期刊文献+

汉语-维吾尔语的一对一词对齐研究 被引量:1

下载PDF
导出
摘要 描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处理和维吾尔语文本预处理过程:首先将维吾尔语通过专用工具转换为拉丁维文,然后将拉丁维吾尔语中的特殊文字转换成无歧义的字符。词对齐的实现过程:首先使用IBM模型1,其次利用IBM模型2,构建出一个词对齐系统。实验表明,该系统实现的词对齐比GIZA++中实现的正确率可以提高2.6个百分点。
出处 《昌吉学院学报》 2012年第6期80-83,共4页 Journal of Changji University
基金 国家自然基金(60963018) 国家语委科研项目(MZ115-75) 新疆维吾尔自治区高校科研计划青年教师科研基金项目(XJEDU2011S42) 昌吉学院科研基金项目(2011SSQD029)
  • 相关文献

参考文献7

  • 1邓丹,刘群,俞鸿魁.基于双语词典的汉英词语对齐算法研究[J].计算机工程,2005,31(16):45-47. 被引量:8
  • 2[Huang,2000JJin-Xia Huang,and Key-Sun Choi.C- hinese-Korean word alignment based on linguistic c -ompari- son [ C ] .In :Annual Meeting of the Association for Computational Linguistics,2000.392-399.
  • 3Brown P F, Della Pietra S A, Della Pietra V J, et al. The Mathematics of Statistical Machine Translation: Parameter Es- timation[J].Computational Linguistics, 1993, 19(2): 263.
  • 4[Dagan, 1993] Dagan L, Chunch K,et al.Robust bilingual word alignment for machine aided translation[A].Proceed- ings of the Workshop on Very Large corpora:Academic and Industrial Perspectives [ C ],C olumbus, 1993.1 - 8.
  • 5[Gale,1991] Gale,W.and Church,K.Identifying Word Correspondences in Parallel Texts [A].Proceedings of the 4th DARPA Speech and Natural LanguageWorkshop[C], Pacific Grove,CA,1991.152-157.
  • 6Piao, Scott. Word alignment in English-Chinese parallel corpora. Literary and Linguistic Computing, 2002,17 (2). pp. 207-230.
  • 7Okita,Tsuyoshi. Word afignment and smoothing methods in statistical machine translation: Noise, prior knowledge and overfitting. Dublin City University School of Computing,2012.

二级参考文献5

  • 1Ker S J, Chang J S. Align More Words with High Precision for Small Bilingual Corpora[J]. Computational Linguistics and Chinese Language Processing, 1997, 2(2): 63-96
  • 2Huang Jinxia, Key-Sun Choi. Chinese-Korean Word Alignment Based on Linguistic Comparison[C]. In: Annual Meeting of the Association for Computational Linguistics, 2000: 392-399
  • 3刘群 张彤.汉英机器翻译系统扩充词典的建造[C]..机器翻译研究进展(全国机器翻译研讨会论文集)[C].北京:电子工业出版社,2002.25-33.
  • 4Brown P F, Della Pietra S A, Della Pietra V J, et al. The Mathematics of Statistical Machine Translation: Parameter Estimation[J]. Computational Linguistics, 1993, 19(2): 263
  • 5Melamed I D.A Word-to-word Model of Translation Equivalence[C]. In: Proc. of the 35th Conference of the Association for Computational Linguistics, 1997: 490-497

共引文献7

同被引文献48

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部