期刊文献+

基于短语的藏汉统计机器翻译系统 被引量:6

下载PDF
导出
摘要 本文针对藏文词法及句法的特点,借助开源统计机器翻译平台,搭建起基于短语的藏汉统计机器翻译系统,重点描述了系统中的藏文编码转换和藏文自动分词的实现方法。最后采用500句新闻领域藏文语料对翻译系统进行测试,取得了Bleu值为0.3425的较好结果。
出处 《科技风》 2012年第17期60-61,共2页
基金 国家自然基金重点项目多民族文字识别及理解的理论与方法研究(61032008)模式识别重点实验室开发课题(201001051) 西北民族大学中央高校基本科研业务费(zyz2011101) 国家科技支撑项目(2009BAH41B04) 甘肃省自然基金项目(1107RJZA157) 国家语委"十二五"科研2011年度一般项目(YB125-2)资助
  • 相关文献

参考文献11

二级参考文献29

  • 1芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量:10
  • 2刘涛,杨秀霞.中国多民族文字信息处理中的Unicode编程[J].计算机工程与设计,2006,27(11):2020-2023. 被引量:12
  • 3阿里甫.库尔班,哈力木拉提.买买提.北大方正维吾尔文文本转换成Unicode标准的文本[J].新疆大学学报(自然科学版),2006,23(3):343-347. 被引量:6
  • 4国家技术监督局.信息技术:信息交换用藏文编码字符集[M].北京:中国标准出版社,1998.
  • 5刘汇丹,芮建武,吴健.藏文网页的编码识别与转换[C]∥中文信息处理前沿进展--中国中文信息学会二十五周年学术会议论文集,2006.
  • 6International Standard ISO/IEC 10646-1 Second Edition:Information technology-Universal Multiple-Octet Coded Character Set(UCS)[R].2000.
  • 7契嘎·德熙嘉措,当周才让.基于信息处理的藏文字的结构[C]//民族语言文字信息技术研究--第十一届全国民族语言信息学术讨论会论文集,北京:西苑出版社.2007:164-173.
  • 8[2]黄曾阳.HNC概念层次网络理论[M].北京:清华大学出版社,1997.
  • 9Daniel Marcu, William Wong. A Phrase-based, Joint Probability Module for Statistical Machine Translation [C]//Proceedings of the ACL-02 Conference on Em- pirical Methods in Natural Language Processing. Mor- ristown, NJ, USA. Association for Computational Linguistics, 2002 : 133-139.
  • 10Dekai Wu. Stochastic inversion transduction grammars and bilingual parsing of parallel corpora [J]. Computa- tional Linguistics, 1997,23 (3) : 377-403.

共引文献23

同被引文献36

引证文献6

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部