期刊文献+

基于汉英双语语料库的翻译等价单位自动获取研究 被引量:17

Extraction of Translation Equivalent Pairs fromChinese-English Parallel Corpus
下载PDF
导出
摘要 双语语料库在机器翻译或机器辅助翻译研究中的重要作用已经越来越多地得到研究人员的认可。本文探讨了如何利用汉英双语语料进行汉英翻译等价单位的抽取,提出了基于词语关联度进行多词组合单位的识别方法,并利用假设-检验的方法,在汉英双语语料库中抽取翻译等价单位。本文还对不同的关联度量方法进行了对比,并提出利用范畴假设改进抽取算法的效率。 More and more researchers have recognized the potential value of the parallel corpus in the research on Machine Translation and Machine Aided Transl ation. This paper examines how the translation equivalent pairs could be extract ed from parallel corpus. An iterative algorithm based on degree of word associat ion is proposed to identify the multiword units for Chinese and English. Then a hypothesis-testing approach is used to extract the Chinese-English Translation Equivalent Pairs. We also made comparison between different statistical associa tion measurement and proposed to use categorical hypothesis to improve the perfo rmance of extraction.
作者 常宝宝
机构地区 北京大学
出处 《术语标准化与信息技术》 2002年第2期24-29,共6页 Terminology Standardization & Information Technology
关键词 英语 汉语 双语语料库 翻译等价单位 自动抽取 bilingual corpus, translation equivalent pair, automatic extraction of TEPs
  • 相关文献

参考文献8

二级参考文献87

共引文献49

同被引文献173

引证文献17

二级引证文献102

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部