期刊文献+

基于译文的英汉双语句子自动对齐 被引量:12

Translation-Based Automatic Alignment of English and Chinese Parallel Corpora
下载PDF
导出
摘要 双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况,它大大地提高了对齐的精度,其效果是令人满意的. Parallel corpora alignment is a important research issue in MT.The current sentence alignment methods include length-based and lexicon-based methods.This paper analyses length-based method and proposes translation-based method:With a dictionary as the bridge,corresponding translation of the words in English text are found in the dictionary and then matched with the translation of Chinese text.The alignment sentences are determined according to an evaluating function and the dynamic programming algorithm.The experimental result shows that this new method greatly improves the precision of sentence alignment.
出处 《计算机工程与应用》 CSCD 北大核心 2000年第12期59-61,共3页 Computer Engineering and Applications
基金 863-306资助!合同号为863-306-ZD03-03-2.
关键词 机器翻译 句子对齐 双语语料库 英汉汉语句子 Machine Translation,sentence alignment,parallel corpora
  • 相关文献

参考文献4

  • 1刘昕 周明 等.基于长度算法的中-英双语文本对齐的试验[J].计算语言学进展与应用,1995,:62-68.
  • 2刘昕,计算机语言学进展与应用,1995年,62页
  • 3Wu Dekai,proceedings of ACL-94,1994年,82页
  • 4Chen S F,Proc.of the 31st Annual Meeting of the ACL,1993年,9页

同被引文献93

引证文献12

二级引证文献85

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部