摘要
针对树转录翻译模型中的规则二元化和解码算法进行深入研究,通过四分化的二元化转换方法减少词汇化同步转录规则的中间项目,通过实时判断中间项目有效性的RR-CKY算法来避免冗余项目生成。实验证明,这两种方法能有效减少解码过程中的中间项目,提高机器翻译解码效率,在一定程度上提高机器翻译效果。
This paper proposes two methods to improve the efficiency of rule binarization and decoding in tree transducer based translation model. The authors convert synchronous transducer rules to four kinds of binary rules to reduce the tem- porary items, and propose RR - CKY decoding algorithm, which can avoid part of redundant items along with decoding. The experiments show that these two methods can reduce the number of temporary items and make decoding faster. They can also improve the quality of machine translation.
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第9期23-29,共7页
New Technology of Library and Information Service
基金
中国科学技术信息研究所重点工作项目"多语言科技信息语义关联网络构建及其应用"(项目编号:ZD2012-3-3)
中国科学技术信息研究所学科建设项目"自然语言处理"(项目编号:XK2012-6)的研究成果之一
关键词
机器翻译
树转录翻译模型
句法分析
RR—CKY算法
Machine translation Tree transducer based translation model Parsing RR - CKY algorithm