-
题名基于同步树序列替换文法的统计机器翻译模型
被引量:2
- 1
-
-
作者
蒋宏飞
李生
张民
赵铁军
杨沐昀
-
机构
哈尔滨工业大学计算机科学与技术学院机器智能与翻译研究室
新加坡信息通讯研究所
-
出处
《自动化学报》
EI
CSCD
北大核心
2009年第10期1317-1326,共10页
-
基金
国家自然科学基金重点项目(60736014)
国家高技术研究发展计划(863计划)重点项目(2006AA010108)资助~~
-
文摘
基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具有解决以上问题的潜力,因而越来越受到研究者们的重视.然而现有的大多数基于句法的模型都因严格的句法限制而制约了模型的描述能力.为突破这种限制并将基于短语的模型的优点融入到句法模型中,本文提出一种基于同步树序列替换文法(Synchronous tree sequence substitution grammar,STSSG)的统计机器翻译模型.在此模型中,树序列被用作为基本的翻译单元.在这种框架下,不满足句法限制的翻译等价对和满足句法限制的翻译等价对都可以融入句法信息并被翻译模型所使用.从而,两种模型的优点均得到充分利用.在2005年度美国国家标准与技术研究所(NIST)举办的机器翻译评比的中文翻译任务语料上的实验表明,本文提出的模型显著地超过了两个基准系统:基于短语的翻译系统Moses和一个基于严格树结构的句法翻译模型.
-
关键词
统计机器翻译
句法限制
同步文法
同步树替换文法
同步树序列替换文法
-
Keywords
Statistical machine translation (SMT), syntactic constraint, synchronous grammar, synchronous tree substitution grammar, synchronous tree sequence substitution grammar (STSSG)
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于同步树替换文法的统计机器翻译模型
被引量:1
- 2
-
-
作者
蒋宏飞
李生
付国宏
赵铁军
张民
-
机构
哈尔滨工业大学计算机科学与技术学院
黑龙江大学计算机科学技术学院
Institute for Infocomm Research
-
出处
《软件学报》
EI
CSCD
北大核心
2009年第5期1241-1253,共13页
-
基金
国家自然科学基金No.60736014
国家高技术研究发展计划(863)No.2006AA010108~~
-
文摘
提出一种基于同步树替换文法的机器翻译模型.相对于基于短语的模型,此模型可以对远距离结构性调序和非连续短语翻译进行建模;相对于基于同步上下文无关文法模型,此模型可以对任何层次上的树节点调序进行建模.因此,该模型可以为处理语言结构间的异构对应问题提供有效的解决途径.在两组风格差异较大的数据集上进行的实验均验证了基于同步树替换文法的模型相对于基于短语模型和基于同步上下文无关文法模型的稳定优势.
-
关键词
机器翻译
同步树替换文法
树到树模型
全局调序
异构对应
-
Keywords
machine translation
synchronous tree-substitution-grammar
tree-to-tree model
global reordering
non-isomorphic tree-to-tree mapping
-
分类号
H085
[语言文字—语言学]
-