摘要
篇章机器翻译旨在使用计算机将一个篇章从一种语言自动翻译成另一种语言,是机器翻译中一项富有挑战性的任务。近年来,随着神经机器翻译的快速发展,篇章神经机器翻译成为了机器翻译研究的热门方向。研究者们提出了许多基于神经网络的篇章机器翻译模型,并取得了不错的效果。相比于传统句子神经机器翻译,篇章神经机器翻译通过建模并利用篇章级别的上下文信息来产生质量更高的译文。本文首先简单介绍了篇章翻译任务的定义和特点;其次分三个方面对篇章神经机器翻译现有研究进行了介绍:上下文建模、模型训练、模型分析;最后分析了篇章神经机器翻译研究当前面临的主要难点,并探讨未来可能的研究方向。
Document-level machine translation aims to use a computer to automatically translate a whole document from one language to another,which is a challenging task in machine translation.In recent years,with the rapid development of neural machine translation(NMT),document-level NMT has become one of hot research topics in the community of machine translation.Various document-level machine translation models based on neural networks have been proposed and achieved good results.By modeling document-level context information,document-level NMT models significantly outperform conventional sentence-level NMT models.In this paper,we first briefly introduce the definition and characteristics of document-level NMT.Then,we review the studies in three aspects:context modeling,model training and model analysis.Finally,we analyze the main problems currently faced by document-level NMT and discuss possible future research directions.
作者
苏劲松
陈骏轩
陆紫耀
董怡帆
康立言
张海英
SU Jinsong;CHEN Junxuan;LU Ziyao;DONG Yifan;KANG Liyan;ZHANG Haiying(School of Informatics Xiamen University,Xiamen 361005,China)
出处
《情报工程》
2020年第5期4-14,共11页
Technology Intelligence Engineering
基金
国家重点研发计划科技创新2030—“新一代人工智能”重大项目《以中文为核心的多语种自动翻译研究》课题《面向机器翻译的多模态多语言深度融合关键技术》2020AAA0108004
国家自然科学基金面上项目“面向机器翻译的多层次语义表示研究”(61672440)
福建省杰出青年基金项目“多源神经机器翻译关键技术研究与应用”(2020J01312146)。