-
题名融合覆盖机制的多模态神经机器翻译
被引量:6
- 1
-
-
作者
李志峰
张家硕
洪宇
尉桢楷
姚建民
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第3期44-55,共12页
-
基金
国家自然科学基金(61672367,61672368,61703293)。
-
文摘
多模态神经机器翻译是指直接采用神经网络,以端到端方式融合图像和文本两种模态信息,以此进行翻译建模的机器学习方法。传统多模态机器翻译,是在将源语言翻译成目标语言时,借助图像中的重要特征信息优化翻译过程。但是观察发现,图像里的信息不一定出现在文本中,对翻译也会带来干扰;与参考译文对比,翻译结果中出现了过翻译和欠翻译的情况。针对以上问题,该文提出一种融合覆盖机制双注意力解码方法,用于优化现有多模态神经机器翻译模型。该模型借助覆盖机制分别作用于源语言和源图像,在注意力计算过程中,可以减少对过去重复信息的关注。在WMT16、WMT17测试集上进行实验,验证了上述方法的有效性,在WMT16英德和英法以及WMT17英德和英法测试集上,对比基准系统BLEU值分别提升了1.2,0.8,0.7和0.6个百分点。
-
关键词
多模态神经机器翻译
覆盖机制
过翻译及欠翻译
-
Keywords
multimodal neural machine translation
coverage mechanism
over-translation and under-translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-