-
题名结合向量化方法与掩码机制的术语干预翻译模型
- 1
-
-
作者
张金鹏
段湘煜
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第11期70-76,84,共8页
-
基金
国家自然科学基金(61673289)。
-
文摘
术语干预神经机器翻译模型通常借助人为给定的术语翻译来改变译文,从而改善翻译质量。向量化干预方法为术语干预任务提供了新的范式,但仅考虑将术语与句子信息以向量的形式融合,没有关注术语信息对术语翻译效果的影响。为此,构建一种结合向量化方法与掩码机制的术语干预机器翻译模型,将人为给定的源端术语与目标端术语编码为特征向量,显式地融入机器翻译模型的编码器、解码器以及输出层。在训练阶段,借助掩码机制屏蔽注意力机制中源端术语对应的关键字,增强模型编码器与解码器对术语特征向量的关注。在推理阶段,利用掩码机制优化术语干预输出层的概率分布,进一步提高术语字符的翻译准确率。在WMT 2014德英和WMT 2021英中数据集上的实验结果表明,相较于基于原始向量化方法的Code-Switching机器翻译模型,所提模型的术语翻译准确率分别提升了9.27和2.95个百分点,并且能大幅度提升长术语的翻译准确率。
-
关键词
机器翻译
术语干预
向量化
注意力机制
掩码机制
-
Keywords
machine translation
terminology intervention
vectorization
attention mechanism
mask mechanism
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-