-
题名基于句子分组的中英机器翻译研究
被引量:2
- 1
-
-
作者
赵彧然
孟魁
-
机构
上海交通大学电子信息与电气工程学院
-
出处
《信息网络安全》
CSCD
北大核心
2021年第7期63-71,共9页
-
基金
国家自然科学基金[61772337]。
-
文摘
虽然神经机器翻译模型使用大规模数据集进行训练能够改善翻译模型的表现,但是数据集中有关句子内容类别以及结构的信息并未得到充分利用,模型仍有提高空间。文章提出了一种基于句子分组的神经机器翻译模型架构,在训练之前,首先按照内容类别、句子结构信息对数据集中的句子进行分组,再使用组别标签和平行语料共同对模型进行训练,使得模型能够更充分利用数据集中的信息。大量对比实验证明了分组思想的合理性,基于分组架构训练得到的Transformer模型的翻译结果得到了一定提高,与普通的Transformer模型相比,文章模型的BLEU值最多可以提升1.2。
-
关键词
机器翻译
句子分组
结构信息
-
Keywords
machine translation
sentence grouping
structural information
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-