基于重解码的神经机器翻译方法研究被引量：7

Research on Neural Machine Translation Based on Re-decoding

下载PDF

导出

摘要基于Transformer的序列转换模型是当前性能最优的机器翻译模型之一。该模型在生成机器译文时,通常从左到右逐个生成目标词,这使得当前位置词的生成不能利用译文中该词之后未生成词的信息,导致机器译文解码不充分从而降低译文质量。为了缓解上述问题,该文提出了基于重解码的神经机器翻译模型,该模型将已生成的机器译文作为目标语言近似上下文环境,对译文中每个词依次进行重解码,重解码时Transformer解码器中遮挡多头注意力仅遮挡已生成译文中的当前位置词,因此,重生成的每个词都能充分利用目标语言的上下文信息。在多个WMT机器翻译评测任务测试集上的实验结果表明:使用基于重解码的神经机器翻译方法显著提高了机器译文质量。 The Transformer is one of the best performing machine translation models.Generating tokens one by one from left to right,this approach lacks the guidance of future contextual information.To alleviate this issue,we propose a neural machine translation model based on re-decoding.The model treats the generated machine translation outputs as approximate contextual environment of the target language,and then re-decodes each token in the machine translation output successively.The masked multi-head attention of the Transformer decoder only masks the current position token in the generated translation output.As a result,every token re-decoded can make full use of its contextual information.Experimental results on several test sets from the WMT show that the quality of machine translation is improved significantly by leveraging the re-decoding.

作者宗勤勤李茂西 ZONG Qinqin;LI Maoxi(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China)

机构地区江西师范大学

出处《中文信息学报》 CSCD 北大核心 2021年第6期39-46,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61662031,61462044)。

关键词神经机器翻译编码器—解码器模型重解码遮挡多头注意力 TRANSFORMER neural machine translation encoder-decoder model re-decode masked multi-head attention Transformer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献72

1刘学.基于字符识别的收割机机器视觉研究[J].农机化研究,2020,42(10):47-50. 被引量：3
2冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
3李茂西,宗成庆.机器翻译系统融合技术综述[J].中文信息学报,2010,24(4):74-84. 被引量：16
4袁小于.基于规则的机器翻译技术综述[J].重庆文理学院学报（自然科学版）,2011,30(3):56-59. 被引量：8
5李洪政,赵凯,胡韧奋,蒋宏飞,朱筠,晋耀红.面向专利领域的汉英机器翻译融合系统[J].情报工程,2017,3(3):105-115. 被引量：7
6刘冰,王守田,宋彬.脑电图双频谱指数监测仪在精准麻醉中的应用[J].中国医学装备,2019,16(1):93-95. 被引量：12
7书国伟,张珏,费智敏.脑电双频指数评估急性脑损伤程度的可行性研究[J].中国神经精神疾病杂志,2019,45(6):370-373. 被引量：10
8谭敏,殷明明,段湘煜.神经机器翻译的系统融合方法[J].厦门大学学报（自然科学版）,2019,58(4):600-607. 被引量：12
9杨云,王全.层聚合的对抗机器翻译模型的方法研究[J].陕西科技大学学报,2020,38(1):164-170. 被引量：1
10陈祖君.基于神经网络机器翻译模型的英文分词研究[J].计算机与数字工程,2020,48(1):13-18. 被引量：9

引证文献7

1尚春磊,李颖俊,张璐.基于数据挖掘的自动化翻译系统优化设计研究与应用[J].自动化与仪器仪表,2023(8):273-276.
2刘文斌,HE Yanqing,LAN Tian,WU Zhenfeng.Research on system combination of machine translation based on Transformer[J].High Technology Letters,2023,29(3):310-317.
3陈媛,陈红.融合底层信息的电气工程领域神经机器翻译[J].河南科技大学学报（自然科学版）,2023,44(6):42-48. 被引量：2
4张昕煜.基于机器视觉技术的生态翻译机器错误文本检测方法设计[J].自动化与仪器仪表,2023(10):179-182.
5刘鹏娟.大规模分布式统计机器翻译离线模型训练研究[J].自动化与仪器仪表,2023(12):18-22. 被引量：1
6庄先艳,郑小琴,秦丹丹,王秀华.面向神经重症患者护理的脑电双频谱指数监测仪优化设计[J].自动化与仪器仪表,2024(1):243-246.
7吕千平,刘敏娜.人工智能翻译背景下融合多粒度形态特征的神经机器翻译系统研究[J].自动化与仪器仪表,2024(5):186-190. 被引量：1

二级引证文献4

1李哲,苗丹,王承林,高娇娇,贾晓雪.一种轻量型有无遮挡混合式人脸识别算法[J].电子设计工程,2024,32(21):156-161.
2包艳艳,王宝妮.人工智能翻译技术研究综述[J].电子产品世界,2024,31(10):55-58.
3韩睿,于复兴,董海琳,韩阳.基于中间态的网络安全机器翻译模型[J].华北理工大学学报（自然科学版）,2025,47(1):43-52.
4陈明芳,向羽琪.电气工程文本机器翻译的译后编辑例析[J].现代语言学,2023,11(12):6052-6059.

1樊凯宁.“如何”的词汇化研究[J].汉字文化,2021(10):116-117.
2李天辰,胡菏,庞晓丽,陈宏,郭锦秀.基于共词分析的我国以护士为主导干预模式研究热点的探讨[J].中国实用护理杂志,2021,37(22):1754-1760. 被引量：3
3贾浩,王煦,季佰军,段湘煜,张民.基于掩码机制的非自回归神经机器翻译[J].厦门大学学报（自然科学版）,2021,60(4):648-654. 被引量：3
4雷兵,刘小,钟镇.基于题录信息的领域学术文献细粒度分类方法研究[J].图书情报工作,2021,65(14):128-137. 被引量：8
5陈练军.[侵|X]词汇构式的历时演变[J].闽南师范大学学报（哲学社会科学版）,2021,35(2):93-100.
6牛长安,葛季栋,唐泽,李传艺,周宇,骆斌.基于指针生成网络的代码注释自动生成模型[J].软件学报,2021,32(7):2142-2165. 被引量：5

中文信息学报

2021年第6期

浏览历史

内容加载中请稍等...

基于重解码的神经机器翻译方法研究被引量：7

同被引文献72

引证文献7

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于重解码的神经机器翻译方法研究 被引量：7

同被引文献72

引证文献7

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于重解码的神经机器翻译方法研究被引量：7