基于掩码机制的非自回归神经机器翻译被引量：3

Masking mechanism based non-autoregressive neural machine translation

下载PDF

导出

摘要当前基于自注意力机制的神经机器翻译模型取得了长足的进展,但是采用自回归的神经机器翻译在解码过程中无法并行计算,耗费时间过长.为此,提出了一个采用非自回归的神经机器翻译模型,可以实现并行解码,并且只使用一个Transformer的编码器模块进行训练,简化了传统的编码器-解码器结构.同时在训练过程中引入了掩码机制,减小了与自回归的神经机器翻译的翻译效果差距.相比于其他非自回归翻译模型,该模型在WMT 2016罗马尼亚语-英语翻译任务上取得了更好的效果,并且在使用跨语言预训练语言模型初始化后,取得了和自回归神经机器翻译模型相当的结果. At present,the neural machine translation model based on self-attention mechanism has made great progress.However,the neural machine translation based on autoregressive algorithm can not perform parallel computation in the decoding process,resulting in consuming too much time.We propose a non-autoregressive neural machine translation model,which can realize parallel computing.Only one encoder module of Transformer is used for training,thus simplifying the traditional encoder-decoder structure.At the same time,in the training process,we introduce a mask mechanism to reduce the gap between non-autoregressive neural machine translation and autoregressive neural machine translation.Compared with other non-autoregressive translation models,we have achieved more satisfactory results in WMT 2016 Romanian-English translation tasks,and achieved performances comparable to autoregressive translation models when initialized with cross-lingual pre-trained language models.

作者贾浩王煦季佰军段湘煜张民 JIA Hao;WANG Xu;JI Baijun;DUAN Xiangyu;ZHANG Min(School of Computer Science and Technology,Soochow University,Suzhou 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2021年第4期648-654,共7页 Journal of Xiamen University：Natural Science

基金国家自然科学基金(61673289)。

关键词神经机器翻译掩码机制非自回归 neural machine translation masking mechanism non-autoregressive

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：107
2李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：109
3刘群.统计机器翻译综述[J].中文信息学报,2003,17(4):1-12. 被引量：71

二级参考文献15

1俞士汶等.机器翻译译文质量自动评估系统[A]..中国中文信息学会1991年会论文集[C].,.314—319.
2Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Pietra, Fredrick Jelinek, John D. Lafferty, Robert L. Mercer, Paul S. Roossin, A Statistical Approach to Machine Translation [J],Computational Linguistics, 1990.
3Peter. F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, Robert L. Mercer, The Mathematics of Statistical Machine Translation: Parameter Estimation [J], Computational Linguiatics, 19,(2), 1993.
4F. J. Och, C. Tillmann, and H. Ney. Improved alignment models for statistical machine translation[A]. In Proc. of the Joint SIGDAT Conf. On Empirical Methods in Natural Language Processing and Very Large Corpora, pages 20-28, University of Maryland, College Park, MD, June 1999.
5Franz Josef Och, Hermann Ney. What Can Machine Translation Learn from Speech Recognition? [A]In: proceedings of MT 2001 Workshop: Towards a Road Map for MT, 26-31, Santiago de Compostels,Spain, September 2001.
6Franz Josef Och, Hermann Ney, Discriminative Training and Maximum Entropy Models for Statistical Machine Translation [A], ACL2002.
7K. A. Papineni, S. Roukos, and R. T. Ward. Feature-based language understanding[A]. In European Conf. on Speech Communication and Technology, 1435-1438, Rhodes, Greece, September,1997.
8K. A. Papineni, S. Roukos, and R. T. Ward. Maximum likelihood and discriminative training of direct translation models [A] In Proc. Int. Conf. on Accoustics, Speech, and Signal Processing,pages,189-192, Seattle, WA, May, 1998.
9Kishore Papineni, Salim Roukos, Todd Ward, Wei-Jing Zhu, Bleu: a Method for Automatic Evaluation of Machine Translation [R], IBM Research, RC22176 (W0109-022) September 17, 2001.
10Ye-Yi Wang, Grammar Inference and Statistical Machine Translation [D], Ph.D Thesis, Carnegie Mellon University, 1998.

共引文献247

1熊璨.论人工智能翻译的可能性——从翻译的三个层次看非文学与文学翻译[J].中外文化与文论,2020(2):106-115. 被引量：2
2赵莹莹.机器翻译与人工翻译特点对比与关系分析[J].作家天地,2020(13):30-31.
3王醒.译军突起:人工翻译能否经受住机器翻译的考验?[J].现代英语,2021(10):72-74. 被引量：1
4唐元楠.论机器翻译的现状[J].南国博览,2019,0(4):380-380.
5贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
6李霞,马骏腾,覃世豪.融合图像注意力的多模态机器翻译模型[J].中文信息学报,2020(7):68-78. 被引量：4
7明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
8邓凌云,余环.中外笔译质量要求的对比研究与启示[J].当代外语研究,2019,0(4):115-123.
9朱婕.汉韩机器翻译错误分析[J].大众标准化,2021(2):134-136.
10夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：12

同被引文献29

1李丽双,袁光辉,刘晗喆.基于位置降噪和丰富语义的电子病历实体关系抽取[J].中文信息学报,2021,35(8):89-97. 被引量：5
2冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
3邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：41
4高明虎,于志强.神经机器翻译综述[J].云南民族大学学报（自然科学版）,2019,28(1):72-76. 被引量：17
5杜优.基于信息融合的医疗影像辅助决策研究[J].智能计算机与应用,2019,9(2):91-95. 被引量：2
6张玉坤,刘茂福,胡慧君.基于联合神经网络模型的中文医疗实体分类与关系抽取[J].计算机工程与科学,2019,41(6):1110-1118. 被引量：15
7毕崇武,叶光辉,彭泽,李明倩.基于标签语义关联的城市社群发现研究[J].现代情报,2020,40(3):14-23. 被引量：2
8刘琼昕,马敬,郑培雄.一种融合实体关联性约束的表示学习方法[J].北京理工大学学报,2020,40(1):90-97. 被引量：4
9宁尚明,滕飞,李天瑞.基于多通道自注意力机制的电子病历实体关系抽取[J].计算机学报,2020,43(5):916-929. 被引量：33
10沈思,孙豪,王东波.基于深度学习表示的医学主题语义相似度计算及知识发现研究[J].情报理论与实践,2020,43(5):183-190. 被引量：11

引证文献3

1梁亚敏,李亚峰.基于语义关联度的英语段落机器翻译方法[J].自动化与仪器仪表,2022(8):208-212. 被引量：3
2于清,马志龙,徐春.基于BERT和非自回归的医疗知识抽取[J].计算机与现代化,2023(1):120-126.
3杜志昊.基于transformer的维汉神经机器翻译[J].电子设计工程,2023,31(22):47-51.

二级引证文献3

1卓奕炜,田泽佳,门豪.基于局部语义增强的中文拼写纠错方法[J].电子设计工程,2023,31(3):54-57.
2张少宇.基于Transformer技术的机器翻译设计与开发[J].信息与电脑,2023,35(2):173-176. 被引量：1
3郭丽娜.基于模型结构先验的神经机器翻译研究[J].自动化与仪器仪表,2023(9):192-196. 被引量：1

1张文博,张新路,杨雅婷,董瑞,李晓.面向低资源神经机器翻译的回译方法[J].厦门大学学报（自然科学版）,2021,60(4):675-679. 被引量：2
2王培玉.品词析句,让阅读充满“新鲜感”[J].小学语文教学,2020(35):25-26.
3尉光吉.《爱情发明家》:爱情与死亡的超现实主义交响曲[J].新阅读,2021(6):75-75.
4李忠海,白秋阳,王富明,刘海荣.基于语义分割的钢轨表面缺陷实时检测系统[J].计算机工程与应用,2021,57(12):248-256. 被引量：12
5汪浩,贡正仙,李军辉.融合篇章上下文有效识别的篇章级机器翻译[J].厦门大学学报（自然科学版）,2021,60(4):655-661. 被引量：1
6刘志东,李军辉,贡正仙.一种简单的神经机器翻译的动态数据扩充方法[J].厦门大学学报（自然科学版）,2021,60(4):680-686. 被引量：2
7郭继荣,杨亮.国内语言安全研究述评[J].情报杂志,2021,40(6):95-101. 被引量：14
8张一鸣,刘俊鹏,宋鼎新,黄德根.融合数据增强与多样化解码的神经机器翻译[J].厦门大学学报（自然科学版）,2021,60(4):670-674. 被引量：4
9谢赫.符号学视角下明式圈椅对瓦格纳“中国椅”的影响研究[J].家具与室内装饰,2021,28(5):44-47. 被引量：7
10孙硕,侯宏旭,乌尼尔,常鑫,贾晓宁,李浩然.基于迭代知识精炼的对偶学习蒙汉机器翻译[J].厦门大学学报（自然科学版）,2021,60(4):687-692. 被引量：2

厦门大学学报（自然科学版）

2021年第4期

浏览历史

内容加载中请稍等...

基于掩码机制的非自回归神经机器翻译被引量：3

参考文献3

二级参考文献15

共引文献247

同被引文献29

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于掩码机制的非自回归神经机器翻译 被引量：3

参考文献3

二级参考文献15

共引文献247

同被引文献29

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于掩码机制的非自回归神经机器翻译被引量：3