基于跨语种预训练语言模型XLM-R的神经机器翻译方法被引量：3

Neural Machine Translation Based on XLM-R Cross-lingual Pre-training Language Model

下载PDF

导出

摘要探索将XLM-R跨语种预训练语言模型应用在神经机器翻译的源语言端、目标语言端和两端,提高机器翻译的质量。提出3种网络模型,分别在Transformer神经网络模型的编码器、解码器以及两端同时引入预训练的XLM-R多语种词语表示。在WMT英语-德语、IWSLT英语-葡萄牙语以及英语-越南语等翻译中的实验结果表明,对双语平行语料资源丰富的翻译任务,引入XLM-R可以很好地对源语言句子进行编码,从而提高翻译质量;对双语平行语料资源匮乏的翻译任务,引入XLM-R不仅可以很好地对源语言句子进行编码,还可以对源语言端和目标语言端的知识同时进行补充,提高翻译质量。 The authors explore the application of XLM-R cross-lingual pre-training language model into the source language,into the target language and into both of them to improve the quality of machine translation,and propose three neural network models,which integrate pre-trained XLM-R multilingual word representation into the Transformer encoder,into the Transformer decoder and into both of them respectively.The experimental results on WMT English-German,IWSLT English-Portuguese and English-Vietnamese machine translation benchmarks show that integrating XLM-R model into Transformer encoder can effectively encode the source sentences and improve the system performance for resource-rich translation task.For resource-poor translation task,integrating XLM-R model can not only encode the source sentences well,but also supplement the source language knowledge and target language knowledge at the same time,thus improve the translation quality.

作者王倩李茂西吴水秀王明文 WANG Qian;LI Maoxi;WU Shuixiu;WANG Mingwen(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang 330022)

机构地区江西师范大学计算机信息工程学院

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2022年第1期29-36,共8页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家自然科学基金(61662031)资助。

关键词跨语种预训练语言模型神经机器翻译 Transformer网络模型 XLM-R模型微调 cross-lingual pre-training language model neural machine translation Transformer neural network XLM-R model fine-tuning

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1翟煜锦,李培芸,项青宇,李茂西,裘白莲,钟茂生,王明文.基于QE的机器翻译重排序方法研究[J].江西师范大学学报（自然科学版）,2020,44(1):46-50. 被引量：7

二级参考文献3

1陈志明,李茂西,王明文.基于神经网络特征的句子级别译文质量估计[J].计算机研究与发展,2017,54(8):1804-1812. 被引量：14
2李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：99
3刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：102

共引文献6

1刘媛,李茂西,项青宇,李易函.基于多元信息融合的神经机器译文自动评价方法[J].中文信息学报,2023,37(3):89-100. 被引量：1
2郭小华.基于深度神经网络的机器翻译智能重排序系统设计[J].自动化与仪器仪表,2021(7):140-142. 被引量：2
3程晓娇.基于多特征融合的机器英语翻译错误自动识别研究[J].黑龙江工业学院学报（综合版）,2021,21(10):66-71. 被引量：4
4尹天涯.基于BP神经网络的机器翻译自动化评判模型研究[J].自动化与仪器仪表,2022(2):167-171. 被引量：2
5王惠.英语翻译机器人翻译错误自动检测系统设计[J].自动化与仪器仪表,2022(4):214-217. 被引量：4
6刘媛,李茂西,罗琪,李易函.基于神经网络的机器译文自动评价综述[J].中文信息学报,2023,37(9):1-14.

同被引文献19

1杨云,王全.层聚合的对抗机器翻译模型的方法研究[J].陕西科技大学学报,2020,38(1):164-170. 被引量：1
2陈祖君.基于神经网络机器翻译模型的英文分词研究[J].计算机与数字工程,2020,48(1):13-18. 被引量：9
3张新路,李晓,杨雅婷,王磊,董瑞.面向维汉神经机器翻译的双向重排序模型分析[J].北京大学学报（自然科学版）,2020,56(1):31-38. 被引量：7
4武子玉,侯宏旭,白天罡,吉亚图,乌尼尔,郭紫月,王雪姣,孙硕.基于CSGAN的多模型融合蒙汉神经机器翻译研究[J].江西师范大学学报（自然科学版）,2020,44(2):153-159. 被引量：4
5李霞,马骏腾,肖莉娴,王连喜.低资源场景下印尼语-汉语机器翻译模型对比分析研究[J].湖南工业大学学报,2020,34(3):10-16. 被引量：8
6QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：115
7田科,张家俊.基于预训练模型的机器翻译译文检测方法[J].情报工程,2020,6(5):15-26. 被引量：4
8宗勤勤,李茂西.基于重解码的神经机器翻译方法研究[J].中文信息学报,2021,35(6):39-46. 被引量：6
9文丽颖.无监督学习的多语言神经机器翻译模型[J].电子设计工程,2021,29(20):48-51. 被引量：5
10陈德,宋华珠,张娟,周泓林.融合BERT和记忆网络的实体识别[J].计算机科学,2021,48(10):91-97. 被引量：2

引证文献3

1孙凯丽,罗旭东,罗有容.预训练语言模型的应用综述[J].计算机科学,2023,50(1):176-184. 被引量：3
2张小艳,段正宇.基于句级别GAN的跨语言零资源命名实体识别模型[J].计算机应用,2023,43(8):2406-2411.
3刘鹏娟.大规模分布式统计机器翻译离线模型训练研究[J].自动化与仪器仪表,2023(12):18-22.

二级引证文献3

1孙雷亮.基于GPT模型的人工智能数据伪造风险研究[J].信息安全研究,2023,9(6):518-523. 被引量：2
2苏莉雯,吴杨.生成式人工智能在口腔医学的应用潜力与挑战[J].口腔医学研究,2024,40(1):11-17.
3于博帆,严嘉兴.基于BERT的煤矿事故风险LEC评价与优化研究[J].现代矿业,2024,40(1):217-221.

1张会娜.续写有技巧,多角度引导[J].河南教育（教师教育）（下）,2022(1):71-71.
2郭志民,周劼英,王丹,吕卓,杨文.基于Transformer神经网络模型的网络入侵检测方法[J].重庆大学学报,2021,44(11):81-88. 被引量：19
3周瀚章.基于Transformer的情感分类研究[J].长江信息通信,2021,34(11):155-157. 被引量：1
4迟海洋,严馨,徐广义,陈玮,周枫.融合主题信息和Transformer模型的健康问句意图分类[J].小型微型计算机系统,2021,42(12):2519-2524. 被引量：3
5黄佳跃,熊德意.句对齐研究综述[J].中文信息学报,2021,35(8):16-27. 被引量：1
6庄育培,邓治良,王思琦,钟豪杰,何兴祥.洗涤菌群移植对代谢相关脂肪性肝病的影响[J].中西医结合肝病杂志,2021,31(12):1073-1077.
7向露,周玉,宗成庆.基于中英文单语术语库的双语术语对齐方法[J].中国科技术语,2022,24(1):14-25. 被引量：2
8苏依拉,王昊,贺玉玺,孙晓骞,仁庆道尔吉,吉亚图.基于对抗学习的蒙汉神经机器翻译[J].计算机系统应用,2022,31(1):249-258. 被引量：6
9陈幸明,付彤,刘昌,张宾,伏云发,李恩泽,ZHANG Jian,陈盛强,党彩萍.工作记忆训练诱发的神经可塑性——基于系列fMRI实验的脑区分布递减时空模型[J].心理科学进展,2022,30(2):255-274. 被引量：2

北京大学学报（自然科学版）

2022年第1期

浏览历史

内容加载中请稍等...

基于跨语种预训练语言模型XLM-R的神经机器翻译方法被引量：3

参考文献1

二级参考文献3

共引文献6

同被引文献19

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于跨语种预训练语言模型XLM-R的神经机器翻译方法 被引量：3

参考文献1

二级参考文献3

共引文献6

同被引文献19

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于跨语种预训练语言模型XLM-R的神经机器翻译方法被引量：3