基于增量式自学习策略的多语言翻译模型被引量：6

Multilanguage translation model based on incremental self-learning strategy

下载PDF

导出

摘要针对源语言到目标语言缺乏平行语料的情况,提出了一种基于增量式自学习策略的多语言翻译模型,即利用中介语双语语料训练源语言到目标语言的翻译模型.在Transformer架构下,相比于基于中介语和直接在伪平行语料上训练的普通双语翻译模型,使用该方法在第十四届全国机器翻译研讨会(CWMT 2018)多语言翻译评测数据集上的机器双语互译评估(BLEU)值提升了0.98个百分点.在此基础上,还对比了不同的预处理方法、训练策略以及多模型的平均和集成策略,其中多模型集成策略的BLEU值上可在多模型策略的基础上进一步提升0.53个百分点. Without parallel corpus from the source language to the target language,we train multilingual neural machine translation models on bilingual corpus of the pivot language and propose an incremental learning strategy to improve source-language to target-language translation.Experimental results under Transformer framework show that our multilingual iterative method can improve the BLEU score by 0.98 percent point on the China workshop on machine translation(CWMT)2018 multi-language translation evaluation data set,compared to traditional pivot-based translation and the vanilla multilingual neural machine translation(NMT).In addition,we also compared different preprocessing methods,training strategies,multi-model average and ensemble,where multi-model ensemble can further increase the BLEU score by 0.53 percent point unpon common multi-model strategy.

作者周张萍黄荣城王博立胡金铭史晓东陈毅东 ZHOU Zhangping;HUANG Rongcheng;WANG Boli;HU Jinming;SHI Xiaodong;CHEN Yidong(School of Information Science and Engineering,Xiamen University,Xiamen 360001,China)

机构地区厦门大学信息科学与技术学院

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第2期170-175,共6页 Journal of Xiamen University：Natural Science

基金国家科技支撑计划项目(2012BAH14F03) 国家自然科学基金(61573294) 教育部博士点基金(20130121110040) 国家语委委托项目(WT135-10) 国家语委甲骨文专项(YWZ-J010)

关键词神经网络机器翻译多语言机器翻译增量式自学习 neural machine translation multilingual machine translation iterative method

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献65

1相德宝.国际自媒体涉华舆情现状、传播特征及引导策略[J].新闻与传播研究,2012,19(1):73-83. 被引量：32
2冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018,41(6):35-48. 被引量：84
3屈庆涛,刘其成,牟春晓.基于N-Gram语言模型的并行自适应新闻话题追踪算法[J].山东大学学报（工学版）,2018,48(6):37-43. 被引量：10
4李天韵.口译工作模型下的机器同声传译系统分析[J].东方翻译,2018(6):34-39. 被引量：4
5周庆安,杜艳菲.海外主流媒体涉华舆情研究方法及功能探究[J].对外传播,2014(8):34-36. 被引量：5
6张军芳.社交媒体涉华国际舆情研究辨析[J].对外传播,2015(3):59-61. 被引量：3
7王龙,杨俊安,刘辉,陈雷,林伟.基于RNN汉语语言模型自适应算法研究[J].火力与指挥控制,2016,41(5):31-34. 被引量：4
8杨南,李沐.基于神经网络的统计机器翻译的预调序模型[J].中文信息学报,2016,30(3):103-110. 被引量：5
9丁亮,李颖,何彦青,王星,张运良,姚长青.基于汉语主题词表的统计机器翻译训练数据筛选方法及实验研究[J].情报学报,2016,35(8):875-884. 被引量：9
10姚亮,洪宇,刘昊,刘乐,姚建民.基于翻译模型和语言模型相融合的双语句对选择方法[J].中文信息学报,2016,30(5):145-152. 被引量：2

引证文献6

1王连喜,甘穗福,林楠铠,蒋盛益.涉华信息资源归集与舆情分析框架构建[J].情报杂志,2020,39(6):135-142. 被引量：4
2杜刚,朱艳云,张晨,杜雪涛.变体垃圾短信翻译技术研究[J].电信工程技术与标准化,2020,33(7):83-88. 被引量：1
3杨云,王全.EM算法在神经机器翻译模型中的应用研究[J].计算机应用与软件,2020,37(8):250-255. 被引量：3
4叶楠,寇丽杰.多语言机器人深度学习模型构建[J].信息与控制,2020,49(6):680-687. 被引量：7
5陈敏.基于句法的神经机器英语翻译研究[J].电子设计工程,2021,29(10):24-27. 被引量：3
6杨璐,樊同科.基于Cloud LM算法的机器翻译语言模型设计与应用[J].信息技术,2022,46(5):48-52. 被引量：2

二级引证文献20

1母滨彬,王平.深度编码网络下的英语点餐机器人交互系统设计[J].食品与机械,2021,37(9):110-116. 被引量：6
2张新平,金梦涵.人工智能时代舆情治理的转型与创新[J].情报杂志,2021,40(10):66-73. 被引量：23
3苏瑞竹,陈雪芬,张颖.“文旅融合”背景下东盟文化旅游信息资源开发与传播研究[J].图书馆工作与研究,2021(10):3-11. 被引量：5
4王小迁.基于计算机智能的英语译文语境化自动校准系统[J].微型电脑应用,2021,37(11):158-160. 被引量：2
5张晨,杜刚,朱艳云,杜雪涛.5G环境下新型内容管控策略模型研究[J].电信工程技术与标准化,2022,35(5):22-26.
6朱合军.动态视觉检测电视背面工艺的方法[J].工业控制计算机,2022,35(5):49-50. 被引量：1
7温湛靓,邓丽君.基于信息熵模型的英汉翻译机器人控制方法[J].自动化与仪器仪表,2022(5):84-87. 被引量：3
8王连喜,向杰益,黄锡轩,蒋盛益,赵瑞.东盟涉华舆情识别及特征分布研究--以主流英汉媒体为分析对象[J].情报杂志,2022,41(8):94-101. 被引量：1
9刘秋鸽,闵亮.基于智能语音交互的文言文翻译机器人关键技术[J].自动化与仪器仪表,2022(8):165-169. 被引量：6
10陈婷婷.面向机器的NMT英语翻译系统研究[J].信息技术,2022,46(12):69-72. 被引量：2

1张素文.新媒体时代中日外宣语言的翻译特点研究[J].成才之路,2019(6):79-79. 被引量：1
2殷健.论术语系统翻译评测的经济率差标准[J].中国科技翻译,2018,31(3):19-21.
3葛晓华.翻译学员双向翻译能力比较的实证研究[J].外语教学,2018,39(4):80-85. 被引量：4
4王路路,斯拉吉艾合麦提.如则麦麦提,艾山.吾买尔,吐尔根.依布拉音,买合木提.买买提,卡哈尔江.阿比的热西提.人物简历汉维机器翻译系统的设计与实现[J].现代电子技术,2018,41(24):101-105.
5贺梅玲.浅议初中数学教学中提高学生方程模型运用能力的策略[J].数理化解题研究,2019(2):20-21.
6李毓,杨雅婷,李晓,米成刚,董瑞.面向汉维机器翻译的神经网络语言模型[J].厦门大学学报（自然科学版）,2019,58(2):189-194. 被引量：3
7谭新,邝少辉,张龙印,熊德意.融入汉字笔画序列的神经机器翻译[J].厦门大学学报（自然科学版）,2019,58(2):164-169. 被引量：1
8胡迁,黄青松,刘利军,李帅彬,冯旭鹏.基于主题与语义的对话语料关键词抽取方法[J].计算机应用与软件,2018,35(12):27-32. 被引量：2
9王巨涛.集成学习在Fashion-MINIST服饰识别中的应用[J].全国流通经济,2019(2):90-92.
10陈丽君.高校英语专业翻译理论与实践课程教学思考[J].学园,2018,11(14):45-46. 被引量：1

厦门大学学报（自然科学版）

2019年第2期

浏览历史

内容加载中请稍等...

基于增量式自学习策略的多语言翻译模型被引量：6

同被引文献65

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于增量式自学习策略的多语言翻译模型 被引量：6

同被引文献65

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于增量式自学习策略的多语言翻译模型被引量：6