非自回归翻译模型在蒙汉翻译上的应用被引量：2

Application of Non-Autoregressive Translation Model in Mongolian and Chinese Translation

下载PDF

导出

摘要当前大多数机器翻译模型都属于自回归模型,不支持解码器并行生成翻译结果,且生成速率过低。针对当前自回归模型中存在的问题,基于Transformer和非自回归Transformer(non-autoregressive Transformer,NAT)的翻译模型进行实验,对蒙汉语料进行知识蒸馏和语跨语言词语嵌入的处理。实验结果表明,引入知识蒸馏的NAT模型在BLEU值方面有显著提升,同时也提高了模型生成速率。NAT模型进行知识蒸馏与跨语言词嵌入处理后能显著减少源语言和目标语言之间的依赖关系,提高蒙汉机器翻译的BLEU值,相比Transformer模型,BLEU值提高了2.8,时间消耗减少了19.34 h。 Most machine translation models are autoregressive models.To solve the problems existing in the autoregressive models,this paper conducts knowledge distillation and cross-language word embedding on corpus,on the translation models of Transformer and non-autoregressive Transformer.Experimental results show that non-autoregressive Transformer models with knowledge distillation achieve significant improvements in terms of BLEU and improve the generation rate.Experimental results show that knowledge distillation can significantly reduce the dependence between source and target language and improve the BLEU of Mongolian-Chinese machine translation,compared to Transformer models,BLEU values are improved by 2.8 and time consumption is reduced by 19.34 hours.

作者赵旭苏依拉仁庆道尔吉石宝 ZHAO Xu;SU Yila;RENQING Dao’erji;SHI Bao(College of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080,China)

机构地区内蒙古工业大学信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第12期310-316,共7页 Computer Engineering and Applications

基金国家自然科学基金(61966028,61966027)。

关键词 Transformer模型 NAT模型知识蒸馏跨语言词嵌入 Transformer models non-autoregressive Transformer(NAT) knowledge distillation cross-language word embedding

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1百顺.基于派生文法的日—蒙动词短语机器翻译研究[J].中文信息学报,2008,22(2):47-54. 被引量：5
2任众,侯宏旭,吉亚图,武子玉,白天罡,雷颖.子字粒度切分在蒙汉神经机器翻译中的应用[J].中文信息学报,2019,33(1):85-92. 被引量：9
3苏依拉,乌尼尔,刘婉婉.基于统计分析的蒙汉自然语言的机器翻译[J].北京工业大学学报,2017,43(1):36-42. 被引量：4
4苏依拉,刘婉婉,乌尼尔.基于实例相似度检测的蒙汉机器翻译方法[J].北京工业大学学报,2017,43(9):1366-1372. 被引量：5

二级参考文献38

1李刃之,吴建成.西方国家机器翻译的勃兴[J].上海翻译,1992(4):37-42. 被引量：1
2熊晶,钟珞,王爱民.基于实例和本体的甲骨文机器翻译方法研究[J].华中科技大学学报（自然科学版）,2013,41(S2):222-226. 被引量：5
3戴伟长.国内外机器翻译进展状况[J].软件世界,1994(12):2-4. 被引量：5
4娜步青.基于统计的蒙汉机器翻译系统研究[J].内蒙古农业大学学报（自然科学版）,2005,26(4):151-154. 被引量：2
5伊.达瓦,张玉洁,上园一知,大川茂树,章森,井佐原均,白井克彦.蒙古语语言-文字的自动化处理[J].中文信息学报,2006,20(4):56-62. 被引量：6
6高原.简谈俄汉语词序对比[J].理论观察,2006(5):128-129. 被引量：4
7杨思春.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,35(6):956-959. 被引量：34
8那顺乌日图刘群巴达玛放德斯尔.关于汉蒙机器辅助翻译系统.阿尔泰学报,2001,(11).
9清濑義三郎則府.日本語文法新論-派生文法序税[M].东京:桉楓社,1989.
10百順,長谷部紀元,石川徹也.派生文法基づく日本語からモンゴル語への文節翻訳[A].言語処理学会第12回年次大会発表論文集[C].东京:2006.584-587.

共引文献19

1伊.达瓦,米尔阿迪力江.麦麦提.丝绸之路经济带相似语言信息横向处理通信技术的研究[J].新疆师范大学学报（自然科学版）,2014,33(4):66-74.
2崔文博.日语「る」系派生动词研究[J].重庆电子工程职业学院学报,2017,26(3):86-91. 被引量：1
3格根塔娜.蒙汉新闻翻译如何利用网络资源[J].传播力研究,2018,2(27):244-244. 被引量：1
4侯强,侯瑞丽.机器翻译方法研究与发展综述[J].计算机工程与应用,2019,55(10):30-35. 被引量：26
5李莎,齐灿.基于双语E-Chunk的机器辅助翻译模型仿真[J].计算机仿真,2019,36(12):345-348. 被引量：5
6高芬,苏依拉,牛向华,赵亚平,范婷婷,仁庆道尔吉.基于Transformer的蒙汉神经机器翻译研究[J].计算机应用与软件,2020,37(2):141-146. 被引量：12
7苏依拉,高芬,仁庆道尔吉.中文字粒度切分在蒙汉机器翻译的应用[J].中文信息学报,2019,33(12):54-60. 被引量：2
8高芬,苏依拉,牛向华,赵旭,范婷婷,仁庆道尔吉.基于多粒度的蒙汉神经机器翻译研究[J].计算机应用与软件,2020,37(4):145-149. 被引量：3
9霍小静.人工智能理论的机器自动翻译系统[J].微型电脑应用,2020,36(11):77-79. 被引量：2
10何春燕.不同语义认知视角下交互式智能翻译方法研究[J].宿州学院学报,2021,36(1):52-56. 被引量：1

同被引文献18

1李继东,王移芝.基于扩展词典与语义规则的中文微博情感分析[J].计算机与现代化,2018(2):89-95. 被引量：13
2张振,苏依拉,仁庆道尔吉,高芬,王宇飞.跨语言多任务学习深层神经网络在蒙汉机器翻译的应用[J].计算机应用与软件,2021,38(1):157-160. 被引量：2
3张蕾,王剑楠.基于短语翻译模型的英语翻译计算机智能校对方法[J].自动化技术与应用,2021,40(2):55-58. 被引量：8
4王婧锦.基于多特征融合的汉英口语翻译自动评分方法研究[J].现代科学仪器,2021,38(2):258-261. 被引量：2
5高巍,李耀松,李大舟,陈子祥,孟智慧.基于双向编解码器的乌英机器翻译[J].计算机工程与设计,2021,42(5):1479-1484. 被引量：11
6曾雪强,华鑫,刘平生,左家莉,王明文.基于情感轮和情感词典的文本情感分布标记增强方法[J].计算机学报,2021,44(6):1080-1094. 被引量：12
7张丽娜.基于奈达对等理论分析化工英语翻译策略[J].日用化学工业,2021,51(7). 被引量：4
8杨璐,樊同科.基于递归神经网络的英译汉机器翻译模型设计与实现[J].计算机测量与控制,2021,29(11):142-147. 被引量：11
9苏依拉,王昊,贺玉玺,孙晓骞,仁庆道尔吉,吉亚图.基于对抗学习的蒙汉神经机器翻译[J].计算机系统应用,2022,31(1):249-258. 被引量：7
10吴迪.基于机器翻译的语法错误检测语音识别模型[J].信息技术,2022,46(5):82-87. 被引量：9

引证文献2

1杨蕾,苏依拉,仁庆道尔吉,吉亚图,乌尼尔,路敏.基于语义规则增强的蒙古语情感分布学习[J].计算机工程与设计,2024,45(7):2082-2089.
2郭小娥.基于马尔科夫树时态标注算法的自动机器翻译系统研究[J].自动化与仪器仪表,2024(8):233-237.

1欧龙巴亚尔.蒙汉翻译在民族文化传播交流中的作用[J].海风,2021(6):74-75.
2收录《中华临床营养杂志》的检索系统及数据库[J].中华临床营养杂志,2022,30(1):8-8.
3张玲,安伊凡,樊勇,于潇.内蒙古自治区19-22岁蒙汉城乡大学生运动能力比较研究[J].冰雪体育创新研究,2021(17):188-189.
4Jing Yu,Nan-Lin Li.Loss of human epidermal receptor-2 in human epidermal receptor-2+breast cancer after neoadjuvant treatment:A case report[J].World Journal of Clinical Cases,2022,10(17):5923-5928.
5王瑞,崔冲,郑伟,涂晓明.布氏锥虫自噬蛋白ATG12的表达、纯化及二级结构预测[J].生物技术,2022,32(2):146-152.
6王丹.基于汉语作为第二语言教学方法的探讨[J].读与写（下旬）,2022(12):7-9.
7赵雨露.扎根内蒙古,做独具民族特色的血糖管理带头人--专访内蒙古民族大学附属医院内分泌科主任韩立坤[J].糖尿病之友,2022(5):72-73.
8朱向晗,刘寒蕾.感官沉浸法在韩语拟声拟态词学习中的应用[J].新丝路,2022(6):193-195.
9Solomon O. Olabode,Muraina Z. Mohammed.Depositional Facies and Sequence Stratigraphic Study in Parts of Benin (Dahomey) Basin SW Nigeria: Implications on the Re-Interpretation of Tertiary Sedimentary Successions[J].International Journal of Geosciences,2016,7(2):210-228.
10周聪敏.基于语料库检索的日语形近词偏误分析方法[J].世纪之星—交流版,2021(33):154-156.

计算机工程与应用

2022年第12期

浏览历史

内容加载中请稍等...

非自回归翻译模型在蒙汉翻译上的应用被引量：2

参考文献4

二级参考文献38

共引文献19

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

非自回归翻译模型在蒙汉翻译上的应用 被引量：2

参考文献4

二级参考文献38

共引文献19

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

非自回归翻译模型在蒙汉翻译上的应用被引量：2