跨语言多任务学习深层神经网络在蒙汉机器翻译的应用被引量：3

APPLICATION OF CROSS-LANGUAGE MULTI-TASK LEARNING DEEP NEURAL NETWORK IN MONGOLIAN-CHINESE MACHINE TRANSLATION

下载PDF

导出

摘要针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。 To solve the problem of poor quality of Mongolian and Chinese translations caused by the difficulty of Mongolian-Chinese parallel corpus resources and the lack of coverage of existing parallel corpus data,this paper models machine translation by means of cross-language multi-task learning.In the data preprocessing stage,two new unsupervised pre-training and one supervised pre-training method were introduced for cross-language modeling to learn cross-language representation,and the effect of three language pre-training methods were studied in Mongolian-Chinese translation.The experimental results show that the above three cross-language pre-training models can significantly reduce the confusion of low-resource language,improve the quality of Mongolian-Chinese translation.

作者张振苏依拉仁庆道尔吉高芬王宇飞 Zhang Zhen;Su Yila;Ren Qingdaoerji;Gao Fen;Wang Yufei(School of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080,Inner Mongolia,China)

机构地区内蒙古工业大学信息工程学院

出处《计算机应用与软件》北大核心 2021年第1期157-160,178,共5页 Computer Applications and Software

基金国家自然科学基金项目(61363052) 内蒙古自治区自然科学基金项目(2016MS0605) 内蒙古自治区民族事务委员会基金项目(MW-2017-MGYWXXH-03)。

关键词蒙汉机器翻译无监督预训练监督预训练跨语言建模多任务学习 Mongolian-Chinese machine translation Unsupervised pre-training Supervised pre-training Cross-language modeling Multi-task learning

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

同被引文献22

1李继东,王移芝.基于扩展词典与语义规则的中文微博情感分析[J].计算机与现代化,2018(2):89-95. 被引量：13
2樊文婷,侯宏旭,王洪彬,武静,李金廷.融合先验信息的蒙汉神经网络机器翻译模型[J].中文信息学报,2018,32(6):36-43. 被引量：6
3肖新凤,李石君,余伟,刘杰,刘倍雄.基于改进seq2seq模型的英汉翻译研究[J].计算机工程与科学,2019,41(7):1257-1265. 被引量：20
4彭晓娅,周栋.跨语言词向量研究综述[J].中文信息学报,2020,34(2):1-15. 被引量：12
5郭明阳,张晓玲,唐会玲,孟庆端,任龙波.人工智能在机器翻译中的应用研究[J].河南科技大学学报（自然科学版）,2021,42(3):97-104. 被引量：11
6沈逸宁,庄晴.英汉智能机器翻译弊端解析——论英语“褒贬同词”现象[J].湖北成人教育学院学报,2021,27(1):94-97. 被引量：1
7高巍,李耀松,李大舟,陈子祥,孟智慧.基于双向编解码器的乌英机器翻译[J].计算机工程与设计,2021,42(5):1479-1484. 被引量：11
8曾雪强,华鑫,刘平生,左家莉,王明文.基于情感轮和情感词典的文本情感分布标记增强方法[J].计算机学报,2021,44(6):1080-1094. 被引量：14
9杨璐,樊同科.基于递归神经网络的英译汉机器翻译模型设计与实现[J].计算机测量与控制,2021,29(11):142-147. 被引量：12
10苏依拉,王昊,贺玉玺,孙晓骞,仁庆道尔吉,吉亚图.基于对抗学习的蒙汉神经机器翻译[J].计算机系统应用,2022,31(1):249-258. 被引量：7

引证文献3

1张超轶,陈媛,张聚伟.融合术语信息的神经机器翻译参数初始化研究[J].河南科技大学学报（自然科学版）,2022,43(4):61-66. 被引量：3
2杨蕾,苏依拉,仁庆道尔吉,吉亚图,乌尼尔,路敏.基于语义规则增强的蒙古语情感分布学习[J].计算机工程与设计,2024,45(7):2082-2089.
3王文飞.英汉机器翻译错误类型及其译后编辑措施分析[J].黑河学院学报,2024,15(11):118-120.

二级引证文献3

1黄堃,胡涵清,赵东明,王博.基于深度学习的电信运营商网络投诉工单智能分类技术研究[J].电信工程技术与标准化,2023,36(10):6-12. 被引量：1
2麦咏欣,林志豪,葸娟霞.基于Albert-TextCNN模型的多标签新闻文本分类[J].现代信息科技,2024,8(20):31-36.
3姚晔,许锡伟,管剑波,葛旭初.基于双向LSTM神经网络的站点周边水位预测系统设计[J].计算机测量与控制,2024,32(11):18-24.

1徐婉馨,祝招玲.乡村振兴背景下的桦川县乡村旅游产业发展研究[J].农村农业农民,2021(2):36-38. 被引量：4
2王晰巍,张柳,黄博,韦雅楠.基于LDA的微博用户主题图谱构建及实证研究——以“埃航空难”为例[J].数据分析与知识发现,2020,4(10):47-57. 被引量：22
3李燕燕.在甘南,看一片云移动的光影[J].飞天,2020(11):122-124.
4董雪涵.地热采暖技术的特点与应用问题[J].中国高新科技,2020(21):69-70. 被引量：2
5张立强,李洋,侯正阳,李新港,耿昊,王跃宾,李景文,朱盼盼,梅杰,姜颜笑,李帅朋,辛奇,崔颖,刘素红.深度学习与遥感数据分析[J].武汉大学学报（信息科学版）,2020,45(12):1857-1864. 被引量：8
6杨帆.人机协作下的文言文英译及译前、译后编辑[J].小说月刊（下半月）,2020(19):0184-0184.
7孙某姑.彝语北部方言语料库的建设管理与研究[J].小说月刊（下半月）,2020(18):0170-0171.
8周康,曲卫东,杨艺琛.基于增强BiLSTM的网络文章核心实体识别[J].计算机技术与发展,2021,31(1):7-12. 被引量：2
9章安,马明栋.基于Tesseract文字识别的预处理研究[J].计算机技术与发展,2021,31(1):73-76. 被引量：5
10刘华军,石印.中国农业生态效率的空间分异与提升潜力[J].广东财经大学学报,2020,35(6):51-64. 被引量：29

计算机应用与软件

2021年第1期

浏览历史

内容加载中请稍等...

跨语言多任务学习深层神经网络在蒙汉机器翻译的应用被引量：3

同被引文献22

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

跨语言多任务学习深层神经网络在蒙汉机器翻译的应用 被引量：3

同被引文献22

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

跨语言多任务学习深层神经网络在蒙汉机器翻译的应用被引量：3