面向“一带一路”的低资源语言机器翻译研究

Research on Low-Resource Language Machine Translation for the″Belt and Road″

下载PDF

导出

摘要随着“一带一路”倡议的深入推进,沿线国家和地区之间的跨语言沟通需求日渐增长,机器翻译技术逐渐成为各国之间深入交流的重要手段。然而,这些国家存在大量低资源语言,语料的稀缺性导致其机器翻译研究进展较为缓慢。针对该问题,提出一种基于NLLB模型改进的低资源语言机器翻译训练方法。首先基于多语言预训练模型提出一种改进的训练策略,该策略在数据增强的前提下,对损失函数进行优化,从而在机器翻译任务中有效提高低资源语言的翻译性能;然后使用ChatGPT以及ChatGLM模型分别评估老挝语-汉语以及越南语-汉语的翻译能力,大语言模型(LLM)已具备一定的翻译低资源语言的能力,而且ChatGPT模型在越南语-汉语翻译任务上已经大幅超越传统的神经机器翻译(NMT)模型,但是在老挝语上的翻译性能还有待进一步提高。实验结果表明,在4种低资源语言到汉语的翻译任务上,相比NLLB-600M基线模型,平均提升了1.33个双语替换测评(BLEU)值以及0.82个chrF++值,从而充分证明了该方法在低资源语言机器翻译任务上的有效性。此外,该方法使用ChatGPT和ChatGLM模型分别对老挝语-汉语以及越南语-汉语进行了初步研究,在越南语-汉语翻译任务中,ChatGPT模型表现出色,远超传统的NMT模型,分别提高了9.28个BLEU值和3.12个chrF++值。 With the development of the″Belt and Road″initiative,the demand for cross-language communication between countries and regions along the″Belt and Road″has grown,and Machine Translation(MT)technology has gradually become an important means of in-depth exchange between countries.However,owing to the abundance of low-resource languages and scarcity of language materials in these countries,progress in machine translation research has been relatively slow.This paper proposes a low-resource language machine translation training method based on the NLLB model.An improved training strategy based on a multilingual pre-training model is deployed to optimize the loss function under the premise of data augmentation,thereby effectively improving the translation performance of low-resource languages in machine translation tasks.The ChatGPT and ChatGLM models are used to evaluate translation performance for Laotian-Chinese and Vietnamese-Chinese,respectively.Large Language Models(LLM)are already capable of translating low-resource languages,and the ChatGPT model significantly outperforms the traditional Neural Machine Translation(NMT)model in Vietnamese-Chinese translation tasks.However,the translation of Laotian requires further improvement.The experimental results show that compared to the NLLB-600M baseline model,the proposed model achieves average improvements of 1.33 in terms of BiLingual Evaluation Understudy(BLEU)score and 0.82 in terms of chrF++score in Chinese translation tasks for four low-resource languages.These results fully demonstrate the effectiveness of the proposed method in low-resource language machine translation.In another experiment,this method uses the ChatGPT and ChatGLM models to conduct preliminary studies on Laotian-Chinese and Vietnamese-Chinese,respectively.In Vietnamese-Chinese translation tasks,the ChatGPT model significantly outperformed the traditional NMT models with a 9.28 improvement in BLEU score and 3.12 improvement in chrF++score.

作者侯钰涛阿布都克力木·阿布力孜史亚庆马依拉木·木斯得克哈里旦木·阿布都克里木 HOU Yutao;Abudukelimu Abulizi;SHI Yaqing;Mayilamu Musideke;Halidanmu Abudukelimu(Department of Information Management,Xinjiang University of Finance and Economics,Urumqi 830012,Xinjiang,China)

机构地区新疆财经大学信息管理学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第4期332-341,共10页 Computer Engineering

基金国家自然科学基金(61966033,62366050) 高层次人才专项(2022XGC060)。

关键词低资源语言机器翻译数据增强多语言预训练模型大语言模型 low-resource languages Machine Translation(MT) data enhancement multilingual pre-training models Large Language Model(LLM)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李宇明.“一带一路”需要语言铺路[J].中国科技术语,2015,17(6):62-62. 被引量：74
2宜年,艾山·吾买尔,买合木提·买买提,吐尔根·依布拉音.基于多种数据筛选的维汉神经机器翻译[J].厦门大学学报（自然科学版）,2022,61(4):660-666. 被引量：3
3冯笑,杨雅婷,董瑞,艾孜麦提·艾尼瓦尔,马博.基于回译和集成学习的维汉神经机器翻译方法[J].兰州理工大学学报,2022,48(5):99-106. 被引量：4

二级参考文献4

1李睿,张九蕊,毛莉.基于AdaBoost的弱分类器选择和整合算法[J].兰州理工大学学报,2012,38(2):87-90. 被引量：6
2哈里旦木.阿布都克里木,刘洋,孙茂松.神经机器翻译系统在维吾尔语-汉语翻译中的性能对比[J].清华大学学报（自然科学版）,2017,57(8):878-883. 被引量：24
3李北,王强,肖桐,姜雨帆,张哲旸,刘继强,张俐,于清.面向神经机器翻译的集成学习方法分析[J].中文信息学报,2019,33(3):42-51. 被引量：10
4张新路,李晓,杨雅婷,王磊,董瑞.面向维汉神经机器翻译的双向重排序模型分析[J].北京大学学报（自然科学版）,2020,56(1):31-38. 被引量：7

共引文献77

1段聪丽,张静波,李秀娟.中缅边境地区缅甸语需求调查研究[J].语言规划学研究,2019(2):69-78. 被引量：1
2郭风岚.人类命运共同体与中国周边国家语言资源库建设[J].语言规划学研究,2018,0(2):32-37. 被引量：1
3胡竞宇.语言服务视域中的地方高校国际汉语教育改革[J].现代交际,2020(18):194-196.
4周莹.文化自觉:外语应用型人才培养之价值导向[J].中国多媒体与网络教学学报（电子版）,2020,0(7):140-141.
5李宝贵,李慧.2007~2018年汉语国际传播的研究热点主题及其演进[J].中华文化海外传播研究,2019(1):189-209. 被引量：3
6那日松,乐明.近十年中国对外汉语教学研究动态考察——兼论“一带一路”倡议对对外汉语教学研究的影响[J].对外汉语研究,2018,0(2):173-183. 被引量：2
7杨言洪,王晓宇.中国与中东“语言互通”贸易价值研究与人才培养启示[J].山东师范大学学报（人文社会科学版）,2018,63(6):57-65. 被引量：9
8张如梅.“一带一路”视野下西南地区高校面向南亚东南亚国际汉语人才的区域化培养[J].大理大学学报,2016,1(11):95-100. 被引量：11
9张日培,刘思静.“一带一路”语言规划与全球语言生活治理[J].新疆师范大学学报（哲学社会科学版）,2017,38(6):93-102. 被引量：29
10申霄.“一带一路”建设语言培训问题及建议[J].语言教育,2017,0(4):2-6. 被引量：4

1沈婥.贴近生活,彰显作文的生命力[J].作文成功之路,2023(44):24-25.
2吴国繁.借鉴名著中的写作技巧和方法——以《三国演义》为例[J].初中生写作（下半月）,2024(1):113-115.
3邓昭坤.基于“实用性阅读与交流”学习任务群的小学语文教学探究[J].小学阅读指南（导学版）,2024(4):46-48.
4郭雷,周兰江,周蕾越.融合词性句法位置特征的汉老双语句子相似度计算[J].中文信息学报,2023,37(12):76-86.
5李霄垅.老挝的语言政策变迁及其原因[J].西安外国语大学学报,2023,31(4):47-52.
6李淑杰,侯丽敏,孙雪莲,梁潇,肖倩.ICU机械通气患者沟通需求的质性研究[J].中华现代护理杂志,2024,30(9):1137-1142.
7陆文文.以应用语言学为基础的茶文化英语翻译策略探究[J].海外英语,2024(5):181-183.
8邸韫博,张庆余,吴月玲,张颖.豆蔻酰化在肿瘤治疗中的研究进展[J].肿瘤研究与临床,2023,35(12):957-960.
9余典.网络语言对学生写作的影响探讨[J].杂文月刊（下半月）,2023(8):4-6.
10李雨函.指向实践能力的应用语言学教学路径探索[J].新课程研究,2024(9):58-60.

计算机工程

2024年第4期

浏览历史

内容加载中请稍等...

面向“一带一路”的低资源语言机器翻译研究

参考文献3

二级参考文献4

共引文献77

相关作者

相关机构

相关主题

浏览历史