低频词表示增强的低资源神经机器翻译被引量：5

Low Resource Neural Machine Translation with Enhanced Representation of Rare Words

下载PDF

导出

摘要在神经机器翻译过程中,低频词是影响翻译模型性能的一个关键因素。由于低频词在数据集中出现次数较少,训练经常难以获得准确的低频词表示,该问题在低资源翻译中的影响更为突出。该文提出了一种低频词表示增强的低资源神经机器翻译方法。该方法的核心思想是利用单语数据上下文信息来学习低频词的概率分布,并根据该分布重新计算低频词的词嵌入,然后在所得词嵌入的基础上重新训练Transformer模型,从而有效缓解低频词表示不准确问题。该文分别在汉越和汉蒙两个语言对四个方向上分别进行实验,实验结果表明,该文提出的方法相对于基线模型均有显著的性能提升。 In neural machine translation,the low-frequency word is a key factor affecting the quality of the translation output,which is more prominent in low-resource scenario.This paper proposes a low-resource neural machine translation method with enhanced the representation of low-frequency words.The main idea is to use monolingual data context information to learn the probability distribution of low-frequency words,and recalculate the word embeddings of low-frequency words based on this distribution.The Transformer model is then re-trained by the new word embeddings,thereby effectively alleviating the problem of representing low-frequency words inaccurately.The experimental results in the four directions between Chinese and Vietnamese,Chinese and Mongolian translation tasks show that the method proposed in this paper has a significant improvement over the baseline model.

作者朱俊国杨福岸余正涛邹翔张泽锋 ZHU Junguo;YANG Fuan;YU Zhengtao;ZOU Xiang;ZHANG Zefeng(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650500,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming,Yunan 650500,China)

机构地区昆明理工大学信息工程与自动化学院昆明理工大学云南省人工智能重点实验室

出处《中文信息学报》 CSCD 北大核心 2022年第6期44-51,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61732005,62166022,61866020) 云南省科技厅面上项目(202101AT076077) 云南省人培项目(KKSY201903018)。

关键词低频词表示信息增强低资源神经机器翻译 low-frequency word representation information enhancement low resources neural machine translation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献55

1刘学.基于字符识别的收割机机器视觉研究[J].农机化研究,2020,42(10):47-50. 被引量：3
2贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
3冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
4刘群.机器翻译研究新进展[J].当代语言学,2009,11(2):147-158. 被引量：42
5张家俊,翟飞飞,宗成庆.A Substitution-Translation-Restoration Framework for Handling Unknown Words in Statistical Machine Translation[J].Journal of Computer Science & Technology,2013,28(5):907-918. 被引量：2
6李业刚,黄河燕,史树敏,冯冲,苏超.多策略机器翻译研究综述[J].中文信息学报,2015,29(2):1-9. 被引量：21
7于施洋,杨道玲,王璟璇,傅娟.“一带一路”数据资源归集体系建设[J].电子政务,2017(1):8-14. 被引量：18
8李强,王强,肖桐,朱靖波.稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究[J].计算机学报,2017,40(4):925-938. 被引量：10
9王华树,张成智.大数据时代译者的搜索能力探究[J].中国科技翻译,2018,31(4):26-29. 被引量：29
10李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：108

引证文献5

1张昕煜.基于机器视觉技术的生态翻译机器错误文本检测方法设计[J].自动化与仪器仪表,2023(10):179-182.
2王琳,刘伍颖.同源语料增强的低资源神经机器翻译[J].中文信息学报,2024,38(2):54-60.
3马畅,田永红,郑晓莉,孙康康.基于知识蒸馏的神经机器翻译综述[J].计算机科学与探索,2024,18(7):1725-1747.
4朱玉.ChatGPT时代翻译实践的未来图景及对策研究[J].外文研究,2024,12(3):72-79.
5张津一,郭聪,高忠辉.基于语言知识的神经机器翻译研究进展[J].人工智能与机器人研究,2023,12(2):97-106.

1于志强,余正涛,黄于欣,郭军军,高盛祥.基于变分信息瓶颈的半监督神经机器翻译[J].自动化学报,2022,48(7):1678-1689. 被引量：5

中文信息学报

2022年第6期

浏览历史

内容加载中请稍等...

低频词表示增强的低资源神经机器翻译被引量：5

同被引文献55

引证文献5

相关作者

相关机构

相关主题

浏览历史

低频词表示增强的低资源神经机器翻译 被引量：5

同被引文献55

引证文献5

相关作者

相关机构

相关主题

浏览历史

低频词表示增强的低资源神经机器翻译被引量：5