基于图卷积编码器的蒙汉神经机器翻译被引量：1

MONGOLIAN AND CHINESE NEURAL MACHINE TRANSLATION BASED ON GRAPH CONVOLUTIONAL ENCODER

下载PDF

导出

摘要基于神经网络模型的蒙汉机器翻译严格采用编码器-解码器的序列建模方式,不能有效利用句法信息以及语言的层次结构信息。为将句法结构信息融入蒙汉机器翻译以提高其翻译性能,提出在源语言端采用双编码器,同时对源句和由源句解析而来的句法依存树进行编码;由于蒙汉机器翻译中经常会出现未登录词问题,因此将使用字节对编码技术预处理蒙古语。为解决机器翻译中的过度矫正问题,在训练阶段,模型以一定的概率从正确标注的序列中和预测生成的序列中采样上下文单词。在120万蒙汉平行语料的实验中证明,该方法相较于传统的BiRNN和CNN,BLEU值分别提高了2.69和2.09。 Mongolian and Chinese machine translation based on neural network model strictly adopts encoder-decoder sequence modeling,which can not effectively use syntactic information and language hierarchy information.In order to integrate syntactic structure information into Mongolian-Chinese machine translation to improve its translation performance,this paper proposed to use a dual encoder on the source language side to encode the source sentence and the syntactic dependency tree derived from the source sentence at the same time.Due to the frequent occurrence of unregistered words in Mongolian Chinese machine translation,byte pair encoding technology was used to preprocess Mongolian language.In order to solve the problem of over-correction in machine translation,in the training phase,the model sampled context words from the correctly labeled sequence and the predicted sequence with a certain probability.Experiments on 1.2 million Mongolian-Chinese parallel corpus prove that compared with the traditional BiRNN and CNN,the BLEU value of the proposed method increased by 2.69 and 2.09 respectively.

作者薛媛苏依拉仁庆道尔吉石宝李雷孝 Xue Yuan;Su Yila;Ren Qingdaoerji;Shi Bao;Li Leixiao(College of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080,Inner Mongolia,China)

机构地区内蒙古工业大学信息工程学院

出处《计算机应用与软件》北大核心 2023年第10期70-75,89,共7页 Computer Applications and Software

基金国家自然科学基金项目(61966028,61966027)。

关键词依存句法树图卷积编码字节对编码蒙汉机器翻译 Dependency-syntax tree Graph convolutional encoder Byte pair encoder Mongolian-Chinese machine translation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1银花,王斯日古楞,艳红.基于短语的蒙汉统计机器翻译系统的设计与实现[J].内蒙古师范大学学报（自然科学汉文版）,2011,40(1):91-94. 被引量：8
2孙晓骞,苏依拉,赵亚平,王宇飞,仁庆道尔吉.基于编码器-解码器重构框架的蒙汉神经机器翻译[J].计算机应用与软件,2020,37(4):150-155. 被引量：6
3刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：109
4蒋宏飞,李生,张民,赵铁军,杨沐昀.基于同步树序列替换文法的统计机器翻译模型[J].自动化学报,2009,35(10):1317-1326. 被引量：2
5陈韵,张鹏华,任利华.机器翻译研究述评[J].价值工程,2013,32(1):174-176. 被引量：3

二级参考文献48

1杨宪泽,雷开彬,吴守宪,张上游,宁爱华.一种句型转换和近似机器翻译方法及算法[J].计算机工程与科学,2005,27(11):66-68. 被引量：7
2刘康龙,穆雷.语料库语言学与翻译研究[J].中国翻译,2006,27(1):59-64. 被引量：47
3侯宏旭,刘群,那顺乌日图.基于实例的汉蒙机器翻译[J].中文信息学报,2007,21(4):65-72. 被引量：16
4Wu D K. Stochastic inversion transduction grammars and bilingual parsing of parallel corpora. Computational Linguistics, 1997, 23(3): 377-403.
5Chiang D. A hierarchical phrase-based model for statistical machine translation. In: Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. Ann Arbor, Michigan: Association for Computational Linguistics, 2005. 263-270.
6Liu Y, Liu Q, Lin S X. Tree-to-string alignment template for statistical machine translation. In: Proceedings of the 21st International Conference on Computational Linguistics and the 44th Annual Meeting of the Association for Computational Linguistics. Sydney, Australia: Association for Computational Linguistics. 2006. 609-616.
7Liu Y, Huang Y, Liu Q, Lin S X. Forest-to-string statistical translation rules. In: Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics. Prague, Czech Republic: Association for Computational Linguistics, 2007. 704-711.
8Xiong D Y, Liu Q, Lin S X. Maximum entropy based phrase reordering model for statistical machine translation. In: Proceedings of the 21st International Conference on Computational Linguistics and the 44th Annual Meeting of the Association for Computational Linguistics. Sydney, Australia: Association for Computational Linguistics, 2006. 521-528.
9Galley M, Hopkins M, Knight K, Marcu D. What's in a translation rule? In: Proceedings of the 2004 Conference of the North American Chapter of the Association for Computational Linguistics. Boston, USA: Association for Computational Linguistics, 2004. 273-280.
10Eisner J. Learning non-isomorphic tree mappings for machine translation. In: Proceedings of the 41st Annual Meeting on Association for Computational Linguistics. Sapporo, Japan: Association for Computational Linguistics, 2003. 205-208.

共引文献122

1赵莹莹.机器翻译与人工翻译特点对比与关系分析[J].作家天地,2020(13):30-31.
2熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
3王醒.译军突起:人工翻译能否经受住机器翻译的考验?[J].现代英语,2021(10):72-74. 被引量：1
4贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
5朱婕.汉韩机器翻译错误分析[J].大众标准化,2021(2):134-136.
6夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：15
7张有礼.在西医病房会诊的体会[J].中医杂志,2000,41(4):212-213.
8王春荣,王斯日古楞,阿荣.基于层次短语的汉蒙统计机器翻译研究[J].内蒙古师范大学学报（自然科学汉文版）,2013,42(3):350-353. 被引量：2
9姚振军,郑旭红,徐鹏涛,王继升.面向《道德经》英译的基于短语的机器翻译探析[J].山东外语教学,2013,34(3):109-112. 被引量：3
10玉霞,王斯日古楞.蒙古文词性标注及融合词性因子的蒙汉统计机器翻译[J].内蒙古师范大学学报（自然科学汉文版）,2015,44(3):364-367. 被引量：1

同被引文献11

1丁正生,马春洁.改进词向量和kNN的中文文本分类算法[J].现代电子技术,2022,45(1):100-103. 被引量：11
2刘俊鹏,黄锴宇,李玖一,宋鼎新,黄德根.基于多覆盖模型的神经机器翻译[J].软件学报,2022,33(3):1141-1152. 被引量：9
3邹东尧,王斌,王丽萍.改进Tree⁃LSTM网络的情感分析方法[J].现代电子技术,2022,45(9):66-71. 被引量：2
4胡章芳,蹇芳,唐珊珊,明子平,姜博文.DFSMN-T:结合强语言模型Transformer的中文语音识别[J].计算机工程与应用,2022,58(9):187-194. 被引量：13
5胡泽林,高翊,李淼,曹宜超.基于字符级语言建模的汉蒙神经机器翻译方法研究[J].昆明理工大学学报（自然科学版）,2023,48(3):85-92. 被引量：2
6卫婷,张鹏程,金惠颖.移动边缘计算中基于LSTM和高斯隐藏贝叶斯的主动QoS监控方法[J].小型微型计算机系统,2023,44(7):1550-1556. 被引量：2
7毛琳,任凤至,杨大伟,张汝波.基于卷积神经网络的全景分割Transformer模型[J].软件学报,2023,34(7):3408-3421. 被引量：7
8宫昀.基于Transformer模型的神经机器翻译改进方法研究[J].自动化与仪器仪表,2023(8):257-261. 被引量：2
9赵亮,周继开.基于重组性高斯自注意力的视觉Transformer[J].自动化学报,2023,49(9):1976-1988. 被引量：4
10李成路,许凤.融入句法结构信息的句子级情感分析算法[J].计算机与数字工程,2023,51(6):1310-1315. 被引量：1

引证文献1

1李珍.基于连续词袋模型的神经机器翻译模型优化研究[J].自动化与仪器仪表,2024(11):48-52.

1张洋,江铭虎.基于句法树节点嵌入的作者识别方法[J].清华大学学报（自然科学版）,2023,63(9):1390-1398.
2何丽,杨美华,刘璐瑶.融合SPO语义和句法信息的事件检测方法[J].数据分析与知识发现,2023,7(9):114-124.
3林弘烨,裘君,潘泽民,杨捷.加强空间信息引导的道路场景实时语义分割[J].国外电子测量技术,2023,42(7):8-15.
4何儒汉,万方名,胡新荣,刘军平.基于动态规划和流形排序的知识库问答未登录词处理[J].计算机应用与软件,2023,40(10):64-69.
5郑鑫,陈海龙,马玉群,王青.融合依存句法和LSTM的神经机器翻译模型[J].哈尔滨理工大学学报,2023,28(3):20-27. 被引量：6
6张文豪,廖列法,王茹霞.融合句法树多信息学习方面级情感分析[J].计算机工程,2023,49(10):72-79.
7陈奥博,章浩然,吴霖.基于双判别器的汉泰伪平行语料生成方法[J].现代电子技术,2023,46(20):81-85.
8王紫琪,李宇璇,谢曦,李月红.浅析电影《长津湖》字幕翻译中的归化与异化[J].海外文摘,2023(6):126-128.
9王百惠.浅谈俄汉翻译过程中的语义内涵流失如何避免[J].教育教学（环宇）,2021,3(7):35-35.
10罗松,汪春梅,袁非牛,戴维.基于差分融合句法特征的英语语法纠错模型[J].计算机系统应用,2023,32(10):293-300.

计算机应用与软件

2023年第10期

浏览历史

内容加载中请稍等...

基于图卷积编码器的蒙汉神经机器翻译被引量：1

参考文献5

二级参考文献48

共引文献122

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于图卷积编码器的蒙汉神经机器翻译 被引量：1

参考文献5

二级参考文献48

共引文献122

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于图卷积编码器的蒙汉神经机器翻译被引量：1