EM算法在神经机器翻译模型中的应用研究被引量：3

APPLICATION OF EM ALGORITHM IN NEURAL MACHINE TRANSLATION MODEL

下载PDF

导出

摘要传统的机器翻译模型的性能受限于双语平行语料库的规模,仅使用单语数据的无监督机器翻译方法难以有效保证模型性能的稳定。针对该问题,提出一种联合EM算法的自动语料扩充方法。利用生成的单语料结合原数据集构建平行语料,进行模型的迭代训练。根据部分双语语料初始化预训练两个单向Transformer模型;通过联合EM算法进行模型优化;通过逐渐减少训练数据的翻译损失来迭代更新两个相对翻译任务上机器翻译模型。实验结果表明,基于单双语料混合的EM迭代训练方法相比使用全双语数据的监督机器翻译方法和仅使用单语数据的无监督机器翻译方法,在中英机器翻译任务上具有更好的表现。 The performance of traditional machine translation models is limited by the size of bilingual parallel corpus,and the unsupervised machine translation method using only monolingual data is difficult to effectively ensure the stability of model performance.In view of this problem,this paper proposes a method of automatic corpus expansion by combining EM algorithm.The parallel corpus was constructed by using the generated monolingual corpus combined with the original datasets,so as to train the model iteratively.The algorithm initialized and pre-trained two unidirectional Transformer model according to part of bilingual corpus.Then,the model was optimized by combining EM algorithm,and the machine translation model on two relative translation tasks was updated iteratively by gradually reducing the translation loss of training data.The experimental results show that the EM iterative training method based on corpus mixing of monolingual and bilingual has a better performance in Chinese and English machine translation tasks than the supervised machine translation method using fully bilingual data and the unsupervised machine translation method using only monolingual data.

作者杨云王全 Yang Yun;Wang Quan(Institute of Electronic Information and Artificial Intelligence,Shaanxi University of Science and Technology,Xi’an 710021,Shaanxi,China)

机构地区陕西科技大学电子信息与人工智能学院

出处《计算机应用与软件》北大核心 2020年第8期250-255,共6页 Computer Applications and Software

基金国家自然科学基金项目(61601271)。

关键词语料扩充 EM算法迭代训练 TRANSFORMER 语料混合 Corpus expansion EM algorithm Iterative training Transformer Corpus mixing

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：107
2李强,王强,肖桐,朱靖波.稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究[J].计算机学报,2017,40(4):925-938. 被引量：10
3周张萍,黄荣城,王博立,胡金铭,史晓东,陈毅东.基于增量式自学习策略的多语言翻译模型[J].厦门大学学报（自然科学版）,2019,58(2):170-175. 被引量：6
4蔡子龙,杨明明,熊德意.基于数据增强技术的神经机器翻译[J].中文信息学报,2018,32(7):30-36. 被引量：21
5刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：107
6吴焕钦,张红阳,李静梅,朱俊国,杨沐昀,李生.基于伪数据的机器翻译质量估计模型的训练[J].北京大学学报（自然科学版）,2018,54(2):279-285. 被引量：3

二级参考文献1

1焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：368

共引文献211

1熊璨.论人工智能翻译的可能性——从翻译的三个层次看非文学与文学翻译[J].中外文化与文论,2020(2):106-115. 被引量：2
2赵莹莹.机器翻译与人工翻译特点对比与关系分析[J].作家天地,2020(13):30-31.
3王醒.译军突起:人工翻译能否经受住机器翻译的考验?[J].现代英语,2021(10):72-74. 被引量：1
4贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
5明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
6邓凌云,余环.中外笔译质量要求的对比研究与启示[J].当代外语研究,2019,0(4):115-123.
7朱婕.汉韩机器翻译错误分析[J].大众标准化,2021(2):134-136.
8夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：11
9赵玉蓉,刘欢,龙玟月,杨鑫,杨茜,阮先玉.浅析张培基英译散文风格与AI英译散文风格[J].新东方英语（中英文版）,2019,0(12):101-102.
10李思特.基于自然语言处理的人工智能歌词创作[J].中国科技纵横,2019,0(14):41-42.

同被引文献26

1包凯.谷歌翻译汉译英错误类型及纠错方法初探[J].中国科技翻译,2017,30(4):20-23. 被引量：17
2陆雯洁,谭儒昕,刘功申,孙环荣.基于半监督学习的小语种机器翻译算法[J].厦门大学学报（自然科学版）,2019,58(2):200-208. 被引量：8
3廖彬全,罗佩,马远佳.基于智能语音交互系统的翻译机器人[J].信息与电脑,2019,0(17):110-112. 被引量：11
4宁会峰,鄢志彬,李晓,车国栋,王伟志,高远.移动式光伏组件清扫机械臂D-H模型与运动规划[J].太阳能学报,2019,40(12):3541-3547. 被引量：9
5徐媛媛.基于传播学视域的高校网页英文翻译系统设计与实现[J].自动化技术与应用,2020,39(5):174-177. 被引量：2
6吕欣,程雨夏.基于语义相似度与XGBoost算法的英语作文智能评价框架研究[J].浙江大学学报（理学版）,2020,47(3):329-336. 被引量：11
7罗飞.基于机器学习的汉英翻译自动校准方法研究[J].自动化与仪器仪表,2020(8):146-149. 被引量：3
8姚兰.基于改进短语翻译模型的计算机智能化校对系统研究[J].电子设计工程,2020,28(18):52-55. 被引量：10
9头旦才让,仁青东主,尼玛扎西,于永斌,邓权芯.基于改进字节对编码的汉藏机器翻译研究[J].电子科技大学学报,2021,50(2):249-255. 被引量：13
10范洪博,郑棋.多机制合并注意力的多路径神经机器翻译方法[J].光电子．激光,2021,32(5):491-498. 被引量：4

引证文献3

1王小迁.基于计算机智能的英语译文语境化自动校准系统[J].微型电脑应用,2021,37(11):158-160. 被引量：2
2于爱莲.基于D-H模型的翻译机器人自动控制系统设计研究[J].自动化与仪器仪表,2024(5):163-167.
3雷宏友.融合聚类算法与改进粒子群算法的机器翻译句式一致性研究[J].自动化与仪器仪表,2024(6):179-183.

二级引证文献2

1周原.基于自然语言处理的纠错系统架构设计[J].太原师范学院学报（自然科学版）,2022,21(3):37-41. 被引量：3
2魏文萍,郭渠成.融合MLP与循环神经网络算法的语法自动纠错方法研究[J].自动化与仪器仪表,2023(10):135-138.

1潘明阳,李琦,盛尊阔,韩斌,李超,李邵喜.AIS拼音船名到汉字的智能翻译技术[J].大连海事大学学报,2020,46(2):41-48. 被引量：2
2邹瑶琳,戈玲玲.从顺应论视角探讨《大漠祭》中隐喻的翻译[J].文化学刊,2020,0(4):175-178. 被引量：1
3郑中.字幕翻译过程中主语“我”的省略:基于视听翻译语料库的研究[J].翻译界,2019(2):63-77.
4李国华,陈陈林.湖州市旅游外宣材料汉俄平行语料库建设及应用研究[J].海外文摘,2020(5):13-15.
5王晓昆,温显斌.基于样本选择策略的SAR图像半监督分类算法[J].天津理工大学学报,2020,36(3):23-29. 被引量：3
6许昶雯,汪真,陈国兵,张进,张磊.水铝钙石吸附水中F^-的条件优化[J].滁州学院学报,2020,22(2):48-52.
7宋余庆,谢熹,刘哲,邹小波.基于多层EESP深度学习模型的农作物病虫害识别方法[J].农业机械学报,2020,51(8):196-202. 被引量：34
8邵毅明,钟颖,吴文文,胡广雪.基于熵权TOPSIS法的短时交通流预测模型性能综合评价[J].重庆理工大学学报（自然科学）,2020,34(7):205-211. 被引量：14
9刘贞文,徐玲杰,陈孝敬.深度自编码器的近红外光谱转移研究[J].光谱学与光谱分析,2020,40(7):2313-2318. 被引量：2
10杜炤鑫,谢海宁,宋杰,周德生,邹晓峰,陈冉,曾平.基于图像处理和深度学习的配网跳闸故障识别方法[J].中国科学技术大学学报,2020,50(1):39-48. 被引量：5

计算机应用与软件

2020年第8期

浏览历史

内容加载中请稍等...

EM算法在神经机器翻译模型中的应用研究被引量：3

参考文献6

二级参考文献1

共引文献211

同被引文献26

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

EM算法在神经机器翻译模型中的应用研究 被引量：3

参考文献6

二级参考文献1

共引文献211

同被引文献26

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

EM算法在神经机器翻译模型中的应用研究被引量：3