深度递归的层次化机器翻译模型被引量：28

Hierarchical Machine Translation Model Based on Deep Recursive Neural Network

下载PDF

导出

摘要深度学习在自然语言处理中有很多的应用.深度网络的主要作用是捕获隐藏在语言结构中更深的语义信息.该文出发点为根据原有句子中的对齐作为深度网络生成结构的指导,并融合原有深度翻译模型的优点,提出了深度递归的层次化机器翻译模型.相对于已有的神经翻译模型来说,更好地结合了层次化的翻译过程,同时这种方法结合循环神经网络和递归神经网络的优点.层次化规则的归纳包含两个部分:短语的归纳和形式化规则的归纳,而在该文的建模过程中模拟了这两个部分且符合归纳过程.该文在训练中采用单词级语义错误、单语短语/规则语义错误和双语短语/规则语义错误构造目标函数,训练中能够更好平衡语义中3个部分的影响,同时考虑到对齐信息以指导层次化深度神经网络的训练.在解码过程中通过生成部分翻译结果的语义向量,最终得到句子间的语义关系,这样可以在语法结构中加入语义信息,克服了原有层次化模型语义信息缺乏的问题.该模型的实验结果说明了深度递归的层次化机器翻译模型的有效性,相对于经典的基线系统提高了1.49~1.84BLEU分数. Deep Learning has many applications in natural language processing. The main role isto capture the deeper semantic information hidden in the language structure through the deep network. The motivation of this paper is that we use the word alignment of the bilingual sentence as the guide to generate the structure of deep network,and combine these advantages of the original deep translation model. The paper proposes Hierarchical Recursive Neural Network （HRNN） for hierarchical machine translation model. Compared with the existing neural translation model, the model is a better combination of phrase-based hierarchical translation model and deep neural network. It has two advantages of Recurrent Neural Network （R TN N ） and Recursive Neural Network （RENN）. The procedure of phrase and formal rule induction can be simulated in HRNN ？ and the model meets induction procedure. In training procedure, the objection function of this paper include the monolingual word-level semantic errors, the monolingual phrase/rule semantic errors and the bilingual phrase/rule semantic error, and the semantic effect of three parts are balanced in statistical machine translation （SMT）. In decoding procedure,the semantic relation among sentences are obtained by the semantic vector of partial translation result, and this method, which the semantic information is added to the syntax structure, overcomes the lack of semantic information in the original model. The experimental results show that HRNN signiti- cantly improves the performance of a state-of-the-art SMT baseline system, leading to a gain of 1. 49-1. 84 BLEU points.

作者刘宇鹏马春光张亚楠

机构地区哈尔滨工程大学计算机科学与技术学院哈尔滨理工大学软件学院

出处《计算机学报》 EI CSCD 北大核心 2017年第4期861-871,共11页 Chinese Journal of Computers

基金国家自然科学基金(61300115) 中国博士后科学基金(2014M561331) 黑龙江省教育厅科技研究项目(12521073)资助~~

关键词循环神经网络递归神经网络词/短语/规则嵌入层次化递归神经网络自然语言处理 recurrent neural network recursive neural network word/phrase/rule embedding hierarchical recursive neural network natural language processing

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献194

1褚晓敏,奚雪峰,蒋峰,徐昇,朱巧明,周国栋.宏观篇章结构表示体系和语料建设[J].软件学报,2020,31(2):321-343. 被引量：5
2蔡基刚.重视大学英语翻译教学提高学生英语应用能力[J].中国翻译,2003,24(1):65-68. 被引量：297
3许国璋.借鉴与拿来[J].外国语,1979,2(3):3-15. 被引量：11
4柯平.欧美的机器翻译[J].中国翻译,1995(2):49-56. 被引量：16
5许国璋.语言符号的任意性问题——语言哲学探索之一[J].外语教学与研究,1988,20(3):2-10. 被引量：248
6许国璋.布龙菲尔德和索绪尔[J].外语教学与研究,1989,21(2):2-7. 被引量：5
7葛传椝.漫谈由汉译英问题[J].中国翻译,1980(2):1-8. 被引量：419
8顾曰国.John Searle的言语行为理论:评判与借鉴[J].当代语言学,1994(3):10-16. 被引量：90
9刘群.机器翻译技术现状与展望[J].集成技术,2012,1(1):48-54. 被引量：16
10白解红.语境与意义[J].外语与外语教学,2000(4):21-24. 被引量：85

引证文献28

1周岚.浅析基于C语言的单片机技术[J].软件工程,2016,19(5):30-31. 被引量：3
2胡红磊.试论译者能力的提高[J].上海建桥学院学报,2017(3):54-58.
3杨兰.基于机器码学习的跨域应用程序的Web技术研究[J].自动化与仪器仪表,2017(12):181-183. 被引量：1
4卢蓉.基于语义网络的英语机器翻译模型设计与改进[J].现代电子技术,2018,41(14):126-129. 被引量：5
5刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.基于门控循环神经网络词性标注的蒙汉机器翻译研究[J].中文信息学报,2018,32(8):68-74. 被引量：3
6乌尼尔,苏依拉,刘婉婉,仁庆道尔吉.基于CNN词根形态选择模型的改进蒙汉机器翻译研究[J].中文信息学报,2018,32(5):42-48. 被引量：7
7叶晓龙.51单片机C语言编程技巧探讨[J].信息与电脑,2019,31(4):66-67. 被引量：2
8张胜刚,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提.亚词及单词深度维汉机器翻译模型对比[J].计算机工程与设计,2019,40(8):2326-2330. 被引量：6
9冯兴杰,张乐,曾云泽.基于多注意力CNN的问题相似度计算模型[J].计算机工程,2019,45(9):284-290. 被引量：15
10孙晓丽,郭艳,李宁,宋晓祥.基于seq2seq模型的深度学习密码破译方法[J].通信技术,2019,52(9):2217-2222.

二级引证文献173

1刘芳.人工智能背景下应用型大学英语专业教学辅助系统平台的研究与实践探究[J].现代英语,2020(9):22-24. 被引量：1
2阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：6
3张焱,解鹏飞,冉春秋,王万雷,汪语哲.基于51单片机控制的家用电子相册的设计和制作[J].软件工程,2017,20(3):45-47. 被引量：1
4魏鹏飞.一种婴儿培养箱多参数中央监控系统的设计[J].中国医疗设备,2019,34(6):66-69. 被引量：3
5苏依拉,张振,仁庆道尔吉,牛向华,高芬,赵亚平.Transformer-CRF词切分方法在蒙汉机器翻译中的应用[J].中文信息学报,2019,33(10):38-46. 被引量：4
6陆芳,魏李婷.大数据背景下大学生学习状态研究的方法探析[J].黑龙江高教研究,2019,37(12):143-148. 被引量：10
7严均,周煌辉.C语言在单片机开发中的应用分析[J].电脑知识与技术,2020,16(3):265-266. 被引量：2
8刘大运,房国志,骆天依,魏华杰,王倩,李修政,李骜.基于BiLSTM-Attention唇语识别的研究[J].计算技术与自动化,2020,39(1):150-155. 被引量：2
9程晓悦,赵龙章,胡穹,史家鹏.基于密集层和注意力机制的快速语义分割[J].计算机工程,2020,46(4):247-252. 被引量：9
10党莎莎,龚小涛.基于改进GLR算法的智能识别英语翻译模型设计[J].计算机测量与控制,2020,28(4):161-164. 被引量：6

1颜飞,柏逢明,李永哲.混沌加密和NSCT图像数字水印算法研究[J].长春理工大学学报（自然科学版）,2011,34(4):133-136. 被引量：3
2顾伯成,吴健珍.基于DCT的医疗图像数字水印算法[J].科教导刊,2015(1):137-138.
3王娟,林耀进,王育齐.支持向量机与奇异值分解的盲水印算法[J].计算机科学,2014,41(11):212-215. 被引量：2
4蒋学文,代劲.基于LOTOS对象模型的并发形式化研究[J].重庆工商大学学报（自然科学版）,2006,23(2):164-168.
5刘艳,郝忠孝.基于Δ-tree的自底向上的深度递归KNN查询算法[J].计算机应用研究,2011,28(8):2889-2892. 被引量：2
6荚伟,高仲仪.用遗传算法实现软件结构测试数据的自动生成[J].计算机与数字工程,1996,24(1):7-14. 被引量：2
7毛勇华,桂小林,李前,贺兴时.深度学习应用技术研究[J].计算机应用研究,2016,33(11):3201-3205. 被引量：58
8赵永,王玲.基于混沌置乱的DCT域灰度级盲水印算法[J].信息安全与通信保密,2007,29(6):215-216. 被引量：1
9陈朝辉.基于变换域离散小波变换音频水印算法研究[J].数字技术与应用,2012,30(11):129-130.
10王晨旸,李新华.基于双正交小波变换的彩色图像水印嵌入算法[J].安徽大学学报（自然科学版）,2013,37(6):65-71. 被引量：4

计算机学报

2017年第4期

浏览历史

内容加载中请稍等...

深度递归的层次化机器翻译模型被引量：28

同被引文献194

引证文献28

二级引证文献173

相关作者

相关机构

相关主题

浏览历史

深度递归的层次化机器翻译模型 被引量：28

同被引文献194

引证文献28

二级引证文献173

相关作者

相关机构

相关主题

浏览历史

深度递归的层次化机器翻译模型被引量：28