基于融合CNN和Transformer的分离结构机器翻译模型被引量：7

Separate structure machine translation model based on fusion of CNN and Transformer

下载PDF

导出

摘要针对基于Transformer的机器翻译模型中存在的运行效率不高、计算参数过大以及计算复杂度过高的问题,提出一种基于融合CNN和Transformer的分离结构机器翻译模型。首先,对于运行效率不高和计算参数过大的问题,使用计算注意力模块和归一化模块分离的结构保证堆叠多层结构的可复用性,提高运行效率和降低计算参数。其次,引入了卷积计算模块和原始自注意力模块进行融合,原始自注意力模块用于计算全局上下文语义关系,卷积计算模块用于计算局部上下文语义关系,降低模型的复杂度。与其他机器翻译模型在相同的数据集进行实验对比,实验结果表明,该模型的计算参数最低,效果也比其他模型表现得更好。 To address the problems of inefficient operation,excessive computational parameters,and high computational complexity in the Transformer-based machine translation model,this paper proposed a separate structure machine translation model based on fused CNN and Transformer.Firstly,for the problems of inefficient operation and excessive computational parameters,this paper used the structure of separating computational attention module and normalization module to ensure the reusability of stacked multilayer structure,improve the operation efficiency and reduce the computational parameters.Secondly,the model introduced the convolutional computation module and the original self-attentive module for fusion.This paper used the original self-attentive module to calculate the global contextual semantic relations and the convolutional computation module to calculate the local contextual semantic relations to reduce the complexity of the model.Experimental comparisons with other machine translation models on the same dataset show that the model has the lowest computational parameters and performs better than other models.

作者葛君伟涂兆昊方义秋 Ge Junwei;Tu Zhaohao;Fang Yiqiu(College of Software Engineering,Chongqing University of Posts&Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学软件工程学院

出处《计算机应用研究》 CSCD 北大核心 2022年第2期432-435,共4页 Application Research of Computers

基金国家自然科学基金面上项目(62072066)。

关键词卷积注意力模块分离机器翻译 convolutional attention module separation machine translation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
2周孝青,段湘煜,俞鸿飞,张民.多层信息融合的神经机器翻译[J].厦门大学学报（自然科学版）,2019,58(2):149-157. 被引量：9

二级参考文献6

1戴新宇,尹存燕,陈家骏,郑国梁.机器翻译研究现状与展望[J].计算机科学,2004,31(11):176-179. 被引量：28
2李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：108
3刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：107
4高明虎,于志强.神经机器翻译综述[J].云南民族大学学报（自然科学版）,2019,28(1):72-76. 被引量：17
5李响,刘洋,陈伟,刘群.利用单语数据改进神经机器翻译压缩模型的翻译质量[J].中文信息学报,2019,0(7):46-55. 被引量：10
6刘群.统计机器翻译综述[J].中文信息学报,2003,17(4):1-12. 被引量：71

共引文献14

1熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
2付本静.基于多级知识表示结构的英语动词同形区分方法[J].赤峰学院学报（自然科学版）,2020,36(1):41-44.
3刘丹.基于机器学习的特色词汇翻译在线生成方法研究[J].齐齐哈尔大学学报（自然科学版）,2020,36(4):4-8. 被引量：1
4谢林枫,李同哲,李昆明,石星煜.基于一种新技术的风电功率短期预测[J].计算机仿真,2020,37(7):149-154. 被引量：3
5孙夏.基于无监督学习的英语语义翻译准确性评定系统设计[J].普洱学院学报,2021,37(1):82-85. 被引量：1
6王晶,赵彩.基于平行语料库的神经机器英语翻译方法研究[J].自动化与仪器仪表,2021(8):5-8. 被引量：1
7陈瑞.基于LSTM注意力嵌入的英语机器翻译研究[J].自动化与仪器仪表,2021(10):140-143. 被引量：5
8郭慧骏.基于人工智能技术和语音识别的机器同步翻译系统[J].现代电子技术,2022,45(9):152-156. 被引量：14
9程维库,梁洁.基于Markov网络的双语翻译译本质量评价方法[J].自动化与仪器仪表,2022(6):27-31. 被引量：1
10李蓉.多目标优化路由算法在英语翻译软件中的应用[J].自动化技术与应用,2022,41(9):184-186. 被引量：3

同被引文献82

1熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
2李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
3董永胜,陈为高,侯佃平,孙宝昌.智能化选煤厂研究与建议[J].工矿自动化,2021,47(S01):26-31. 被引量：22
4Mei-Sen Pan,Jun-Biao Yan,Zheng-Hong Xiao.Vehicle License Plate Character Segmentation[J].International Journal of Automation and computing,2008,5(4):425-432. 被引量：6
5张俊峰.胶带输送机上清除煤中杂物的方法[J].中州煤炭,2005(5):47-48. 被引量：5
6杨成甫,陈朴,吴健,孙玉芳.多语言Web网站的结构与实现方法[J].计算机应用研究,2006,23(2):131-134. 被引量：4
7谷琳,乔晓春.我国老年人健康自评影响因素分析[J].人口学刊,2006,28(6):25-29. 被引量：107
8邹永星,钱盛友,王润民.基于图像特征的车牌字符分割方法研究[J].湖南师范大学自然科学学报,2007,30(4):60-64. 被引量：5
9张菲菲,薛贺,李建良.多语言Web网站的设计与实现[J].微电子学与计算机,2008,25(5):43-45. 被引量：8
10张亚娟,付辉,王学春.基于动态技术的多语言网站研究与设计[J].现代计算机,2010,16(3):128-130. 被引量：8

引证文献7

1陈凡,宋文革,范誉瀚,陈塞.基于CNN-Transformer融合模型的选煤厂振动筛上杂物语义分割研究[J].煤炭工程,2023,55(S01):193-199. 被引量：1
2张少宇.基于Transformer技术的机器翻译设计与开发[J].信息与电脑,2023,35(2):173-176. 被引量：1
3宫昀.基于Transformer模型的神经机器翻译改进方法研究[J].自动化与仪器仪表,2023(8):257-261. 被引量：1
4杨立鹏,郝晓培,易超,段然,王思宇.铁路12306互联网售票系统多语言服务方案及自动翻译模型研究[J].铁道运输与经济,2023,45(10):35-41.
5陈克金,叶善力.基于ERNIE与多特征融合的中文命名实体识别[J].浙江科技学院学报,2023,35(5):421-429.
6李玥,张承蒙,黄成烨,索浩宇,胡新悦,刘娜,张雅璐,陈功.基于1D-ICNN的高维度数据下老年自评健康预测方法[J].医学信息,2024,37(14):25-32.
7白雯.融合跨语言记忆网络与语义信息的神经机器翻译系统架构设计研究[J].自动化与仪器仪表,2024(5):178-181.

二级引证文献3

1阿里木·赛买提,沙丽瓦尔·阿里木,卡哈尔·卡迪尔,刘轩铭,凌震华,刘俊华.针对音变问题改进的维汉神经网络机器翻译鲁棒性方法研究[J].新疆师范大学学报（自然科学版）,2023,42(4):1-8.
2张少宇.计算机深度学习在视觉目标检测中的应用[J].信息与电脑,2023,35(17):4-6.
3王卫东,吕子奇,张成联,李江涛,刘钦聚,曾红久,孙美洁,涂亚楠.煤中杂物的危害与洗选过程中的有效清除方法[J].煤炭工程,2024,56(10):122-129.

1李正民,云红艳,王翊臻.基于BERT的多特征融合的医疗命名实体识别[J].青岛大学学报（自然科学版）,2021,34(4):23-29. 被引量：7
2谷峥岩,魏利胜.基于深度学习网络的轴承工件自动检测[J].电子测量与仪器学报,2021,35(9):80-88. 被引量：5
3吴婧,杨百龙,田罗庚.基于注意力迁移的跨语言关系抽取方法[J].计算机应用研究,2022,39(2):417-423. 被引量：1
4程坦,郭保华,孙杰豪,田世轩,孙崇轩,陈岩.非规则砂岩节理剪切变形本构关系试验研究[J].岩土力学,2022,43(1):51-64. 被引量：8
5郝玉莹,赵林,孙同,乔治.基于RF-LSTM的地表水体水质预测[J].水资源与水工程学报,2021,32(6):41-48. 被引量：14
6李明,闻伟,李秉军,牛志勇,陈学敏,梁昌晶.基于ICS-GRNN的油气管道剩余强度预测技术[J].焊管,2022,45(1):32-36. 被引量：1
7代国威,晏静香.基于Yolo的结直肠息肉CT影像分析算法研究[J].南通职业大学学报,2021,35(4):82-87. 被引量：1
8赵晋斌,王凯,李盼.基于深度学习的多维度证据要素关联关系抽取研究[J].中国电子科学研究院学报,2021,16(12):1251-1256. 被引量：1
9孟庆宽,杨晓霞,张漫,关海鸥.基于语义分割的非结构化田间道路场景识别[J].农业工程学报,2021,37(22):152-160. 被引量：12
10方方,王昕.基于小波分析和集成学习的短时交通流预测[J].科学技术与工程,2022,22(1):383-392. 被引量：11

计算机应用研究

2022年第2期

浏览历史

内容加载中请稍等...

基于融合CNN和Transformer的分离结构机器翻译模型被引量：7

参考文献2

二级参考文献6

共引文献14

同被引文献82

引证文献7

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于融合CNN和Transformer的分离结构机器翻译模型 被引量：7

参考文献2

二级参考文献6

共引文献14

同被引文献82

引证文献7

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于融合CNN和Transformer的分离结构机器翻译模型被引量：7