期刊文献+
共找到2,922篇文章
< 1 2 147 >
每页显示 20 50 100
维吾尔语机器翻译研究综述 被引量:1
1
作者 哈里旦木·阿布都克里木 侯钰涛 +2 位作者 姚登峰 阿布都克力木·阿布力孜 陈吉尚 《计算机工程》 CSCD 北大核心 2024年第1期1-16,共16页
维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语... 维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。 展开更多
关键词 维吾尔语 基于规则和实例的机器翻译 统计机器翻译 神经机器翻译 大语言模型
下载PDF
神经机器翻译综述 被引量:2
2
作者 章钧津 田永红 +1 位作者 宋哲煜 郝宇峰 《计算机工程与应用》 CSCD 北大核心 2024年第4期57-74,共18页
机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器... 机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器翻译、基于统计的机器翻译和基于深度学习的机器翻译三种方法进行对比总结;然后引出神经机器翻译,并对其常见的类型进行讲解;接着选取多模态机器翻译、非自回归机器翻译、篇章级机器翻译、多语言机器翻译、数据增强技术和预训练模型六个主要的神经机器翻译研究领域进行重点介绍;最后从低资源语言、上下文相关翻译、未登录词和大模型四个方面对神经机器翻译的未来进行了展望。通过系统性的介绍以更好地理解神经机器翻译的发展现状。 展开更多
关键词 机器翻译 神经机器翻译 篇章级机器翻译 数据增强 预处理技术
下载PDF
融合指代消解的神经机器翻译研究
3
作者 冯勤 贡正仙 +1 位作者 李军辉 周国栋 《中文信息学报》 CSCD 北大核心 2024年第6期67-76,共10页
篇章中的同一实体经常会呈现出不同的表述,形成一系列复杂的指代关系,这给篇章翻译带来了很大的挑战。该文重点探索指代消解和篇章神经机器翻译的融合方案,首先为指代链设计相应的指代表征;其次使用软约束和硬约束两种方法在翻译系统中... 篇章中的同一实体经常会呈现出不同的表述,形成一系列复杂的指代关系,这给篇章翻译带来了很大的挑战。该文重点探索指代消解和篇章神经机器翻译的融合方案,首先为指代链设计相应的指代表征;其次使用软约束和硬约束两种方法在翻译系统中实现指代信息的融合。该文建议的方法分别在英语-德语和中文-英语语言对上进行了实验,实验结果表明,相比于同期最好的句子级翻译系统,该方法能使翻译性能获得明显提升。此外,在英语-德语的代词翻译质量的专门评估中,准确率也有显著提升。 展开更多
关键词 指代表征 神经机器翻译 篇章级机器翻译
下载PDF
机器翻译的译后编辑策略探究
4
作者 李颖 曲巍巍 +1 位作者 修树新 项睿 《湖北成人教育学院学报》 2024年第2期96-102,共7页
人类首次提出机器翻译至今已有70多年,随着语言处理路径不断更新,尤其得益于人工智能技术的发展,机器翻译已经进入神经网络翻译时代。机器翻译速度和效率得到极大提高,从而日益受到大众的青睐。目前,机器翻译技术尚未成熟,仍然存在较多... 人类首次提出机器翻译至今已有70多年,随着语言处理路径不断更新,尤其得益于人工智能技术的发展,机器翻译已经进入神经网络翻译时代。机器翻译速度和效率得到极大提高,从而日益受到大众的青睐。目前,机器翻译技术尚未成熟,仍然存在较多问题,因此有必要进行译后编辑。文章以机器在线翻译的译文为研究对象,并对其进行分析,从词汇、句法及语篇三个层面提出译后编辑策略,以期提升机器翻译质量和效率。 展开更多
关键词 在线机器翻译 翻译错误 译后编辑 策略
下载PDF
基于自注意力机制神经机器翻译的软件缺陷自动修复方法
5
作者 曹鹤玲 刘昱 韩栋 《电子学报》 EI CAS CSCD 北大核心 2024年第3期945-956,共12页
循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题... 循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题,提出一种基于自注意力神经机器翻译的软件缺陷自动修复方法(Self-attention Neural machine translation based automatic software Repair,SNRepair).首先,为有效缓解源码中的未登录词问题,对数据集引入子词切分技术进行预处理;其次,为解决源代码中棘手的长距离依赖问题并更充分地利用局部信息,构建融合局部建模的Transformer程序补丁生成模型;然后,采用缺陷自动定位技术定位缺陷语句位置,利用参数优化后的Transformer补丁生成模型生成候选补丁;最后,运行测试用例验证候选补丁.在具有395个真实Java软件缺陷的Defects4J缺陷库上实验评估,结果表明SNRepair方法与对比方法比较,修复成功率和修复效率更高. 展开更多
关键词 软件缺陷自动修复 神经机器翻译 自注意力机制 子词切分 局部建模
下载PDF
神经网络机器翻译问题及对策研究——以有道、DeepL、搜狗、百度翻译为中心
6
作者 荣奕 黄成湘 《现代语言学》 2024年第6期218-225,共8页
2013年以来,神经网络机器翻译实现了机器翻译质量的大幅提升,短短几年便成为机器翻译系统的主流模式。国内外行业巨头纷纷上线神经网络机器翻译系统,推动机器翻译实用化和商品化发展。但是,神经网络机器翻译仍然面临诸多挑战。如何有效... 2013年以来,神经网络机器翻译实现了机器翻译质量的大幅提升,短短几年便成为机器翻译系统的主流模式。国内外行业巨头纷纷上线神经网络机器翻译系统,推动机器翻译实用化和商品化发展。但是,神经网络机器翻译仍然面临诸多挑战。如何有效地利用在线翻译系统,方便、快速且准确地提高翻译效率和质量,是当前机器翻译研究的重点。因此,本文以有道、DeepL、百度、搜狗四个神经网络翻译软件为研究对象,概括总结了神经机器翻译译文的特点及存在问题,并据此从机器翻译软件开发、译后编辑、译者发展等不同角度,探讨在人工智能翻译飞速发展背景下的应对策略。 展开更多
关键词 神经网络机器翻译 机器翻译译文特征 问题及对策
下载PDF
混合机器翻译的研究现状和发展趋势 被引量:1
7
作者 周秦超 林向阳 《数字通信世界》 2024年第1期151-153,共3页
混合机器翻译是一种综合了多种机器翻译方法的组合方法,以提高翻译质量和效率。文章介绍了混合机器翻译的基本概念和分类,包括基于规则、统计和神经网络的混合方法,然后对混合机器翻译的优点和挑战进行分析,最后总结了当前混合机器翻译... 混合机器翻译是一种综合了多种机器翻译方法的组合方法,以提高翻译质量和效率。文章介绍了混合机器翻译的基本概念和分类,包括基于规则、统计和神经网络的混合方法,然后对混合机器翻译的优点和挑战进行分析,最后总结了当前混合机器翻译的应用情况和未来发展方向,并提出了一些可能的解决方案。 展开更多
关键词 混合机器翻译 应用 发展趋势
下载PDF
视听文本机器翻译质量测评和译后编辑研究——以《畅游赣鄱——水文化英文之旅》慕课字幕翻译为例
8
作者 刘桂兰 邹斯彧 《南昌工程学院学报》 CAS 2024年第2期73-79,共7页
机器翻译给人们带来了便利,同时促成了译后编辑的诞生。本文以《畅游赣鄱——水文化英文之旅》慕课字幕文本为研究样本,在MQM(Multidimensional Quality Metrics)质量评估框架基础上提出视听文本机器翻译产品质量评估标准,量化其错误值... 机器翻译给人们带来了便利,同时促成了译后编辑的诞生。本文以《畅游赣鄱——水文化英文之旅》慕课字幕文本为研究样本,在MQM(Multidimensional Quality Metrics)质量评估框架基础上提出视听文本机器翻译产品质量评估标准,量化其错误值,测试机器翻译质量,并由此提出译后编辑的三级模式:轻度译后编辑(Light Post-editing, LPE)、中度译后编辑(Moderate Post-editing, MPE)和重度译后编辑(Full Post-editing, FPE)。 展开更多
关键词 视听文本 慕课 机器翻译质量测评 译后编辑
下载PDF
机器翻译质量评估:方法、应用及展望
9
作者 王均松 庄淙茜 魏勇鹏 《外国语文》 北大核心 2024年第3期135-144,共10页
随着机器翻译译后编辑模式在语言服务行业的广泛应用,机器翻译质量评估的重要性日益凸显。本文探讨了业界三种主流机器翻译质量评估方法的优劣以及适用性。研究发现,人工评估、有参考自动评估、无参考自动预估三种方法各有其优势与不足... 随着机器翻译译后编辑模式在语言服务行业的广泛应用,机器翻译质量评估的重要性日益凸显。本文探讨了业界三种主流机器翻译质量评估方法的优劣以及适用性。研究发现,人工评估、有参考自动评估、无参考自动预估三种方法各有其优势与不足,在特定场景下应根据需求不同灵活地选择评估方法。在未来,机器翻译质量评估研究应在提高自动评估准确率、增加质量评估维度、开展垂直细分领域评估等方面深入挖掘。 展开更多
关键词 机器翻译 翻译质量评估 人工评估 自动评估
下载PDF
基于情感语义增强编解码的神经机器翻译方法
10
作者 万飞 《计算机技术与发展》 2024年第9期94-101,共8页
针对目前神经机器翻译模型仅依赖平行语料训练而无法充分挖掘深层语言知识的问题,提出一种基于情感语义增强编解码的神经机器翻译方法,旨在通过引入额外的情感语义,提高模型对语言深层次信息的理解能力。首先,利用word2vec技术获取语料... 针对目前神经机器翻译模型仅依赖平行语料训练而无法充分挖掘深层语言知识的问题,提出一种基于情感语义增强编解码的神经机器翻译方法,旨在通过引入额外的情感语义,提高模型对语言深层次信息的理解能力。首先,利用word2vec技术获取语料中所有单词的词嵌入,将其输入到一个融合模型中进行训练。该融合模型结合了基于GRU和文档嵌入的机制,以获取单词级别和文档级别的情感语义表征;其次,在情感融合阶段,采用加权公式将单词级别和文档级别的情感语义有机地融合,形成更为综合的情感语义表征;最后,将此表征与上下文语义表征按位相加,以全面引入情感信息,并将其作为输入传递到机器翻译模型的编码器和解码器中。在多个基准数据集上的实验显示,相较于传统的Transformer模型,该方法在IWSLT数据集上性能显著提升,BLEU值增加1.3至1.62。在WMT数据集上也取得良好性能,证实了融合情感语义在机器翻译中的有效性。 展开更多
关键词 情感语义 增强编解码 神经机器翻译 TRANSFORMER 平行语料
下载PDF
基于机器翻译软件的外宣文本翻译质量评估研究
11
作者 雷鹏飞 张浮凌 《未来与发展》 2024年第6期41-48,共8页
外宣翻译任务日益繁重,在一定程度上需要借助机器翻译软件进行辅助工作。基于深度学习和神经网络翻译模型的机器翻译软件被广泛应用于各个领域,但其质量评估对比的实证研究并不多见。文章借助Python编程语言计算机器翻译质量评估指标,... 外宣翻译任务日益繁重,在一定程度上需要借助机器翻译软件进行辅助工作。基于深度学习和神经网络翻译模型的机器翻译软件被广泛应用于各个领域,但其质量评估对比的实证研究并不多见。文章借助Python编程语言计算机器翻译质量评估指标,对机器翻译后的外宣文本译文进行质量评估。研究发现,不同机器翻译软件的表现各有差异,但均未达到外宣翻译的要求。主要问题有为用词不当、术语错误和搭配不当,机器翻译质量有待提高。 展开更多
关键词 机器翻译软件 外宣文本 翻译质量评估
下载PDF
基于知识蒸馏的神经机器翻译综述
12
作者 马畅 田永红 +1 位作者 郑晓莉 孙康康 《计算机科学与探索》 CSCD 北大核心 2024年第7期1725-1747,共23页
机器翻译(MT)是利用计算机将一种语言转换为与其同语义的另一种语言的过程。随着神经网络的提出,神经机器翻译(NMT)作为一种强大的机器翻译技术,在自动翻译领域和人工智能方向上取得了显著成功。由于传统神经翻译模型存在参数、结构冗... 机器翻译(MT)是利用计算机将一种语言转换为与其同语义的另一种语言的过程。随着神经网络的提出,神经机器翻译(NMT)作为一种强大的机器翻译技术,在自动翻译领域和人工智能方向上取得了显著成功。由于传统神经翻译模型存在参数、结构冗余的问题,提出了使用知识蒸馏(KD)技术手段对神经机器翻译进行模型压缩和加速推理,该方法在机器学习和自然语言处理领域引起了广泛的关注。主要从评价指标、技术创新等角度对各种引入知识蒸馏的翻译模型进行了系统的考察和比较。首先简要回顾了机器翻译的发展历程、主流框架和评价指标;接着详细介绍了知识蒸馏技术;然后分别从多语言模型、多模态翻译、低资源语言以及自回归和非自回归四个角度详述了基于知识蒸馏的神经机器翻译发展方向,并简要介绍其他领域的研究现状;最后针对现有的大语言模型、零资源语言及多模态机器翻译所存在的问题进行分析,展望神经机器翻译发展趋势。 展开更多
关键词 机器翻译 神经机器翻译 知识蒸馏 模型压缩
下载PDF
机器翻译背景下商务英语翻译课程的人才培养目标和路径探讨——基于本校的商务英语翻译课程教学
13
作者 尤璐 程张根 徐长勇 《内江科技》 2024年第10期57-59,143,共4页
现代社会国际商务交流增多,对商务英语专业人才需求不断增长。随着网络和信息技术迅速发展,对商务英语专业人才的需求有所变化,商务英语专业的人才培养目标也随之调整。商务英语翻译是商务英语专业的核心课程之一,由于时代的发展、技术... 现代社会国际商务交流增多,对商务英语专业人才需求不断增长。随着网络和信息技术迅速发展,对商务英语专业人才的需求有所变化,商务英语专业的人才培养目标也随之调整。商务英语翻译是商务英语专业的核心课程之一,由于时代的发展、技术的进步、课程的自身特点等因素,需要重新考虑该课程现阶段的人才培养目标和培养路径,以应对机器翻译日臻成熟和网络技术迭代更新对该课程造成的影响和提出的挑战,培养现代社会需要的商务人才。 展开更多
关键词 商务英语专业 商务英语翻译 机器翻译 培养路径 人才培养目标 商务人才 现代社会需要 路径探讨
下载PDF
基于深度编码注意力的XLNet-Transformer汉-马低资源神经机器翻译优化方法 被引量:1
14
作者 占思琦 徐志展 +1 位作者 杨威 谢抢来 《计算机应用研究》 CSCD 北大核心 2024年第3期799-804,810,共7页
神经机器翻译(NMT)在多个领域应用中已取得显著成效,在大规模语料库上已充分论证其优越性。然而,在语料库资源不足的情形下,仍存在较大的改进空间。由于汉语-马来语(汉-马)平行语料的匮乏,直接导致了汉-马机器翻译的翻译效果不佳。为解... 神经机器翻译(NMT)在多个领域应用中已取得显著成效,在大规模语料库上已充分论证其优越性。然而,在语料库资源不足的情形下,仍存在较大的改进空间。由于汉语-马来语(汉-马)平行语料的匮乏,直接导致了汉-马机器翻译的翻译效果不佳。为解决汉-马低资源机器翻译不理想的问题,提出了一种基于深度编码注意力和渐进式解冻的低资源神经机器翻译方法。首先,利用XLNet预训练模型重构编码器,在编码器中使用了XLNet动态聚合模块替代了传统编码层的输出方式,有效弥补了低资源汉-马语料匮乏的瓶颈;其次,在解码器中使用并行交叉注意力模块对传统编码-解码注意力进行了改进,提升了源词和目标词的潜在关系的捕获能力;最后,对提出模型采用渐进式解冻训练策略,最大化释放了模型的性能。实验结果表明,提出方法在小规模的汉-马数据集上得到了显著的性能提升,验证了方法的有效性,对比其他的低资源NMT方法,所提方法结构更为精简,并改进了编码器和解码器,翻译效果提升更加显著,为应对低资源机器翻译提供了有效的策略与启示。 展开更多
关键词 神经网络 汉-马机器翻译 低资源 渐进式解冻 预训练
下载PDF
生成式人工智能开创机器翻译的新纪元了吗?——一项质量对比研究及对翻译教育的思考 被引量:2
15
作者 张文煜 赵璧 《北京第二外国语学院学报》 北大核心 2024年第1期83-98,共16页
以ChatGPT为代表的生成式人工智能技术一经问世,就引发了应用热潮,同时也对广大语言内容工作者的创作和服务模式构成了巨大冲击。本研究将机器自动评价和人工评价相结合开展译文质量评测实验,对当前GPT技术在翻译领域的应用表现进行了... 以ChatGPT为代表的生成式人工智能技术一经问世,就引发了应用热潮,同时也对广大语言内容工作者的创作和服务模式构成了巨大冲击。本研究将机器自动评价和人工评价相结合开展译文质量评测实验,对当前GPT技术在翻译领域的应用表现进行了分析。结果表明,目前GPT技术在翻译领域中尚不构成对神经网络机器翻译技术的更迭,但在汉英翻译、术语翻译、文学翻译等领域已经表现出一定程度的质量提升。在此基础上,本研究对翻译教育如何应对人工智能技术带来的变革给出了建议。 展开更多
关键词 ChatGPT 机器翻译 翻译教育 翻译质量 对比研究
下载PDF
基于单语优先级采样自训练神经机器翻译的研究 被引量:1
16
作者 张笑燕 逄磊 +2 位作者 杜晓峰 陆天波 夏亚梅 《通信学报》 EI CSCD 北大核心 2024年第4期65-72,共8页
为了提高神经机器翻译(NMT)性能,改善不确定性过高的单语在自训练过程中对NMT模型的损害,提出了一种基于优先级采样的自训练神经机器翻译模型。首先,通过引入语法依存分析构建语法依存树并计算单语单词重要程度。然后,构建单语词典并基... 为了提高神经机器翻译(NMT)性能,改善不确定性过高的单语在自训练过程中对NMT模型的损害,提出了一种基于优先级采样的自训练神经机器翻译模型。首先,通过引入语法依存分析构建语法依存树并计算单语单词重要程度。然后,构建单语词典并基于单语单词的重要程度和不确定性定义优先级。最后,计算单语优先级并基于优先级进行采样,进而合成平行数据集,作为学生NMT的训练输入。在大规模WMT英德部分数据集上的实验结果表明,所提模型能有效提升NMT的翻译效果,并改善不确定性过高对模型的损害。 展开更多
关键词 机器翻译 数据增强 自训练 不确定性 语法依存
下载PDF
基于预训练语言模型的机器翻译最新进展 被引量:1
17
作者 杨滨瑕 罗旭东 孙凯丽 《计算机科学》 CSCD 北大核心 2024年第S01期38-45,共8页
自然语言处理涉及许多重要主题,其中之一是机器翻译。预训练语言模型,如BERT和GPT,是用于处理包括机器翻译在内的各种自然语言处理任务的先进方法。因此,许多研究人员使用预训练语言模型来解决机器翻译问题。为推动研究向前发展,首先概... 自然语言处理涉及许多重要主题,其中之一是机器翻译。预训练语言模型,如BERT和GPT,是用于处理包括机器翻译在内的各种自然语言处理任务的先进方法。因此,许多研究人员使用预训练语言模型来解决机器翻译问题。为推动研究向前发展,首先概述了这一领域的最新进展,包括主要的研究问题和基于各种预训练语言模型的解决方案;其次比较了这些解决方案的动机、共性、差异和局限性;然后总结了训练这类机器翻译模型常用的数据集,以及评估这些模型的指标;最后讨论了进一步的研究方向。 展开更多
关键词 自然语言处理 机器翻译 预训练语言模型 BERT GPT
下载PDF
基于梯度权重变化训练策略的低资源机器翻译 被引量:1
18
作者 王家琪 朱俊国 余正涛 《计算机科学与探索》 CSCD 北大核心 2024年第3期731-739,共9页
近年来Transformer等神经网络模型在机器翻译上取得了显著的成功,但训练这些模型需要依靠丰富的有标签数据,而低资源机器翻译因受限于平行语料库的规模,导致训练得到的模型表现不佳,同时很容易针对高频词汇过度拟合,从而降低模型在测试... 近年来Transformer等神经网络模型在机器翻译上取得了显著的成功,但训练这些模型需要依靠丰富的有标签数据,而低资源机器翻译因受限于平行语料库的规模,导致训练得到的模型表现不佳,同时很容易针对高频词汇过度拟合,从而降低模型在测试集上的泛化能力。为了缓解这一现象,提出了一种梯度权重变化的策略,即在Adam算法基础上为每一个新批次所产生的梯度乘以一个系数。该系数递增变化,旨在在训练早期削弱对高频特征的依赖,而在训练后期保持算法的快速收敛优势。介绍了模型改进后的训练流程,其中包括系数的调整和衰减,以实现在不同训练阶段的不同侧重。这种策略的目标是增加对低频词汇的关注度,防止模型对高频词汇的过拟合。在三个低资源的双语数据集上进行了翻译任务实验,该方法在测试集上相对于基线模型分别提升了0.72、1.37和1.04个BLEU得分。 展开更多
关键词 神经机器翻译 过拟合 动态梯度权重
下载PDF
基于时空注意力机制的视频引导机器翻译方法
19
作者 姜舟 余正涛 +2 位作者 高盛祥 毛存礼 郭军军 《中文信息学报》 CSCD 北大核心 2024年第4期50-58,共9页
视频引导机器翻译是一种多模态机器翻译任务,其目标是通过视频和文本的结合产生高质量的文本翻译。但是之前的工作只基于视频中的时间结构选择相关片段引导机器翻译,所选片段中存在大量与目标语言无关的信息。因此,在翻译过程中,视频中... 视频引导机器翻译是一种多模态机器翻译任务,其目标是通过视频和文本的结合产生高质量的文本翻译。但是之前的工作只基于视频中的时间结构选择相关片段引导机器翻译,所选片段中存在大量与目标语言无关的信息。因此,在翻译过程中,视频中的时空结构没有得到充分利用,从而无法有效缓解机器翻译中细节缺失或翻译错误的问题。为了解决这一问题,该文提出了一种基于时空注意力(Spatial-Temporal Attention,STA)的模型来充分利用视频中的时空信息引导机器翻译。该文提出的注意力模型不但能够选择与目标语言最相关的时空片段,而且能进一步聚焦片段中最相关的实体信息。所关注的实体信息能有效增强源语言和目标语言的语义对齐,从而使得源语言中的细节信息得到准确翻译。该文的方法基于Vatex公共数据集和构建的汉-越低资源数据集进行实验,在Vatex与汉-越低资源数据集上BLEU4分别达到32.66和18.46,相比于时间注意力基线方法提高了3.54与0.89个BLEU值。 展开更多
关键词 时空注意力 视频引导机器翻译 细节缺失 时间注意力 空间注意力
下载PDF
融合目标端上下文的篇章神经机器翻译
20
作者 贾爱鑫 李军辉 +1 位作者 贡正仙 张民 《中文信息学报》 CSCD 北大核心 2024年第4期59-68,共10页
神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神... 神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神经机器翻译。具体地,该文借助推敲网络的思想,对篇章源端进行二次翻译,第一次基于句子级翻译,第二次翻译参考了全篇的第一次翻译结果。基于LDC中英篇章数据集和WMT英德篇章数据集的实验结果表明,在引入较少的参数的条件下,该文方法能显著提高翻译性能。同时,随着第一次翻译(即句子级译文)质量的提升,所提方法也更有效。 展开更多
关键词 神经机器翻译 推敲网络 篇章翻译
下载PDF
上一页 1 2 147 下一页 到第
使用帮助 返回顶部