-
题名基于强化学习和机器翻译质量评估的中朝机器翻译研究
被引量:7
- 1
-
-
作者
李飞雨
赵亚慧
崔荣一
杨飞扬
-
机构
延边大学智能信息处理研究室
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第8期2288-2292,2320,共6页
-
基金
国家语委“十三五”科研资助项目(YB135-76)
延边大学外国语言文学一流学科建设项目(18YLPY13)。
-
文摘
针对目前机器翻译模型存在的曝光偏差和译文多样性差的问题,提出一种基于强化学习和机器翻译质量评估的中朝神经机器翻译模型QR-Transformer。首先,在句子级别引入评价机制来指导模型预测不完全收敛于参考译文;其次,采用强化学习方法作为指导策略,实现模型在句子级别优化目标序列;最后,在训练过程中融入单语语料并进行多粒度数据预处理以缓解数据稀疏问题。实验表明,QR-Transformer有效提升了中朝神经机器翻译性能,与Transformer相比,中—朝语向BLEU值提升了5.39,QE分数降低了5.16,朝—中语向BLEU值提升了2.73,QE分数下降了2.82。
-
关键词
机器翻译
中朝机器翻译
强化学习
机器翻译质量评估
-
Keywords
machine translation
Chinese-Korean machine translation
reinforcement learning
machine translation quality estimation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名利用语义关联增强的跨语言预训练模型的译文质量评估
被引量:1
- 2
-
-
作者
叶恒
贡正仙
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2023年第3期79-88,共10页
-
基金
国家自然科学基金(61976148)
江苏高校优势学科建设工程资助项目
-
文摘
机器翻译质量评估(QE)是在不依赖参考译文的条件下,自动对机器翻译译文进行评估。当前人工标注数据稀缺,使得神经QE模型在自动检测译文错误方面还存在较大问题。为了更好地利用规模庞大但却缺少人工标注信息的平行语料,该文提出一种基于平行语料的翻译知识迁移方案。首先采用跨语言预训练模型XLM-R构建神经质量评估基线系统,在此基础上提出三种预训练策略增强XLM-R的双语语义关联能力。该文方法在WMT 2017和WMT 2019的英德翻译质量评估数据集上都达到了最高性能。
-
关键词
机器翻译质量评估
跨语言预训练模型
语义关联
预训练策略
-
Keywords
quality estimation of machine translation
cross-lingual pretrained model
semantic connection
pretraining strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-