期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于语义差异的汉-缅平行句对生成方法
1
作者 于志强 文永华 +1 位作者 高明虎 杨曼 《云南民族大学学报(自然科学版)》 CAS 2023年第1期118-123,共6页
神经机器翻译是数据驱动式翻译方法,其性能依赖于平行句对的规模和质量,构建海量高质量的平行句对是提升机器翻译性能的基础工作之一.然而,人工标注高质量平行句对需要较高的成本,因此,探究如何从既有语料资源中生成新语料,对提升低资... 神经机器翻译是数据驱动式翻译方法,其性能依赖于平行句对的规模和质量,构建海量高质量的平行句对是提升机器翻译性能的基础工作之一.然而,人工标注高质量平行句对需要较高的成本,因此,探究如何从既有语料资源中生成新语料,对提升低资源机器翻译性能具有重要的意义.提出了基于语义差异的汉-缅平行句对生成方法.一方面,利用基于词表征的近义词检索技术获取关键词的近义词列表,随后基于近义词替换生成新句对;另一方面,利用预训练模型度量新生成句对间的语义差异,筛选语义差异较小的句对作为训练语料.实验表明,所提方法可作为有效的数据增强手段,能够提升汉-缅语言对的数据规模并改善翻译质量. 展开更多
关键词 语义差异 预训练模型 句对生成 汉-缅机器翻译
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部