-
题名基于句法结构特征的汉越神经机器翻译
- 1
-
-
作者
裴非非
杨舰
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学
-
出处
《信息技术》
2024年第2期15-21,共7页
-
基金
国家重点研发计划(2019QY1801,2019QY1802,2019QY1800)
国家自然科学基金(61972186,61732005,U21B2027)
+3 种基金
云南高新技术产业发展项目(201606)
云南省重大科技专项计划(202103AA080015,202002AD080001-5)
云南省基础研究计划(202001-AS070014)
云南省学术和技术带头人后备人才(202105AC160018)。
-
文摘
在低资源神经机器翻译中,长句译文质量普遍不佳,而汉-越语言差异较大,是典型的资源匮乏型语种,对于长句的处理应尽可能保持句子语义信息不变。因此,提出一种基于句法结构特征处理长句的方法。首先,对原有语料库中长句进行句法树解析,然后,根据句法解析树提取短句和对远离根节点的叶子节点词进行标记,最后,对提取的短句进行反向翻译生成伪平行数据作为扩充,对原有长句中标记词进行与该词语义相近词的加权组合替换训练。实验表明,该方法提高了模型性能,显著改善了长句译文质量。
-
关键词
低资源神经机器翻译
长句译文
汉-越语言
语义信息
句法结构特征
-
Keywords
low-resource neural machine translation
long sentences translation
Chinese-Vietnamese language
semantic information
syntactic structure features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-