-
题名基于句法差异的汉-越平行句对抽取
- 1
-
-
作者
于志强
高明虎
陈宇星
-
机构
云南民族大学信息与网络中心
-
出处
《云南民族大学学报(自然科学版)》
CAS
2020年第4期366-370,共5页
-
基金
国家自然科学基金(61866020)
云南省教育厅科学研究基金(2019J0674).
-
文摘
低资源环境下,受限于平行语料的规模和质量,神经机器翻译的效果并不理想.汉-越神经机器翻译作为典型的低资源型机器翻译,同样面临平行语料匮乏的问题.针对这一问题提出了基于句法差异的汉-越平行句对抽取方法.一方面,分析了汉语和越南语间的句法差异,通过词性标签对差异进行表述;另一方面,利用孪生结构的循环神经网络,在编码过程中融入句法差异信息,从句法规则角度更好的指导抽取过程.实验表明,基于汉越可比语料所提方法能够有效地抽取出高质量汉越平行句对.
-
关键词
句法特征
平行句对抽取
孪生循环神经网络
汉-越机器翻译
-
Keywords
syntactic feature
parallel sentence pair extraction
Siamese recurrent neural network
Chinese-Vietnam machine translation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-