期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
维吾尔语词尾对汉维统计机器翻译影响的研究 被引量:8
1
作者 米莉万.雪合来提 麦热哈巴.艾力 +1 位作者 吐尔根.依布拉音 姜文斌 《计算机工程》 CAS CSCD 2014年第3期224-227,共4页
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使... 维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。 展开更多
关键词 黏着语 词尾 统计机器翻译 层次短语翻译模型 语言模型
下载PDF
维吾尔语不同词尾粒度对维汉词对齐的影响 被引量:2
2
作者 甫热 麦热哈巴.艾力 米莉万.雪合来提 《计算机工程与设计》 北大核心 2015年第8期2297-2302,共6页
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取"分离-丢弃"方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其... 维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取"分离-丢弃"方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其语义信息被明文翻译概率高的词尾采取"分离"方案,概率低的词尾采取"丢弃"方案。将该方案应用到维吾尔语名词和动词上,分等级构造9种模板进行实验,实验结果表明,该方案抑制了词干、词尾分离带来的句子长度过长问题,增加了维汉词对的数量,提高了维汉机器翻译质量,验证了该方案的有效性。 展开更多
关键词 词对齐 维汉机器翻译 维汉词对齐 词尾粒度 形态分析
下载PDF
基于维吾尔语词干词缀粒度的汉维机器翻译 被引量:12
3
作者 米莉万.雪合来提 刘凯 吐尔根.依布拉音 《中文信息学报》 CSCD 北大核心 2015年第3期201-206,共6页
汉语到维吾尔语的自动机器翻译有着重要的现实意义。目前对于汉维统计机器翻译方法的研究相对空白。该文提出了一种以维吾尔语为词干词缀粒度的汉维机器翻译方法。该方法利用维吾尔语形态分析后的词干词缀作为翻译的基本单位,并且根据... 汉语到维吾尔语的自动机器翻译有着重要的现实意义。目前对于汉维统计机器翻译方法的研究相对空白。该文提出了一种以维吾尔语为词干词缀粒度的汉维机器翻译方法。该方法利用维吾尔语形态分析后的词干词缀作为翻译的基本单位,并且根据其黏着语特性提出了一种基于有向图的维吾尔语"词干-词缀"语言模型。基于开放语料的实验证明我们的词干词缀翻译模型以及语言模型显著优于之前的基于词粒度的模型。 展开更多
关键词 维吾尔语 机器翻译 汉维翻译 词干 词缀 形态分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部