-
题名维吾尔语不同词尾粒度对维汉词对齐的影响
被引量:2
- 1
-
-
作者
麦合甫热提
麦热哈巴.艾力
米莉万.雪合来提
-
机构
新疆大学教务处
新疆大学信息科学与工程学院
-
出处
《计算机工程与设计》
北大核心
2015年第8期2297-2302,共6页
-
基金
国家自然科学基金项目(61262061)
自治区科技计划基金项目(201423120)
-
文摘
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取"分离-丢弃"方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其语义信息被明文翻译概率高的词尾采取"分离"方案,概率低的词尾采取"丢弃"方案。将该方案应用到维吾尔语名词和动词上,分等级构造9种模板进行实验,实验结果表明,该方案抑制了词干、词尾分离带来的句子长度过长问题,增加了维汉词对的数量,提高了维汉机器翻译质量,验证了该方案的有效性。
-
关键词
词对齐
维汉机器翻译
维汉词对齐
词尾粒度
形态分析
-
Keywords
word alignment
Uyghur-Chinese machine translation
Uyghur-Chinese word alignment
affixes granularity
mor-phological analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-