摘要
描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处理和维吾尔语文本预处理过程:首先将维吾尔语通过专用工具转换为拉丁维文,然后将拉丁维吾尔语中的特殊文字转换成无歧义的字符。词对齐的实现过程:首先使用IBM模型1,其次利用IBM模型2,构建出一个词对齐系统。实验表明,该系统实现的词对齐比GIZA++中实现的正确率可以提高2.6个百分点。
出处
《昌吉学院学报》
2012年第6期80-83,共4页
Journal of Changji University
基金
国家自然基金(60963018)
国家语委科研项目(MZ115-75)
新疆维吾尔自治区高校科研计划青年教师科研基金项目(XJEDU2011S42)
昌吉学院科研基金项目(2011SSQD029)