期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词向量的维吾尔语词项归一化方法 被引量:5
1
作者 罗延根 李晓 +3 位作者 蒋同海 杨雅婷 周喜 王磊 《计算机工程》 CAS CSCD 北大核心 2018年第2期220-225,共6页
使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,... 使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,并进行重采样迭代,从而将之前未能成功归一化的非正规词归一化。实验结果表明,使用该方法对维汉机器翻译的待翻译口语文本进行前编辑后,生成的译文质量有显著提高。该方法给维汉口语文本机器翻译系统提供一个前处理的流程,在缺乏双语口语平行语料的情况下也能有效提高机器翻译系统性能。 展开更多
关键词 维吾尔语口语文本 非正规词 归一化 神经网络 重采样
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部