期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
维汉人名翻译中不雅字或OOV的前处理研究 被引量:3
1
作者 阿里木·赛买提 沙丽瓦尔·阿里木 +4 位作者 吐尔根·依不拉音 段雪明 古丽尼格尔·阿不都外力 麦合甫热提 吾守尔·斯拉木 《东北师大学报(自然科学版)》 CAS 北大核心 2022年第2期76-80,共5页
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉... 针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善. 展开更多
关键词 机器翻译 OOV 维汉人名 Fast align 字符级端到端的神经网络
下载PDF
基于统计的维文汉文人名音译研究 被引量:1
2
作者 谭煜辉 吐尔根·依布拉音 +1 位作者 艾山·吾买尔 买合木提·买买提 《新疆大学学报(自然科学版)》 CAS 2012年第1期108-111,共4页
传统的维汉人名音译大多是基于规则的,不同于基于语音的音译,本文在直接正字匹配(DOM)的框架下,将统计的思想引入到维汉人名的音译中,采用信源信道模型,将人名看成是特殊的句子,实现了维汉人名的自动音译.实验结果表明,直接正字匹配减... 传统的维汉人名音译大多是基于规则的,不同于基于语音的音译,本文在直接正字匹配(DOM)的框架下,将统计的思想引入到维汉人名的音译中,采用信源信道模型,将人名看成是特殊的句子,实现了维汉人名的自动音译.实验结果表明,直接正字匹配减少了中间过程,从而提高了音译的准确率,而统计的机器翻译方法比较灵活,能利用外来的信息,更加适合进行维汉人名音译. 展开更多
关键词 自然语言处理 统计 音译 维汉人名
下载PDF
基于统计的改进音译单元的维文—汉文人名音译研究
3
作者 谭煜辉 《福建电脑》 2013年第8期99-100,110,共3页
本文采用统计的方法来实现维文人名到汉文人名的自动音译。统计的方法需要将人名看成是特殊句子并划分成多个音译单元来处理。将维吾尔文拉丁化、汉文拼音化,针对拉丁维文和拼音的特点,分别进行不同粒度的音译单元的划分。对不同的划分... 本文采用统计的方法来实现维文人名到汉文人名的自动音译。统计的方法需要将人名看成是特殊句子并划分成多个音译单元来处理。将维吾尔文拉丁化、汉文拼音化,针对拉丁维文和拼音的特点,分别进行不同粒度的音译单元的划分。对不同的划分方式进行了对比实验,同时对音节块级音译单元的划分在不同数目人名对下进行实验。实验结果表明,音节块级的划分方式更合理、更适合于维汉人名音译。 展开更多
关键词 统计 音译 维汉人名 音译单元
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部