期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
维汉人名翻译中不雅字或OOV的前处理研究
被引量:
3
1
作者
阿里木·赛买提
沙丽瓦尔·阿里木
+4 位作者
吐尔根·依不拉音
段雪明
古丽尼格尔·阿不都外力
麦合甫热提
吾守尔·斯拉木
《东北师大学报(自然科学版)》
CAS
北大核心
2022年第2期76-80,共5页
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉...
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善.
展开更多
关键词
机器翻译
OOV
维汉人名
Fast
align
字符级端到端的神经网络
下载PDF
职称材料
基于统计的维文汉文人名音译研究
被引量:
1
2
作者
谭煜辉
吐尔根·依布拉音
+1 位作者
艾山·吾买尔
买合木提·买买提
《新疆大学学报(自然科学版)》
CAS
2012年第1期108-111,共4页
传统的维汉人名音译大多是基于规则的,不同于基于语音的音译,本文在直接正字匹配(DOM)的框架下,将统计的思想引入到维汉人名的音译中,采用信源信道模型,将人名看成是特殊的句子,实现了维汉人名的自动音译.实验结果表明,直接正字匹配减...
传统的维汉人名音译大多是基于规则的,不同于基于语音的音译,本文在直接正字匹配(DOM)的框架下,将统计的思想引入到维汉人名的音译中,采用信源信道模型,将人名看成是特殊的句子,实现了维汉人名的自动音译.实验结果表明,直接正字匹配减少了中间过程,从而提高了音译的准确率,而统计的机器翻译方法比较灵活,能利用外来的信息,更加适合进行维汉人名音译.
展开更多
关键词
自然语言处理
统计
音译
维汉人名
对
下载PDF
职称材料
基于统计的改进音译单元的维文—汉文人名音译研究
3
作者
谭煜辉
《福建电脑》
2013年第8期99-100,110,共3页
本文采用统计的方法来实现维文人名到汉文人名的自动音译。统计的方法需要将人名看成是特殊句子并划分成多个音译单元来处理。将维吾尔文拉丁化、汉文拼音化,针对拉丁维文和拼音的特点,分别进行不同粒度的音译单元的划分。对不同的划分...
本文采用统计的方法来实现维文人名到汉文人名的自动音译。统计的方法需要将人名看成是特殊句子并划分成多个音译单元来处理。将维吾尔文拉丁化、汉文拼音化,针对拉丁维文和拼音的特点,分别进行不同粒度的音译单元的划分。对不同的划分方式进行了对比实验,同时对音节块级音译单元的划分在不同数目人名对下进行实验。实验结果表明,音节块级的划分方式更合理、更适合于维汉人名音译。
展开更多
关键词
统计
音译
维汉人名
对
音译单元
下载PDF
职称材料
题名
维汉人名翻译中不雅字或OOV的前处理研究
被引量:
3
1
作者
阿里木·赛买提
沙丽瓦尔·阿里木
吐尔根·依不拉音
段雪明
古丽尼格尔·阿不都外力
麦合甫热提
吾守尔·斯拉木
机构
新疆大学信息科学与工程学院多语种信息技术实验中心
新疆开放大学
新疆科大讯飞信息科技有限责任公司
出处
《东北师大学报(自然科学版)》
CAS
北大核心
2022年第2期76-80,共5页
基金
新疆维吾尔自治区重点实验室开放基金资助项目(2016D03023,2018D04019)
国家自然科学基金资助项目(61662077,61762084)
国家语言文字工作委员会科研项目(ZDI135-54)。
文摘
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善.
关键词
机器翻译
OOV
维汉人名
Fast
align
字符级端到端的神经网络
Keywords
machine translation
OOV
Uyghur-Chinese names
Fast align
character level end to end neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计的维文汉文人名音译研究
被引量:
1
2
作者
谭煜辉
吐尔根·依布拉音
艾山·吾买尔
买合木提·买买提
机构
新疆大学信息科学与工程学院
新疆新能信息通信有限责任公司
出处
《新疆大学学报(自然科学版)》
CAS
2012年第1期108-111,共4页
基金
工信部电子发展基金-维哈柯语言文字软件开发及产业化-维哈柯文辅助翻译软件
新疆维吾尔自治区自然科学基金(2011211B07)
+2 种基金
新疆多语种信息技术开放课题
青年教师科研培育基金(XJEDU2010S07)
新疆大学博士启动基金
文摘
传统的维汉人名音译大多是基于规则的,不同于基于语音的音译,本文在直接正字匹配(DOM)的框架下,将统计的思想引入到维汉人名的音译中,采用信源信道模型,将人名看成是特殊的句子,实现了维汉人名的自动音译.实验结果表明,直接正字匹配减少了中间过程,从而提高了音译的准确率,而统计的机器翻译方法比较灵活,能利用外来的信息,更加适合进行维汉人名音译.
关键词
自然语言处理
统计
音译
维汉人名
对
Keywords
natural language processing
statistics
transliteration
Uyghur-Chinese person name pair
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计的改进音译单元的维文—汉文人名音译研究
3
作者
谭煜辉
机构
汕尾职业技术学院数学与应用系
出处
《福建电脑》
2013年第8期99-100,110,共3页
文摘
本文采用统计的方法来实现维文人名到汉文人名的自动音译。统计的方法需要将人名看成是特殊句子并划分成多个音译单元来处理。将维吾尔文拉丁化、汉文拼音化,针对拉丁维文和拼音的特点,分别进行不同粒度的音译单元的划分。对不同的划分方式进行了对比实验,同时对音节块级音译单元的划分在不同数目人名对下进行实验。实验结果表明,音节块级的划分方式更合理、更适合于维汉人名音译。
关键词
统计
音译
维汉人名
对
音译单元
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
维汉人名翻译中不雅字或OOV的前处理研究
阿里木·赛买提
沙丽瓦尔·阿里木
吐尔根·依不拉音
段雪明
古丽尼格尔·阿不都外力
麦合甫热提
吾守尔·斯拉木
《东北师大学报(自然科学版)》
CAS
北大核心
2022
3
下载PDF
职称材料
2
基于统计的维文汉文人名音译研究
谭煜辉
吐尔根·依布拉音
艾山·吾买尔
买合木提·买买提
《新疆大学学报(自然科学版)》
CAS
2012
1
下载PDF
职称材料
3
基于统计的改进音译单元的维文—汉文人名音译研究
谭煜辉
《福建电脑》
2013
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部