期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于字符串相似度的维吾尔语中汉语借词识别
被引量:
6
1
作者
米成刚
杨雅婷
+2 位作者
周喜
李晓
杨明忠
《中文信息学报》
CSCD
北大核心
2013年第5期173-178,190,共7页
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借...
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借词识别的维吾尔语拉丁化规则;根据以上规则对维吾尔语拉丁化,并对汉语词进行拼音化,将借词发音相似转换为字符串相似这一易量化标准;提出了位置相关的最小编辑距离模型、加权公共子序列模型以及二者的带参数融合模型。实验结果表明,综合考虑字符串全局相似性和局部相似性的带参数融合模型取得了最佳的识别效果。
展开更多
关键词
借词
未登录词
发音相似度
字符串
相似
度
下载PDF
职称材料
题名
基于字符串相似度的维吾尔语中汉语借词识别
被引量:
6
1
作者
米成刚
杨雅婷
周喜
李晓
杨明忠
机构
中国科学院新疆理化技术研究所
中国科学院大学
哈密地区电子政务办公室
出处
《中文信息学报》
CSCD
北大核心
2013年第5期173-178,190,共7页
基金
中国科学院战略性先导科技专项(XDA06030400)
中国科学院"西部之光"人才培养计划"西部博士资助项目"(XBBS201216)
中国科学院西部行动计划资助项目(KGZD-EW-501)
文摘
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借词识别的维吾尔语拉丁化规则;根据以上规则对维吾尔语拉丁化,并对汉语词进行拼音化,将借词发音相似转换为字符串相似这一易量化标准;提出了位置相关的最小编辑距离模型、加权公共子序列模型以及二者的带参数融合模型。实验结果表明,综合考虑字符串全局相似性和局部相似性的带参数融合模型取得了最佳的识别效果。
关键词
借词
未登录词
发音相似度
字符串
相似
度
Keywords
loan words
Out-Of-Vocabulary words
pronunciation similarity
string similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于字符串相似度的维吾尔语中汉语借词识别
米成刚
杨雅婷
周喜
李晓
杨明忠
《中文信息学报》
CSCD
北大核心
2013
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部