期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于字符串相似度的维吾尔语中汉语借词识别 被引量:6
1
作者 米成刚 杨雅婷 +2 位作者 周喜 李晓 杨明忠 《中文信息学报》 CSCD 北大核心 2013年第5期173-178,190,共7页
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借... 维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借词识别的维吾尔语拉丁化规则;根据以上规则对维吾尔语拉丁化,并对汉语词进行拼音化,将借词发音相似转换为字符串相似这一易量化标准;提出了位置相关的最小编辑距离模型、加权公共子序列模型以及二者的带参数融合模型。实验结果表明,综合考虑字符串全局相似性和局部相似性的带参数融合模型取得了最佳的识别效果。 展开更多
关键词 借词 未登录词 发音相似度 字符串相似
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部