期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
适用于特定领域机器翻译的汉语分词方法 被引量:4
1
作者 苏晨 张玉洁 +1 位作者 郭振 徐金安 《中文信息学报》 CSCD 北大核心 2013年第5期184-190,共7页
在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高。这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量。为解决这个问题,该文实现了基于... 在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高。这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量。为解决这个问题,该文实现了基于生语料的领域自适应分词模型和双语引导的汉语分词,并提出融合多种分词结果的方法,通过构建格状结构(Lattice)并使用动态规划算法得到最佳汉语分词结果。为了验证所提方法,我们在NTCIR-10的汉英数据集上进行了评价实验。实验结果表明,该文提出的融合多种分词结果的汉语分词方法在分词精度F值和统计机器翻译的BLEU值上均得到了提高。 展开更多
关键词 汉语分词 领域适应 双语引导 LATTICE 机器翻译
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部