期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
英中可比语料库中多词表达自动提取与对齐 被引量:12
1
作者 肖健 徐建 +1 位作者 徐晓兰 袁琦 《计算机工程与应用》 CSCD 北大核心 2010年第31期130-134,187,共6页
多词表达(MWE)不仅用来提高当前机器翻译系统质量,而且也用于跨语言检索和数据挖掘等其他自然语言处理领域。为此,提出了基于语义模板与基于统计工具相结合的方法从三元组可比语料库中自动提取本族英语MWE。采用基于词表和分布方法计算... 多词表达(MWE)不仅用来提高当前机器翻译系统质量,而且也用于跨语言检索和数据挖掘等其他自然语言处理领域。为此,提出了基于语义模板与基于统计工具相结合的方法从三元组可比语料库中自动提取本族英语MWE。采用基于词表和分布方法计算词语间的相似度,扩大MWE覆盖范围。利用GIZA++对齐算法提取对译的中文MWE,依据统计方法计算互译概率信息,根据概率大小,选择最佳英汉MWE互译对。实验结果表明上述方法可以有效提高MWE提取和对齐的准确率。 展开更多
关键词 三元组可比语料库 多词表达(mwe) 语义模板
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部