期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
英汉专利语料中长句的分割 被引量:2
1
作者 张西龙 季铎 +1 位作者 王岩 苗雪雷 《沈阳航空航天大学学报》 2011年第5期67-70,共4页
平行语是基于语料机器翻译方法的重要资源。专利语料中存在大量长句,这给机器翻译系统学习翻译模型带来了复杂性。因此,对专利语料中长句的分割将是十分有必要的。提出了一种基于统计词对齐的专利语料中长句分割方法,将标点的对应位置... 平行语是基于语料机器翻译方法的重要资源。专利语料中存在大量长句,这给机器翻译系统学习翻译模型带来了复杂性。因此,对专利语料中长句的分割将是十分有必要的。提出了一种基于统计词对齐的专利语料中长句分割方法,将标点的对应位置作为候选分割位置有效的保留了句子的句法结构,并且使用改进后的IBM翻译模型1对分割片段进行评分,进一步保证了长句分割的正确性。翻译实验证明该方法有效地提高了翻译系统的质量。 展开更多
关键词 句子分割 专利语料 统计对齐 翻译模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部