期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
汉英词语对齐规范 被引量:1
1
作者 赵红梅 刘群 +3 位作者 张瑞强 吕雅娟 隅田英一郎 吴翠玲 《中文信息学报》 CSCD 北大核心 2009年第3期65-87,共23页
该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法——将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方... 该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法——将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方法能够更好地刻画词语对齐的特点。该规范已经实际应用于大规模的人工词语对齐标注中。我们对对齐标注的一致性进行了评价。结果表明,在该规范的指导下,标注者内部和标注者间的对齐都取得了比较理想的一致性,两组强、弱、伪三种对齐的Kappa值分别为0.99、0.98、0.93和0.96、0.83、0.68。最后,一个简单的实验初步证实了该规范在统计机器翻译中的有效性。 展开更多
关键词 人工智能 机器翻译 汉英词语对齐规范 手工词语对齐 真对齐 伪对齐 强对齐 弱对齐 对齐和标注一致性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部