期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉英词语对齐规范
被引量:
1
1
作者
赵红梅
刘群
+3 位作者
张瑞强
吕雅娟
隅田英一郎
吴翠玲
《中文信息学报》
CSCD
北大核心
2009年第3期65-87,共23页
该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法——将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方...
该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法——将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方法能够更好地刻画词语对齐的特点。该规范已经实际应用于大规模的人工词语对齐标注中。我们对对齐标注的一致性进行了评价。结果表明,在该规范的指导下,标注者内部和标注者间的对齐都取得了比较理想的一致性,两组强、弱、伪三种对齐的Kappa值分别为0.99、0.98、0.93和0.96、0.83、0.68。最后,一个简单的实验初步证实了该规范在统计机器翻译中的有效性。
展开更多
关键词
人工智能
机器翻译
汉英词语对齐规范
手工词语对齐
真对齐
伪对齐
强对齐
弱对齐
对齐和标注一致性
下载PDF
职称材料
题名
汉英词语对齐规范
被引量:
1
1
作者
赵红梅
刘群
张瑞强
吕雅娟
隅田英一郎
吴翠玲
机构
中国科学院计算技术研究所智能信息处理重点实验室
日本情报通信研究机构-国际电气通信基础技术研究所
出处
《中文信息学报》
CSCD
北大核心
2009年第3期65-87,共23页
文摘
该文介绍了一个新的汉英词语对齐规范。该规范以现有的LDC汉英词语对齐规范为基础,对其进行了较大的改进和扩展,特别是提出了一种全新的对齐标注方法——将词语对齐区分为真对齐和伪对齐,真对齐又分为强对齐和弱对齐。这种细化的标注方法能够更好地刻画词语对齐的特点。该规范已经实际应用于大规模的人工词语对齐标注中。我们对对齐标注的一致性进行了评价。结果表明,在该规范的指导下,标注者内部和标注者间的对齐都取得了比较理想的一致性,两组强、弱、伪三种对齐的Kappa值分别为0.99、0.98、0.93和0.96、0.83、0.68。最后,一个简单的实验初步证实了该规范在统计机器翻译中的有效性。
关键词
人工智能
机器翻译
汉英词语对齐规范
手工词语对齐
真对齐
伪对齐
强对齐
弱对齐
对齐和标注一致性
Keywords
artificial intelligence
machine translation
annotation guidelines for Chinese-English word alignment
manual word alignment
genuine link
pseudo link
strong link
weak link
alignment and annotation agreement
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉英词语对齐规范
赵红梅
刘群
张瑞强
吕雅娟
隅田英一郎
吴翠玲
《中文信息学报》
CSCD
北大核心
2009
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部