期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多策略汉英平行语料的过滤方法研究
1
作者
张国成
王颖敏
+6 位作者
钟恩俊
江秋怡
江舫
章栋
朱宏康
陈毅东
史晓东
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第4期641-647,共7页
为了解决汉英平行语料中带噪声的问题,通过设计规则方法、统计方法(包括Zipporah系统、词对齐模型、语言模型)以及神经网络方法(包括翻译模型和双语预训练模型),从不同侧重点对汉英句对平行程度进行度量.结果表明翻译模型和双语预训练...
为了解决汉英平行语料中带噪声的问题,通过设计规则方法、统计方法(包括Zipporah系统、词对齐模型、语言模型)以及神经网络方法(包括翻译模型和双语预训练模型),从不同侧重点对汉英句对平行程度进行度量.结果表明翻译模型和双语预训练模型在过滤优质平行语料任务上有良好表现.最后,对于表现优异的方法,按照加法和乘法两种方式进行加权融合,取得了不错的双语互译评估结果,对语料过滤任务具有一定参考价值.
展开更多
关键词
机器翻译
语料过滤
预训练模型
下载PDF
职称材料
题名
多策略汉英平行语料的过滤方法研究
1
作者
张国成
王颖敏
钟恩俊
江秋怡
江舫
章栋
朱宏康
陈毅东
史晓东
机构
厦门大学信息学院
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第4期641-647,共7页
基金
国家自然科学基金(62076211,U1908216)。
文摘
为了解决汉英平行语料中带噪声的问题,通过设计规则方法、统计方法(包括Zipporah系统、词对齐模型、语言模型)以及神经网络方法(包括翻译模型和双语预训练模型),从不同侧重点对汉英句对平行程度进行度量.结果表明翻译模型和双语预训练模型在过滤优质平行语料任务上有良好表现.最后,对于表现优异的方法,按照加法和乘法两种方式进行加权融合,取得了不错的双语互译评估结果,对语料过滤任务具有一定参考价值.
关键词
机器翻译
语料过滤
预训练模型
Keywords
machine translation
corpus filtering
pre-trained model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多策略汉英平行语料的过滤方法研究
张国成
王颖敏
钟恩俊
江秋怡
江舫
章栋
朱宏康
陈毅东
史晓东
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部