-
题名基于翻译模型和语言模型相融合的双语句对选择方法
被引量:2
- 1
-
-
作者
姚亮
洪宇
刘昊
刘乐
姚建民
-
机构
苏州大学江苏省计算机信息处理重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2016年第5期145-152,共8页
-
基金
国家自然科学基金(61373097
61272259
61272260)
-
文摘
双语句对选择方法旨在从大规模通用领域双语语料库中,自动抽取与待翻译文本领域相关性较高的句对,以缓解特定领域翻译模型训练语料不足的问题。区别于原有基于语言模型的双语句对选择方法,该文从句对生成式建模的角度出发,提出一种基于翻译模型和语言模型相融合的双语句对选择方法。该方法能够有效评价双语句对的领域相关性及互译性。实验结果显示,利用该文所提方法选择双语句对训练所得翻译系统,相比于基准系统,在测试集上性能提升3.5个BLEU值;此外,针对不同句对质量评价特征之间的权重调节问题,该文提出一种基于句对重排序的特征权重自动优化方法。基于该方法的机器翻译系统性能继续提升0.68个BLEU值。
-
关键词
双语句对选择
生成式建模
翻译模型
语言模型
权重调节
-
Keywords
bilingual data selection
generative modeling
translation model
language model
weight tuning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-