-
题名融入新能源领域术语知识的机器翻译方法
被引量:1
- 1
-
-
作者
董振恒
任维平
游新冬
吕学强
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学外国语学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第6期305-312,共8页
-
基金
北京市自然科学基金(4212020)
国家自然科学基金(61671070)
+1 种基金
北京信息科技大学“勤信人才”培育计划项目(QXTCPB201908)
北京市市教委科研计划(KM202111232001)。
-
文摘
在领域机器翻译中,领域术语能否被正确翻译对翻译质量起着决定性作用,有效地将领域术语融入到神经机器翻译模型中,提升领域术语的翻译质量具有实际意义。文中提出了一种将新能源领域术语信息作为先验知识融入神经机器翻译中的方法,以新能源领域双语术语知识库构建的术语字典为媒介,提出并比较了两种不同的知识融入方式:1)术语替换,即在源语言端使用目标端术语替换源端术语;2)术语添加,即在源语言端将源端术语与目标端术语拼接,并在源语言端与目标语言端均使用作为特殊外部知识的标识符来标识目标端术语的开头与结尾。以新能源领域中英文双语对齐语料以及构建的中英文对齐术语库为数据基础进行了实验,结果表明,在测试集上,所提方法的BLEU值比基线实验分别高出6.38与6.55,证明了所提方法能有效地将领域术语知识融入到翻译模型中,提升了领域术语的翻译质量。
-
关键词
领域机器翻译
领域术语
特殊标识
先验知识
术语替换
术语添加
-
Keywords
Domain machine translation
Domain terms
Special identification
Prior knowledge
Term replacement
Term append
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-