-
题名同源语料增强的低资源神经机器翻译
- 1
-
-
作者
王琳
刘伍颖
-
机构
上海外国语大学贤达经济人文学院
鲁东大学山东省语言资源开发与应用重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2024年第2期54-60,共7页
-
基金
教育部人文社会科学研究青年基金(20YJC740062)
教育部人文社会科学研究规划基金(20YJAZH069)
+3 种基金
教育部新文科研究与改革实践项目(2021060049)
上海市哲学社会科学“十三五”规划课题(2019BYY028)
山东省研究生教育改革研究项目(SDYJG21185)
山东省本科教学改革研究重点项目(Z2021323)。
-
文摘
缺少平行句对的低资源机器翻译面临跨语言语义转述科学问题。该文围绕具体的低资源印尼语-汉语机器翻译问题,探索了基于同源语料的数据增广方法,并混合同源语料训练出更优的神经机器翻译模型。这种混合语料模型在印尼语-汉语机器翻译实验中提升了3个多点的BLEU4评分。实验结果证明,同源语料能够有效增强低资源神经机器翻译性能,而这种有效性主要是源于同源语言之间的形态相似性和语义等价性。
-
关键词
同源语料
数据增广
低资源机器翻译
印尼语
马来语
-
Keywords
cognate corpus
data augmentation
low-resource machine translation
Indonesian
Malay
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名毛泽东著作同源文本汉英复合语料库的研制与应用
- 2
-
-
作者
石欣玉
黄立波
-
机构
西安外国语大学
-
出处
《当代外语研究》
2023年第6期175-184,共10页
-
基金
国家社科基金重大项目“围绕汉语的超大型多语汉外平行语料库集群研制与应用研究”(编号21&ZD290)
教育部人文社会科学研究一般项目“基于汉语母语学习语料库的中小学《语文》教材翻译文本语言特征与功能考察研究”(编号21XJA740004)的相关研究成果。
-
文摘
本研究由版本变迁出发,从理论层面探讨同源文本及其翻译问题,而后介绍毛泽东著作中的同源文本及其英译,在此基础上描述毛泽东著作同源文本汉英复合语料库的基本架构和创建流程,并介绍该语料库的库容、研究模式以及应用领域。与一般意义上的平行语料库相比,该语料库可用于考察同源文本之间的变迁,相关研究发现不仅可以解释不同译本之间的差异,而且可为毛泽东话语研究、毛泽东思想研究以及中国国家形象的多视角建构研究提供一定借鉴。
-
关键词
版本变迁
同源文本
毛泽东著作同源文本汉英复合语料库
-
Keywords
changes in versions
homogenous texts
Chinese-English Composite Corpora of Homogeneous Texts by Mao Zedong
-
分类号
H315.9
[语言文字—英语]
-