利用语义关联增强的跨语言预训练模型的译文质量评估被引量：1

A Semantic Connection Enhanced Cross-language Pre-trained Model for MT Quality Estimation

下载PDF

导出

摘要机器翻译质量评估(QE)是在不依赖参考译文的条件下,自动对机器翻译译文进行评估。当前人工标注数据稀缺,使得神经QE模型在自动检测译文错误方面还存在较大问题。为了更好地利用规模庞大但却缺少人工标注信息的平行语料,该文提出一种基于平行语料的翻译知识迁移方案。首先采用跨语言预训练模型XLM-R构建神经质量评估基线系统,在此基础上提出三种预训练策略增强XLM-R的双语语义关联能力。该文方法在WMT 2017和WMT 2019的英德翻译质量评估数据集上都达到了最高性能。 Quality Estimation(QE)of Machine Translation(MT)can automatically estimate the quality of MT outputs without references.Due to the lack of manual data,the current QE Systems with neural network architecture still have problems in automatically detecting translation errors.For the sake of utilizing the vast but unlabeled parallel data,this paper proposes a translation knowledge transfer method.First,the cross-lingual pre-trained model XLM-R is used to construct the neural quality estimation baseline system,then we propose three pre-training strategies to enhance the bilingual semantic connection ability of XLM-R.The proposed method in this paper has reached the new SOTA performance on both the WMT2017and WMT2019quality estimation data sets.

作者叶恒贡正仙 YE Heng;GONG Zhengxian(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2023年第3期79-88,共10页 Journal of Chinese Information Processing

基金国家自然科学基金(61976148) 江苏高校优势学科建设工程资助项目

关键词机器翻译质量评估跨语言预训练模型语义关联预训练策略 quality estimation of machine translation cross-lingual pretrained model semantic connection pretraining strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1陆金梁,张家俊.基于多语言预训练语言模型的译文质量估计方法[J].厦门大学学报（自然科学版）,2020,59(2):151-158. 被引量：11

共引文献10

1王晟由,邵春福,董春娇,黄士琛,郑炎.基于GPS轨迹数据的货车交通流量需求预测循环神经网络模型[J].北京交通大学学报,2021,45(3):15-23. 被引量：8
2王玉荣,林民,李艳玲.BERT跨语言词向量学习研究[J].计算机科学与探索,2021,15(8):1405-1417. 被引量：2
3叶娜,黎天宇,蔡东风,徐佳.利用依存句法关系改进神经译文质量估计[J].中文信息学报,2021,35(9):46-57. 被引量：3
4杨璐,樊同科.基于Cloud LM算法的机器翻译语言模型设计与应用[J].信息技术,2022,46(5):48-52. 被引量：2
5罗兰,何贤敏,李茂西.句子级别机器译文质量估计研究综述[J].情报工程,2022,8(2):34-50. 被引量：1
6陈世男,贡正仙,李军辉,周国栋.相似度增强的译文质量评估方法[J].厦门大学学报（自然科学版）,2022,61(4):646-653.
7杨丹,拥措,仁青卓玛,唐超超.基于mRASP的藏汉双向神经机器翻译研究[J].计算机技术与发展,2023,33(12):200-206. 被引量：2
8王坤,盛鸿宇.一种提高跨语言理解的NLP迁移学习[J].西南大学学报（自然科学版）,2024,46(4):153-163.
9王均松,庄淙茜,魏勇鹏.机器翻译质量评估:方法、应用及展望[J].外国语文,2024,40(3):135-144. 被引量：1
10李伟棠.AI人工智能翻译中基于注意力机制和联合训练的QE任务分析[J].自动化与仪器仪表,2024(9):258-262.

同被引文献16

1刘媛,李茂西,项青宇,李易函.基于多元信息融合的神经机器译文自动评价方法[J].中文信息学报,2023,37(3):89-100. 被引量：1
2邹翔,朱俊国,高盛祥,余正涛,杨福岸.融入语言差异化特征的汉越神经机器翻译译文质量估计[J].小型微型计算机系统,2022,43(7):1413-1418. 被引量：3
3阿里木·赛买提,沙丽瓦尔·阿里木,吐尔根·依不拉音,段雪明,古丽尼格尔·阿不都外力,麦合甫热提,吾守尔·斯拉木.维汉人名翻译中不雅字或OOV的前处理研究[J].东北师大学报（自然科学版）,2022,54(2):76-80. 被引量：3
4王涛,熊德意.用预定义双语对增强神经机器翻译[J].中文信息学报,2022,36(6):36-43. 被引量：5
5刘莉,王怡,邵波.面向智慧图书馆的多语言自动翻译平台架构设计研究[J].图书馆学研究,2022(6):37-44. 被引量：3
6黎家全,王丽清,李鹏,蒋晓敏,徐永跃.面向神经机器翻译的枢轴方法研究综述[J].计算机工程与应用,2022,58(16):49-55. 被引量：1
7吴影,李朝.机器翻译对二语写作的影响研究:焦点与趋势[J].上海翻译,2022(4):35-39. 被引量：4
8李奉栖.人工智能时代人机英汉翻译质量对比研究[J].外语界,2022(4):72-79. 被引量：16
9乔晶,李鹤元.一种海图英语地名机器翻译方法[J].海洋测绘,2022,42(5):73-77. 被引量：2
10席红旗,蒋亚平.基于动态词汇编码的树形神经机器翻译[J].计算机工程与设计,2022,43(9):2678-2685. 被引量：7

引证文献1

1孙国栋.基于循环神经网络的计算机辅助翻译系统设计[J].自动化与仪器仪表,2023(9):188-191.

1朱成振,高见书,许康世,马旭.冻干重组人脑利钠肽治疗急性心肌梗死术后患者的疗效观察[J].现代医学与健康研究电子杂志,2023,7(10):75-77.
2WANG Li,YANG Linsheng,WEI Binggan,LI Hairong,CAI Hongyan,HUANG Jixia,YUAN Xing.Incorporating Exercise Efficiency to Evaluate the Accessibility and Capacity of Medical Resources in Tibet, China[J].Chinese Geographical Science,2023,33(1):175-188.
3高怡,纪焘,吴苑斌,牟小峰,王椗.基于标签增强和对比学习的鲁棒小样本事件检测[J].中文信息学报,2023,37(4):98-108. 被引量：3
4陈祥明,王宝宝,李若瑜,林乐科,朱庆林.不同加权平均温度模型对大气可降水量影响分析[J].全球定位系统,2023,48(3):72-76.
5王少爽.构建具有国际传播视野的中国特色翻译观——读黄友义《从“翻译世界”到“翻译中国”》[J].上海翻译,2023(4):90-94. 被引量：5
6刘向举,赵犇,方贤进,徐杨洋.SDN中基于过程优化的动态负载均衡策略[J].计算机工程,2023,49(8):137-145.
7梁启超.《九歌·山鬼》中的屈原人格[J].高中生学习（作文素材与时评）,2023(5):49-50.
8Shijie Hu,Xiaoyu Li,Jiayu Bai,Hang Lei,Weizhong Qian,Sunqiang Hu,Cong Zhang,Akpatsa Samuel Kofi,Qian Qiu,Yong Zhou,Shan Yang.Neural Machine Translation by Fusing Key Information of Text[J].Computers, Materials & Continua,2023(2):2803-2815.
9吴艾琳.变电站自动化系统中的远动通道数据迁移分析[J].电子技术（上海）,2023,52(6):252-253. 被引量：1

中文信息学报

2023年第3期

浏览历史

内容加载中请稍等...

利用语义关联增强的跨语言预训练模型的译文质量评估被引量：1

参考文献1

共引文献10

同被引文献16

引证文献1

相关作者

相关机构

相关主题

浏览历史

利用语义关联增强的跨语言预训练模型的译文质量评估 被引量：1

参考文献1

共引文献10

同被引文献16

引证文献1

相关作者

相关机构

相关主题

浏览历史

利用语义关联增强的跨语言预训练模型的译文质量评估被引量：1