基于复述增广的医疗领域机器翻译被引量：1

Paraphrase Based Data Augmentation For Chinese-English Medical Machine Translation

下载PDF

导出

摘要医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖于大规模的平行句对训练翻译模型。目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不佳。针对医疗垂直领域机器翻译训练数据不足的问题,该文提出利用复述生成技术对汉英医疗机器翻译数据进行增广,扩大汉英机器翻译的规模。通过多种主流的神经机器翻译模型的实验结果表明,通过复述生成对数据进行增广可以有效地提升机器翻译的性能,在RNNSearch,Transformer等多个主流模型上均取得了6个点以上的BLEU值提升,验证了复述增广方法对领域机器翻译的有效性。同时,基于MT5等大规模预训练语言模型可以进一步地提升机器翻译的性能。 Medical machine translation is of great value for cross-border medical translation.Chinese to English neural machine translation has made great progress based on deep learning,powerful modeling ability and large-scale bilingual parallel data.Neural machine translation relies usually on large-scale parallel sentence pairs to train translation models.At present,Chinese-English translation data are mainly in the fields of news,policy and so on.Due to the lack of parallel data in the medical field,the performance of Chinese to English machine translation in the medical field is not compromising.To reduce the size of parallel data for training medical machine translation models,this paper proposes a paraphrase based data augmentation mechanism.The experimental results on a variety of neural machine translation models show that data augmentation through paraphrase augmentation can effectively improve the performance of medical machine translation,and has achieved consistency improvements on mainstream models such as RNNSearch and Transformers,which verifies the effectiveness of paraphrase augmentation method for domain machine translation.Meanwhile,the medical machine translation performances could be further improved based on large-scale pre-training language model,such as MT5.

作者安波龙从军 AN Bo;LONG Congjun(Institute of Ethnology and Anthropology,Chinese Academy of Social Sciences,Beijing,100081,China)

机构地区中国社会科学院民族学与人类学研究所

出处《电子与信息学报》 EI CSCD 北大核心 2022年第1期118-126,共9页 Journal of Electronics & Information Technology

基金国家自然科学基金(62076233) 中国社会科学院重大创新工程项目(2020YZDZX01-2)。

关键词神经机器翻译汉英翻译复述生成数据增广大规模预训练语言模型 Neural machine translation Chinese to English translation Paraphrase generation Data augmentation Large scale pre-traing language model

分类号 TN912.3 [电子电信—通信与信息系统] TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘群.统计机器翻译综述[J].中文信息学报,2003,17(4):1-12. 被引量：71
2李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：110

二级参考文献15

1俞士汶等.机器翻译译文质量自动评估系统[A]..中国中文信息学会1991年会论文集[C].,.314—319.
2Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Pietra, Fredrick Jelinek, John D. Lafferty, Robert L. Mercer, Paul S. Roossin, A Statistical Approach to Machine Translation [J],Computational Linguistics, 1990.
3Peter. F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, Robert L. Mercer, The Mathematics of Statistical Machine Translation: Parameter Estimation [J], Computational Linguiatics, 19,(2), 1993.
4F. J. Och, C. Tillmann, and H. Ney. Improved alignment models for statistical machine translation[A]. In Proc. of the Joint SIGDAT Conf. On Empirical Methods in Natural Language Processing and Very Large Corpora, pages 20-28, University of Maryland, College Park, MD, June 1999.
5Franz Josef Och, Hermann Ney. What Can Machine Translation Learn from Speech Recognition? [A]In: proceedings of MT 2001 Workshop: Towards a Road Map for MT, 26-31, Santiago de Compostels,Spain, September 2001.
6Franz Josef Och, Hermann Ney, Discriminative Training and Maximum Entropy Models for Statistical Machine Translation [A], ACL2002.
7K. A. Papineni, S. Roukos, and R. T. Ward. Feature-based language understanding[A]. In European Conf. on Speech Communication and Technology, 1435-1438, Rhodes, Greece, September,1997.
8K. A. Papineni, S. Roukos, and R. T. Ward. Maximum likelihood and discriminative training of direct translation models [A] In Proc. Int. Conf. on Accoustics, Speech, and Signal Processing,pages,189-192, Seattle, WA, May, 1998.
9Kishore Papineni, Salim Roukos, Todd Ward, Wei-Jing Zhu, Bleu: a Method for Automatic Evaluation of Machine Translation [R], IBM Research, RC22176 (W0109-022) September 17, 2001.
10Ye-Yi Wang, Grammar Inference and Statistical Machine Translation [D], Ph.D Thesis, Carnegie Mellon University, 1998.

共引文献175

1熊璨.论人工智能翻译的可能性——从翻译的三个层次看非文学与文学翻译[J].中外文化与文论,2020(2):106-115. 被引量：2
2唐元楠.论机器翻译的现状[J].南国博览,2019,0(4):380-380.
3贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
4李霞,马骏腾,覃世豪.融合图像注意力的多模态机器翻译模型[J].中文信息学报,2020(7):68-78. 被引量：5
5明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
6邓凌云,余环.中外笔译质量要求的对比研究与启示[J].当代外语研究,2019,0(4):115-123.
7赵玉蓉,刘欢,龙玟月,杨鑫,杨茜,阮先玉.浅析张培基英译散文风格与AI英译散文风格[J].新东方英语（中英文版）,2019,0(12):101-102.
8李思特.基于自然语言处理的人工智能歌词创作[J].中国科技纵横,2019,0(14):41-42.
9周新栋,王挺.基于N元语言模型的文本分类方法[J].计算机应用,2005,25(1):11-13. 被引量：11
10肖明.机器翻译系统中间件模型[J].福建电脑,2006,22(3):122-123.

同被引文献3

1刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：109
2高巍,陈子祥,李大舟,李耀松.预标准化Transformer在乌英机器翻译中的实现[J].小型微型计算机系统,2020,41(11):2286-2291. 被引量：13
3史天运,侯博,李国华,代明睿,杨涛存.铁路人工智能平台设计及关键技术研究[J].铁路计算机应用,2023,32(8):9-16. 被引量：5

引证文献1

1李子林,刘庆猛,李雪山.基于Transformer模型的轨道交通机器翻译系统设计[J].铁路计算机应用,2024,33(4):54-58.

1宁秋怡,史小静,段湘煜.短语后验证的无监督领域适应电商机器翻译[J].计算机技术与发展,2021,31(12):1-6.
2金波,刘明童,张玉洁,徐金安,陈钰枫.融合深度语义表示的开放域复述模板抽取[J].情报工程,2021,7(5):40-50. 被引量：2
3冯一成.重视应用题讲评提升数学建模素养——一道应用题讲评实录与反思[J].中学教研（数学版）,2021(4):24-29.
4石庆涛.高中数学核心素养培养策略[J].数学大世界（下旬）,2021(1):4-4.
5朱燕.初中数学教学中学生建模能力的培养探究[J].数理化学习（教研版）,2021(1):15-16. 被引量：3
6汤恒锦.如何提高高中数学教学的有效性[J].数学大世界（上旬）,2020(10):10-10.
7方志高.高中数学教学中学生建模能力的提升探索[J].读天下（综合）,2020,0(11):0034-0034.
8高迎春.高中数学教学中培养学生数学建模能力的策略[J].数理化解题研究,2020(30):14-15. 被引量：3
9马超,万璋,张玉洁,徐金安,陈钰枫.引入图像信息的多模态复述生成模型[J].北京大学学报（自然科学版）,2022,58(1):45-53.
10李晓丹.大学英语翻译训练中常见“中式英语”诸问题探析[J].现代英语,2021(9):45-47.

电子与信息学报

2022年第1期

浏览历史

内容加载中请稍等...

基于复述增广的医疗领域机器翻译被引量：1

参考文献2

二级参考文献15

共引文献175

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于复述增广的医疗领域机器翻译 被引量：1

参考文献2

二级参考文献15

共引文献175

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于复述增广的医疗领域机器翻译被引量：1