期刊文献+

自然语言处理中的预训练范式 被引量:16

Pre-training Paradigm in Natural Language Processing
下载PDF
导出
摘要 从2017年以来,自然语言处理中提出了“预训练+微调+师生学习”的新范式。这种新范式是自然语言处理的第四代范式,它代表着自然语言处理未来发展的方向。本文讨论自然语言处理中的这种新范式,分别介绍迁移学习、预训练、微调的原理和方法,并说明它们在Transformer、BERT、UniLM和Unicoder等模型中的应用。 Since 2017,the“pre-training+fine-tuning+teacher-student-learning”paradigm is proposed in natural language processing(NLP).This new paradigm is the fourth generation paradigm in NLP,and it represents a new development direction of NLP.The paper discusses this paradigm in NLP,introduces the principles and methods of transfer learning,pre-training and fine-tuning,and explains the application of these principles and methods in the models of Transformer,BERT,UniLM and Unicoder.
作者 冯志伟 李颖 FENG Zhiwei;LI Ying
出处 《外语研究》 CSSCI 北大核心 2021年第1期1-14,112,共15页 Foreign Languages Research
关键词 自然语言处理 范式 预训练模型 迁移学习 注意力机制 微调 natural language processing paradigm pre-trained model transfer learning attention mechanism fine-tuning
  • 相关文献

参考文献5

二级参考文献22

  • 1冯志伟.语言学正面临战略转移的重要时刻[J].南开语言学刊,2013(1):7-19. 被引量:3
  • 2刘群.机器翻译技术现状与展望[J].集成技术,2012,1(1):48-54. 被引量:16
  • 3ALPAC.Language and Machines:Computer inTranslation and Linguistics. National Research Council Publication 1416 .
  • 4Chomsky,N.,M.P.Schtzenberger.The algebraictheory of context-free languages. Computer Programming and FormalLanguage . 1963
  • 5Koehn,Philipp.Statistical Machine Translation. . 2010
  • 6Locke,W.N.,A.D.Booth.Machine Translation:Fourteen essays. . 1955
  • 7Manaris,Bill.Natural language processing:a human-computer interaction perspective. Advances in Computers . 1998
  • 8Markov A.A.Essai d’une recherche statistique sur letexte du roman"Ougene Onegin"illustrant la liaison desepreuve en chain. Bulletin de l’Academie Imprialedes Sciences de St-Ptersbourg . 1913
  • 9Carstensen Kai-Uwe et al.Computerlinguistik und Sprachtechnologie,Eine Einführung. . 2004
  • 10Chomsky,Noam,Luce,P.,Bush,R.,Galanter,E.Formal Properties of Grammars. Handbook of Mathematical Psychology, vol. II . 1963

共引文献184

同被引文献98

引证文献16

二级引证文献170

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部