自然语言处理中的预训练范式被引量：16

Pre-training Paradigm in Natural Language Processing

下载PDF

导出

摘要从2017年以来,自然语言处理中提出了“预训练+微调+师生学习”的新范式。这种新范式是自然语言处理的第四代范式,它代表着自然语言处理未来发展的方向。本文讨论自然语言处理中的这种新范式,分别介绍迁移学习、预训练、微调的原理和方法,并说明它们在Transformer、BERT、UniLM和Unicoder等模型中的应用。 Since 2017,the“pre-training+fine-tuning+teacher-student-learning”paradigm is proposed in natural language processing(NLP).This new paradigm is the fourth generation paradigm in NLP,and it represents a new development direction of NLP.The paper discusses this paradigm in NLP,introduces the principles and methods of transfer learning,pre-training and fine-tuning,and explains the application of these principles and methods in the models of Transformer,BERT,UniLM and Unicoder.

作者冯志伟李颖 FENG Zhiwei;LI Ying

机构地区杭州师范大学外国语学院黑龙江大学俄罗斯语言文学与文化研究中心

出处《外语研究》 CSSCI 北大核心 2021年第1期1-14,112,共15页 Foreign Languages Research

关键词自然语言处理范式预训练模型迁移学习注意力机制微调 natural language processing paradigm pre-trained model transfer learning attention mechanism fine-tuning

分类号 H030 [语言文字—语言学]

引文网络
相关文献

参考文献5

1冯志伟.计算语言学的历史回顾与现状分析[J].外国语,2011,34(1):9-17. 被引量：41
2冯志伟.罗塞塔石碑与机器翻译[J].外语学刊,2020,0(1):1-17. 被引量：7
3冯志伟.词向量及其在自然语言处理中的应用[J].外语电化教学,2019(1):3-11. 被引量：29
4冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
5冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018,41(6):35-48. 被引量：85

二级参考文献22

1冯志伟.语言学正面临战略转移的重要时刻[J].南开语言学刊,2013(1):7-19. 被引量：3
2刘群.机器翻译技术现状与展望[J].集成技术,2012,1(1):48-54. 被引量：16
3ALPAC.Language and Machines:Computer inTranslation and Linguistics. National Research Council Publication 1416 .
4Chomsky,N.,M.P.Schtzenberger.The algebraictheory of context-free languages. Computer Programming and FormalLanguage . 1963
5Koehn,Philipp.Statistical Machine Translation. . 2010
6Locke,W.N.,A.D.Booth.Machine Translation:Fourteen essays. . 1955
7Manaris,Bill.Natural language processing:a human-computer interaction perspective. Advances in Computers . 1998
8Markov A.A.Essai d’une recherche statistique sur letexte du roman"Ougene Onegin"illustrant la liaison desepreuve en chain. Bulletin de l’Academie Imprialedes Sciences de St-Ptersbourg . 1913
9Carstensen Kai-Uwe et al.Computerlinguistik und Sprachtechnologie,Eine Einführung. . 2004
10Chomsky,Noam,Luce,P.,Bush,R.,Galanter,E.Formal Properties of Grammars. Handbook of Mathematical Psychology, vol. II . 1963

共引文献184

1熊璨.论人工智能翻译的可能性——从翻译的三个层次看非文学与文学翻译[J].中外文化与文论,2020(2):106-115. 被引量：2
2饶高琦,王诚文.面向语言智能的语言资源标准化[J].语言规划学研究,2023(1):20-27.
3邓海龙.Python词向量训练与应用技术解析[J].语料库语言学,2019,0(2):88-109.
4熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
5杨霞.机器翻译与人工翻译在中国特色话语翻译中的对比分析——以二十大报告为例[J].现代英语,2024(5):121-123.
6陈思宇.人工智能背景下机器翻译在不同文本中的对比分析研究[J].现代英语,2023(19):111-114.
7梁慧莹.机器翻译与人工翻译的碰撞与融合[J].现代英语,2021(19):34-36.
8王湘玲,陈广姣,周祥艳.国际机器翻译译后编辑认知研究路线图(2011—2021)[J].外国语,2023,46(5):90-100. 被引量：3
9车思琪,李学沛.评价系统视阈下中美企业致股东信情感话语对比分析——基于情感词典和机器学习的文本挖掘技术[J].外国语,2021,44(2):50-59. 被引量：16
10周胜男.人工智能背景下机器翻译在不同文本中的应用与思考[J].科教导刊,2022(7):39-41.

同被引文献98

1保罗·约瑟夫·斯彭斯,雷纳塔·布兰多,谢佳(译).数字人文中的语言敏感性和多样性[J].数字人文研究,2022,2(3):3-20. 被引量：1
2张之沧.“身体主体性”解析[J].国外社会科学前沿,2020(11):4-17. 被引量：6
3冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
4阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：11
5黎学军,黄英.身体隐退:人工智能认识论制约问题的实质[J].贵州社会科学,2023(7):28-34. 被引量：1
6陆俭明,郭锐.汉语语法研究所面临的挑战[J].世界汉语教学,1998,12(4):3-21. 被引量：95
7刘增光,李鹏毅.后期维特根斯坦与胡塞尔的“意向性”理论的相通之处[J].社会科学论坛（学术研究卷）,2008(9):10-13. 被引量：2
8冯志伟.计算语言学的历史回顾与现状分析[J].外国语,2011,34(1):9-17. 被引量：41
9俞建梁.国外FOXP2基因及其语言相关性研究二十年[J].现代外语,2011,34(3):310-316. 被引量：10
10冯志伟.隐马尔可夫模型及其在自动词类标注中的应用[J].燕山大学学报,2013,37(4):283-298. 被引量：4

引证文献16

1冯志伟,丁晓梅.计算语言学中的语言模型[J].外语电化教学,2021(6):17-24. 被引量：7
2冯志伟,丁晓梅.自然语言处理中的神经网络模型[J].当代外语研究,2022(4):98-110. 被引量：11
3冯志伟,张灯柯.机器翻译与人工翻译相辅相成[J].外国语,2022,45(6):77-87. 被引量：13
4冯志伟,张灯柯,饶高琦.从图灵测试到ChatGPT——人机对话的里程碑及启示[J].语言战略研究,2023,8(2):20-24. 被引量：93
5冯志伟,张灯柯.GPT与语言研究[J].外语电化教学,2023(2):3-11. 被引量：22
6肖辛格,储小静,刘云.ChatGPT对我国语言战略的冲击与应对[J].天津师范大学学报（社会科学版）,2023(5):65-73. 被引量：8
7吴俊雄.ChatGPT在金融领域的应用探讨[J].湖北经济学院学报（人文社会科学版）,2023,20(9):34-37. 被引量：3
8冯志伟,张灯柯.语言模型与人工智能[J].外语研究,2024,41(1):1-19. 被引量：7
9王子威.论AIGC对文本中心主义的发展与挑战[J].福建师范大学学报（哲学社会科学版）,2024(1):75-87. 被引量：5
10王子威.人工智能的“理解”——论语言的工具性与存在性[J].东岳论丛,2024(1):125-135. 被引量：2

二级引证文献170

1刘友华,李扬帆.ChatGPT生成技术方案的专利法保护探究[J].知识产权,2023(7):76-89. 被引量：5
2李君灵,孙丰缘.基于ChatGPT看人工智能生成内容(AIGC)在学术研究中的应用探索——以黄河流域生态体育旅游为例[J].忻州师范学院学报,2023,39(5):59-65. 被引量：3
3吕垚瑶.ChatGPT类生成式人工智能技术迭代的犯罪风险及其治理[J].中国刑警学院学报,2024(1):78-87. 被引量：2
4江琰.ChatGPT对高校外语教学的影响及应对策略[J].现代英语,2023(24):46-48.
5刘宪权.生成式人工智能的发展与刑事责任能力的生成[J].法学论坛,2024,39(2):18-28. 被引量：6
6王湘玲,陈广姣,周祥艳.国际机器翻译译后编辑认知研究路线图(2011—2021)[J].外国语,2023,46(5):90-100. 被引量：3
7郭燕妮,谢雨馨.ChatGPT应用背景下人机协同国际中文汉字教学设计实践研究[J].汉字文化,2024(1):158-163.
8冯志伟,丁晓梅.自然语言处理中的神经网络模型[J].当代外语研究,2022(4):98-110. 被引量：11
9李佐文,梁国杰.语言智能学科的内涵与建设路径[J].外语电化教学,2022(5):88-93. 被引量：8
10戴光荣,刘思圻.神经网络机器翻译:进展与挑战[J].外语教学,2023,44(1):82-89. 被引量：9

1陈静.正念训练-射击项目中应用的新心理训练范式[J].体育风尚,2021(2):82-83. 被引量：1
2王葛彤,席洁,陈霓虹,黄昌兵.双眼视差的神经机制与知觉学习效应[J].心理科学进展,2021,29(1):56-69. 被引量：2
3崔永超,石鲁月,王晓波,罗一夫.疾病关联网络的构建及其对并发症预测方法的研究[J].中国数字医学,2021,16(2):39-44. 被引量：2
4刘道文,阮彤,张晨童,邱家辉,翟洁,何萍,葛小玲.基于多源知识图谱融合的智能导诊算法[J].中文信息学报,2021,35(1):125-134. 被引量：10

外语研究

2021年第1期

浏览历史

内容加载中请稍等...

自然语言处理中的预训练范式被引量：16

参考文献5

二级参考文献22

共引文献184

同被引文献98

引证文献16

二级引证文献170

相关作者

相关机构

相关主题

浏览历史

自然语言处理中的预训练范式 被引量：16

参考文献5

二级参考文献22

共引文献184

同被引文献98

引证文献16

二级引证文献170

相关作者

相关机构

相关主题

浏览历史

自然语言处理中的预训练范式被引量：16