自然语言处理新范式:基于预训练模型的方法被引量：11

New Paradigm of Natural Language Processing:A Method Based on Pre-Trained Models

下载PDF

导出

摘要以BERT和GPT为代表的、基于超大规模文本数据的预训练语言模型能够充分利用大模型、大数据和大计算,使几乎所有自然语言处理任务性能都得到显著提升,在一些数据集上达到甚至超过人类水平,已成为自然语言处理的新范式。认为未来自然语言处理,乃至整个人工智能领域,将沿着“同质化”和“规模化”的道路继续前进,并将融入多模态数据、具身行为数据、社会交互数据等更多的“知识”源,从而为实现真正的通用人工智能铺平道路。 Pre-trained language models based on super-large-scale raw corpora,represented by BERT and GPT,can make full use of big models,big data,and big computing,which have significantly improved the performances of almost all-natural language processing tasks.The performances have reached or exceeded the human level on some datasets.Pre-trained language models have become a new para⁃digm for natural language processing.It is believed that in the future,natural language processing and even the entire field of artificial intelli⁃gence will continue to move forward along the path of“homogenization”and“scale”,and will integrate more sources of“knowledge”,such as multi-modal data,embodiment data,and social interaction data.Consequently,these methods will pave the way for achieving true gen⁃eral artificial intelligence.

作者车万翔刘挺 CHE Wanxiang;LIU Ting(Harbin Institute of Technology,Harbin 150001,China)

机构地区哈尔滨工业大学计算学部哈尔滨工业大学

出处《中兴通讯技术》 2022年第2期3-9,共7页 ZTE Technology Journal

关键词人工智能自然语言处理预训练语言模型同质化 artificial intelligence natural language processing pre-trained language model homogenization

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：155

共引文献154

1王伟,阮文翰,孟祥福.融合对抗训练的中文GPT对话模型研究[J].辽宁工程技术大学学报（自然科学版）,2023(3):378-384.
2邱凯锋,王则远,何志超,付凯利,梅童霖,关英杰,高飞,伍俊妍.人工智能技术在超说明书用药循证中的应用研究[J].中华临床医师杂志（电子版）,2023,17(12):1212-1218.
3余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：49
4Yi HAN,Linbo QIAO,Jianming ZHENG,Hefeng WU,Dongsheng LI,Xiangke LIAO.A survey of script learning[J].Frontiers of Information Technology & Electronic Engineering,2021,22(3):341-373.
5郝超,裘杭萍,孙毅,张超然.多标签文本分类研究进展[J].计算机工程与应用,2021,57(10):48-56. 被引量：25
6邱石贵,章化奥,段湘煜,张民.神经机器翻译的词级别正则化[J].厦门大学学报（自然科学版）,2021,60(4):662-669.
7王涛,刘超辉,郑青青,黄嘉曦.基于单向Transformer和孪生网络的多轮任务型对话技术[J].计算机工程,2021,47(7):55-58.
8陈晓玲,唐丽玉,胡颖,江锋,彭巍,冯先超.基于ALBERT模型的园林植物知识实体与关系抽取方法[J].地球信息科学学报,2021,23(7):1208-1220. 被引量：6
9王永鹏,周晓磊,马慧敏,曹吉龙,无.联合知识的融合训练模型[J].计算机系统应用,2021,30(7):50-56. 被引量：1
10杨修远,彭韬,杨亮,林鸿飞.基于知识蒸馏的自适应多领域情感分析[J].山东大学学报（工学版）,2021,51(3):15-21. 被引量：1

同被引文献73

1徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：384
2李祖枢,徐鸣,周其(钅监).一种新型的仿人智能控制器(SHIC)[J].自动化学报,1990,16(6):503-509. 被引量：65
3胡云忠,骆汉宾,钟波涛,胡海盟.基于本体的建筑质量管理规范建模与检索研究[J].土木工程与管理学报,2012,29(4):94-99. 被引量：8
4杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：126
5盛宇.微博舆情跨域周期波动实证研究[J].情报杂志,2015,34(10):123-128. 被引量：3
6秦晓慧,侯霞,赵雪.一种融合语义角色和依存句法的实体关系抽取算法[J].北京信息科技大学学报（自然科学版）,2019,34(1):64-67. 被引量：4
7梁吉业,冯晨娇,宋鹏.大数据相关分析综述[J].计算机学报,2016,39(1):1-18. 被引量：240
8蔡自兴.中国人工智能40年[J].科技导报,2016,34(15):12-32. 被引量：156
9马超,于晓虹,何海波.大数据分析:中国司法裁判文书上网公开报告[J].中国法律评论,2016(4):195-246. 被引量：148
10杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰.中文电子病历命名实体和实体关系语料库构建[J].软件学报,2016,27(11):2725-2746. 被引量：106

引证文献11

1史童月,王中卿.基于Transformer的自然语言处理预训练语言模型概述[J].信息与电脑,2022,34(10):52-56. 被引量：6
2王小毫,陈雯柏,张波,刘辉翔,王一群.一种基于预训练的固态硬盘RUL预测方法[J].北京信息科技大学学报（自然科学版）,2022,37(5):40-45.
3沈书生,祝智庭.ChatGPT类产品:内在机制及其对学习评价的影响[J].中国远程教育,2023(4):8-15. 被引量：94
4刘江波,徐宏,王浩茜,徐晟.盾构施工知识自动抽取与建模[J].土木工程与管理学报,2023,40(2):130-137.
5柳秀秀,孔春伟.自然语言处理在金融领域应用的场景、挑战和发展建议[J].金融科技时代,2023,31(5):23-27. 被引量：1
6周可婧.自然语言处理模型辅助法律检索的限度及应对——以ChatGPT为例[J].浙江万里学院学报,2023,36(3):53-59. 被引量：3
7徐卫克.基于人工智能的自然语言处理系统分析[J].网络安全技术与应用,2023(7):49-51. 被引量：4
8王辰,李明,马金刚.电子病历关系抽取综述[J].计算机工程与应用,2023,59(16):63-73. 被引量：3
9蔡津津.AIGC时代新闻舆论工作新阵地——面向大模型的可信训练数据集与服务能力建设[J].中国传媒科技,2023(10):79-83. 被引量：2
10朱炫鹏,姚海东,刘隽,熊先奎.大语言模型算法演进综述[J].中兴通讯技术,2024,30(2):9-20. 被引量：1

二级引证文献113

1王文雨.社交媒体中公众对ChatGPT的认知与态度研究——基于社会网络视角的微博文本数据分析[J].新媒体研究,2023,9(18):97-101.
2胡鑫月.ChatGPT驱动学习变革的可能空间与内在限度[J].课程教学研究,2023(10):14-24. 被引量：1
3钱奕霖.ChatGPT类产品赋能高职语文教学的现状分析与实践路径[J].汉字文化,2024(7):25-27.
4欧阳春雪.基于深度学习的多模态AIGC动画探究[J].现代电影技术,2023(1):41-47. 被引量：8
5吴砥,李环,陈旭.人工智能通用大模型教育应用影响探析[J].开放教育研究,2023,29(2):19-25. 被引量：96
6沈书生.适应与变革:AIGC产品如何改变教育过程——人工智能带来的机遇[J].教育研究与评论,2023(3):15-21. 被引量：4
7沈书生,祝智庭.ChatGPT类产品:内在机制及其对学习评价的影响[J].中国远程教育,2023(4):8-15. 被引量：94
8陈增照,石雅文,王梦珂.人工智能助推教育变革的现实图景——教师对ChatGPT的应对策略分析[J].广西师范大学学报（哲学社会科学版）,2023,59(2):75-85. 被引量：35
9李庆红,叶文梓.ChatGPT促进教育变革的机制、范式与风险[J].中国教育科学（中英文）,2023,6(3):45-51. 被引量：5
10蔡昌,庞思诚.ChatGPT的智能性及其在财税领域的应用[J].商业会计,2023(9):41-46. 被引量：17

1张倩,倪金根.初高中数学教学有效衔接的问题设计——以“绝对值”拓展教学为例[J].湖州师范学院学报,2022,44(4):106-110.
2王荇.飞行员认知任务负荷评估方法研究[J].科技创新与生产力,2022(3):93-95.
3张春艳,宋玉松.豆科植物野葛中生物活性物质葛根素对降脂功效及氧化途径[J].分子植物育种,2022,20(6):2012-2017. 被引量：1

中兴通讯技术

2022年第2期

浏览历史

内容加载中请稍等...

自然语言处理新范式:基于预训练模型的方法被引量：11

参考文献1

共引文献154

同被引文献73

引证文献11

二级引证文献113

相关作者

相关机构

相关主题

浏览历史

自然语言处理新范式:基于预训练模型的方法 被引量：11

参考文献1

共引文献154

同被引文献73

引证文献11

二级引证文献113

相关作者

相关机构

相关主题

浏览历史

自然语言处理新范式:基于预训练模型的方法被引量：11