支持鹏程系列开源大模型应用生态演化的可持续学习能力探索被引量：2

Exploration of the continual learning ability that supports the application ecological evolution of the large-scale pretraining Peng Cheng series open source models

下载PDF

导出

摘要大规模预训练模型利用大规模语料以及多样化的预训练任务在自然语言处理领域取得了巨大的成功。随着大模型的逐步发展,大模型的可持续学习能力探索成为新的研究热点。主要介绍鹏程系列大模型持续学习的技术体系、应用实践以及面临的挑战,包括通过任务扩展、数据增量和知识推理的鹏程系列可持续学习技术体系,开源大模型鹏程·盘古多任务可持续学习和鹏程·通言大模型的可持续学习能力实践,大模型可持续学习过程中面临的词表更新、语义映射和知识冲突等挑战。 Large-scale pre-training models have achieved great success in the field of natural language processing by us-ing large-scale corpora and pre-training tasks.With the gradual development of large models,the continual learning abil-ity of large models has become a new research focus.The continual learning technology of the Peng Cheng series large models,the exploration of practice and the still facing challenges were mainly introduced,including the Peng Cheng se-ries continual learning technology through task expansion,data increment and knowledge reasoning,Peng Cheng PAN-GU multi-task continual learning and the practical exploration of the continual learning ability of the Peng Cheng TON-GYAN open source large model,the vocabulary update,semantic mapping and knowledge conflicts that the large model faces in the process of continual learning.

作者余跃刘欣蒋芳清张晗王晖曾炜 YU Yue;LIU Xin;JIANG Fangqing;ZHANG Han;WANG Hui;ZENG Wei(Open Source Institution,Network Intelligence Department,Peng Cheng Laboratory,Shenzhen 518055,China;National University of Defense Technology,Changsha 410073,China;Peking University,Beijing 100091,China)

机构地区鹏城实验室网络智能部开源所国防科技大学北京大学

出处《智能科学与技术学报》 2022年第1期97-108,共12页 Chinese Journal of Intelligent Science and Technology

基金新形势下我国技术开源战略研究(NO.GHZX2020ZCQ013)。

关键词鹏程系列大模型可持续学习鹏程·盘古鹏程·通言开源大模型 Peng Cheng series large model continual learning Peng Cheng PANGU Peng Cheng TONGYAN open source large model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1杜会芳,王昊奋,史英慧,王萌.知识图谱多跳问答推理研究进展、挑战与展望[J].大数据,2021,7(3):60-79. 被引量：10
2亢晓勉,宗成庆.融合篇章结构位置编码的神经机器翻译[J].智能科学与技术学报,2020(2):144-152. 被引量：5

二级参考文献7

1杜倩龙,宗成庆,苏克毅.利用上下文相似度增强词对齐效果的自然语言推理方法[J].智能科学与技术学报,2020(1):26-35. 被引量：2
2张钹.人工智能进入后深度学习时代[J].智能科学与技术学报,2019,0(1):4-6. 被引量：43
3郑南宁.人工智能新时代[J].智能科学与技术学报,2019,0(1):1-3. 被引量：64
4官赛萍,靳小龙,贾岩涛,王元卓,程学旗.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2966-2994. 被引量：171
5陈成,陈跃国,刘宸,吕晓彤,杜小勇.意图知识图谱的构建与应用[J].大数据,2020,6(2):57-68. 被引量：6
6王昊奋,丁军,胡芳槐,王鑫.大规模企业级知识图谱实践综述[J].计算机工程,2020,46(7):1-13. 被引量：47
7邹艳珍,王敏,谢冰,林泽琦.基于大数据的软件项目知识图谱构造及问答方法[J].大数据,2021,7(1):22-36. 被引量：7

共引文献13

1杜芳.基于英汉语义关联的中华民族对外交流史料知识库研究[J].湖南工业职业技术学院学报,2022,22(6):56-60.
2李欣,冯小芳,金福才.铁路调度应急预案知识图谱构建[J].铁路计算机应用,2021,30(6):21-26. 被引量：4
3厉晓妍,张德平.基于位置编码与实体交互信息的关系抽取方法[J].计算机系统应用,2022,31(6):238-244. 被引量：1
4付林,刘钊,邱晨,高峰.基于特征联合与多注意力的实体关系链接[J].计算机工程,2022,48(8):53-61. 被引量：1
5冯钧,李艳,杭婷婷.问答系统中复杂问题分解方法研究综述[J].计算机工程与应用,2022,58(17):23-33. 被引量：4
6亢晓勉,宗成庆.基于篇章结构多任务学习的神经机器翻译[J].软件学报,2022,33(10):3806-3818. 被引量：10
7段亚茹,赵嘉雨,何立明.基于生成对抗网络的文本生成图像算法[J].计算机系统应用,2023,32(1):348-357. 被引量：3
8周俊宇,花洁,骆国铭.一种电网领域数据的知识图谱搜索引擎构建[J].微型电脑应用,2023,39(2):119-122. 被引量：1
9张晓帆,孙海春,李欣.融合多层注意力机制与BiLSTM的知识图谱补全算法研究[J].数据与计算发展前沿,2023,5(3):123-137. 被引量：1
10蒋峰,范亚鑫,褚晓敏,李培峰,朱巧明.英汉篇章结构分析研究综述[J].软件学报,2023,34(9):4167-4194.

同被引文献21

1王正中.专家系统导论[J].系统仿真学报,1990,2(3):62-66. 被引量：1
2胡晓峰,郭圣明,贺筱媛.指挥信息系统的智能化挑战——“深绿”计划及AlphaGo带来的启示与思考[J].指挥信息系统与技术,2016,7(3):1-7. 被引量：52
3骞宇澄,刘昭策.深度学习的实现与发展——从神经网络到机器学习[J].电子技术与软件工程,2017(11):30-31. 被引量：20
4刘钰鹏.深度学习研究概述[J].信息与电脑,2016,28(3):52-53. 被引量：5
5张维明,黄松平,朱承,刘俊先,孙立健.指挥控制的新范式:边缘指挥控制[J].指挥信息系统与技术,2021,12(1):1-7. 被引量：23
6岳增营,叶霞,刘睿珩.基于语言模型的预训练技术研究综述[J].中文信息学报,2021,35(9):15-29. 被引量：46
7张盼,沈绍武,田双桂,肖勇,宋淑洁.中医临床大数据知识工程规划与设计[J].时珍国医国药,2022,33(3):764-766. 被引量：21
8韩毅,乔林波,李东升,廖湘科.知识增强型预训练语言模型综述[J].计算机科学与探索,2022,16(7):1439-1461. 被引量：3
9黄菊,李耿,张霄潇,马勇,詹志来,元唯安,瞿礼萍,黄诗尧,李博,闫博华,李文元,刘雳,王智磊,冯怡,张磊,唐健元.新时期下中医药产业发展的有关思考[J].中国中药杂志,2022,47(17):4799-4813. 被引量：34
10王皓宇,JEON Eunah,张卫强,李科,黄宇凯.基于声学模型共享的零资源韩语语音识别[J].数据采集与处理,2023,38(1):93-100. 被引量：2

引证文献2

1崔翛龙,高志强,姬纬通,沈佳楠,张敏,邱鑫源.“艾武大模型+”:一种军事大模型系统的开发与实证[J].数据采集与处理,2024,39(3):588-597.
2李君,李紫明,毛树松,李晓东.临床中医肝胆病学领域大模型构建思路与方法研究[J].中西医结合肝病杂志,2024,34(9):769-774.

1王治敏,俞士汶.基于大规模语料的汉语教学词表更新研究——以《汉语国际教育用音节汉字词汇等级划分》名词为例[J].辞书研究,2019,0(5):64-74. 被引量：3
2侴海峰.“两步申报”背景下报关实务课程实践教学改革探析[J].对外经贸,2021(11):114-117. 被引量：2
3李洁.欠发达地区中职生升学意愿影响因素研究——基于56个案例的清晰集定性比较分析[J].教育导刊（上半月）,2021(12):76-84. 被引量：4
4王丹,赵新力,杜旭,郭翔宇.国家农业科技创新系统生态演化研究[J].中国软科学,2021(12):41-49. 被引量：18
5杨艳红,刘向玲.《Java核心与高级特性》课程教学改革探索[J].电子测试,2022,36(2):135-136.
6钟怡江,文华国,陈洪德,刘磊,陈安清,王兴龙,王志伟,白璇.胞外聚合物在蓝细菌钙化过程中的作用及其地质意义[J].沉积学报,2022,40(1):88-105. 被引量：2
7王春喻,马志强,杜宝祥,贾文超,王洪彬,宝财吉拉呼.面向端到端的情感对话生成研究综述[J].计算机科学与探索,2022,16(2):280-295. 被引量：2
8刘文军,黄瑶.ArcGISSpatialETL工具在数据整合中的应用[J].地理空间信息,2022,20(3):100-102. 被引量：3
9籍佳伟.“差一点”相关词义及对译方式辨别[J].辽东学院学报（社会科学版）,2022,24(1):92-97.
10程章萍.高中田径训练中核心力量训练措施[J].高考,2021(32):165-166. 被引量：3

智能科学与技术学报

2022年第1期

浏览历史

内容加载中请稍等...

支持鹏程系列开源大模型应用生态演化的可持续学习能力探索被引量：2

参考文献2

二级参考文献7

共引文献13

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

支持鹏程系列开源大模型应用生态演化的可持续学习能力探索 被引量：2

参考文献2

二级参考文献7

共引文献13

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

支持鹏程系列开源大模型应用生态演化的可持续学习能力探索被引量：2