期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

鹏程·盘古:大规模自回归中文预训练语言模型及应用被引量：4

Pengcheng-PanGu:Large-Scale Autoregressive Pre-Trained Chinese Language Model with Auto-Parallel Computation and Its Application

下载PDF

导出

摘要在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。 The world's first large-scale autoregressive pre-trained Chinese language model named Pengcheng-PanGu with up to 200 billion parameters is presented.Pengcheng-PanGu is developed under the Pengcheng cloud brainⅡ.1.1 TB high-quality Chinese data from a wide range of domains to pre-train the model are collected.The training parallelism strategy is implemented based on all-scenarios artificial intelligence computing framework MindSpore Auto-parallel,which composes five parallelism dimensions to scale the training task to 4096 processors efficiently.The experimental results demonstrate the superior capabilities of Pengcheng-PanGu in performing various natural lan⁃guage understanding and natural language generation tasks under few-shot or zero-shot settings.On this basis,Pengcheng-PanGu model has also achieved better application results in large model compression,prompt fine-tuning,multi-task,and continuous learning.

作者曾炜苏腾王晖田永鸿高文 ZENG Wei;SU Teng;WANG Hui;TIAN Yonghong;GAO Wen(Pengcheng Laboratory,Shenzhen 518055,China;Peking University,Beijing 100871,China;Huawei Technologies Co.,Ltd.,Hangzhou 310052,China)

机构地区鹏城实验室北京大学华为技术有限公司鹏城实验室网络智能部开源所鹏城实验室网络智能部

出处《中兴通讯技术》 2022年第2期33-43,共11页 ZTE Technology Journal

基金广东省重点领域研发计划“新一代人工智能”重大专项(2021B0101400002)。

关键词大规模预训练语言模型鹏城云脑Ⅱ 大规模分布式训练中文理解与生成提示微调学习 large-scale pre-trained language models Pengcheng cloud brainⅡ large-scale distributed training Chinese language under⁃standing and generation tip fine-tuning learning

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献30

1夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：11
2贾积有,陈霏,陈宇灏,丁竹卉.从聊天机器人到单词测试和课程管理——“希赛可”智能英语教学系统的进一步研发[J].现代教育技术,2011,21(6):86-90. 被引量：17
3张春芳,刘雪立.国外结构式摘要研究回顾--以James Hartley的研究为例[J].中国科技期刊研究,2012,23(1):56-61. 被引量：11
4康勤,孙萍.基于语料库的科研论文英文摘要的体裁分析[J].外语教学,2012,33(5):28-31. 被引量：59
5原俊凤,钱亦兵,彭永生,张海燕.以外籍副主编对英文摘要的编校分析英文摘要中的常见错误[J].农业图书情报学刊,2014,26(2):154-157. 被引量：3
6黄河清,韩健,张鲸惊,韩凤,蒋奎,单爱莲.中外科技期刊英文摘要文体格式的变化及建议[J].中国科技期刊研究,2015,26(2):143-151. 被引量：29
7刘伟.论科技期刊英文摘要的审译--以《海洋技术学报》为例[J].编辑学报,2016,28(4):330-333. 被引量：10
8柯文辉,林海清,黄爱萍,黄金泽,翁志辉.中文学术期刊英文摘要审修的编辑部工作流程[J].编辑学报,2016,28(5):443-444. 被引量：2
9陈凯泉,沙俊宏,何瑶,王晓芳.人工智能2.0重塑学习的技术路径与实践探索——兼论智能教学系统的功能升级[J].远程教育杂志,2017,35(5):40-53. 被引量：108
10赵永青,梁晓磊,高君,项兰.中外学术期刊实证类论文英文摘要推销型式对比研究[J].外语与外语教学,2018(1):61-71. 被引量：18

引证文献4

1史童月,王中卿.基于Transformer的自然语言处理预训练语言模型概述[J].信息与电脑,2022,34(10):52-56. 被引量：5
2陈凯泉,胡晓松,韩小利,牛翠琰,韩羽,王宪廷,张凯,吕伟刚.对话式通用人工智能教育应用的机理、场景、挑战与对策[J].远程教育杂志,2023,41(3):21-41. 被引量：4
3陈星潼,赵爱清.人工智能大模型对学术期刊编辑工作的影响探究——基于英文摘要翻译的实证研究[J].新闻研究导刊,2024,15(3):1-4. 被引量：1
4田海东,张明政,常锐,童贤慧.大模型训练技术综述[J].中兴通讯技术,2024,30(2):21-28.

二级引证文献10

1欧阳春雪.基于深度学习的多模态AIGC动画探究[J].现代电影技术,2023(1):41-47. 被引量：6
2沈书生,祝智庭.ChatGPT类产品:内在机制及其对学习评价的影响[J].中国远程教育,2023(4):8-15. 被引量：65
3郭雅鑫,张春燕.基于N-Gram的改进预训练文本编码器[J].中国汽车,2023(4):30-34.
4徐卫克.基于人工智能的自然语言处理系统分析[J].网络安全技术与应用,2023(7):49-51. 被引量：1
5徐付环,王文荣.ChatGPT在商业与教育领域上应用的可行性分析[J].互联网天地,2023(7):37-45.
6曾文龙,刘丹,张超.基于大模型的智能抄清:事件要点抽取与报告生成[J].网络安全与数据治理,2023,42(12):20-26. 被引量：1
7杨俊锋,沈中奇,陈睿宁.生成式人工智能的教育应用及伦理风险探析[J].湖州师范学院学报,2023,45(12):1-12. 被引量：3
8余绪鹏,刘念.生成式人工智能赋能高校思政课的价值、隐忧与优化进路[J].河南科技学院学报（社会科学版）,2024,44(2):52-60.
9卢艳.智能个税知识问答机器人赋能智能教育的应用研究[J].中国新通信,2023,25(23):82-84.
10胡越.AIGC时代下期刊编辑工作中的变与不变[J].重庆行政,2024,25(2):95-97.

1梁瑞华.CLASS评估系统下幼儿科学活动师幼互动质量提升策略[J].师道（教研）,2021(6):53-54.
2张华,谢宇航,曹江.基于并行支持向量机的两相流流型识别研究[J].通讯世界,2019,26(11):30-31. 被引量：1
3剑枫寒.“盘古号”的陨落[J].少年博览（初中版）,2022(4):54-57.
4汤组.汤旺县强化党建引领合力,助力乡村振兴发展[J].党的生活（黑龙江）,2022(3):60-60.
5吴小艳.“双减”背景下小学语文有效阅读教学策略的研究[J].中学生作文指导,2022(7):106-109. 被引量：1
6周陈龙,盛誉,路昕.基于试验数据的复杂系统性能代理模型及应用[J].科技通报,2022,38(3):7-13.
7赵稀方.论20世纪六七十年代香港地区的诗歌转折[J].文学评论,2022(2):78-86.
8朱传庆.峨眉山玄武岩——中国唯一的大火成岩省[J].地球,2022(2):21-25.
9李继清,孙凤玲,王爽,田雨.多源径流预报误差混合分布模型及应用[J].中国农村水利水电,2022(5):125-132. 被引量：1
10易侃,钟元芾,曾逸凡,张英朝,周光霞,阳东升.联合全域指挥与控制机理模型及应用分析[J].指挥与控制学报,2022,8(1):1-13. 被引量：5

中兴通讯技术

2022年第2期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部