ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路被引量：68

The Inspiration Brought by ChatGPT to LLM and the New Development Ideas of Multi-modal Large Model

导出

摘要【目的】剖析ChatGPT的基础技术原理,探讨其对大语言模型发展产生的影响,以及对多模态大模型发展思路产生的影响。【方法】通过分析ChatGPT的发展过程和技术原理,探讨指令微调、数据采集与标注、基于人类反馈的强化学习等模型构建方法对大语言模型产生的影响。分析当前多模态大模型构建过程中遇到的关键科学问题,并借鉴ChatGPT的技术方案,探讨多模态大模型未来的发展发展思路。【结论】ChatGPT为预训练大模型向下游任务的发展提供了良好的参考技术路径,未来的多模态大模型构建以及下游任务实现过程中,可以充分利用高质量的指令微调等技术来显著提升多模态大模型的下游任务性能。 [Objective]This paper analyzes the basic technical principles of ChatGPT,and discusses its influence on the development of large language model and the development of multi-modal pretrained model.[Methods]By analyzing the development process and technical principles of ChatGPT,this paper discusses the influence of model building methods such as instruct fine-tuning,data acquisition and annotation,and reinforcement learning based on human feedback on the large language model.At the same time,this paper analyzes several key scientific problems encountered in the construction of multi-modal model,and discusses the future development of multi-modal pretrained model by referring to ChatGPT’s technical scheme.[Conclusions]The success of ChatGPT provides a good reference technology path for the development of pretrained fundamental model to downstream tasks.In the future construction of multi-modal large model and the realization of downstream tasks,we can make full use of high-quality instruction fine-tuning and other technologies to significantly improve the performance of downstream tasks.

作者赵朝阳朱贵波王金桥 Zhao Chaoyang;Zhu Guibo;Wang Jinqiao(Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China)

机构地区中国科学院自动化研究所

出处《数据分析与知识发现》 CSCD 北大核心 2023年第3期26-35,共10页 Data Analysis and Knowledge Discovery

基金国家自然科学基金项目(项目编号:61976210,62176254)的研究成果之一。

关键词语言大模型预训练大模型多模态预训练模型 ChatGPT Large Language Model(LLM) Pretrained Foundation Model Multi-modal Pretrained Model ChatGPT

分类号 TP393 [自动化与计算机技术—计算机应用技术] G250 [文化科学—图书馆学]

引文网络
相关文献

同被引文献845

1孙晋.数字平台的反垄断监管[J].中国社会科学,2021(5):101-127. 被引量：417
2王薇,刘莉.问题解决的教育实践特征:基于心理学到教育学的转换[J].教育学术月刊,2021(6):90-96. 被引量：4
3李冬雪,朱冀涛,刘岩,刘刚,井永腾.新一代基建工地安全智能管控平台设计与规划[J].中国测试,2022,48(S02):133-138. 被引量：3
4郝福锦.人工智能科技与毕业生高质量就业[J].山西财经大学学报,2023,45(S02):86-88. 被引量：3
5肖艺能.数字经济时代人工智能的伦理风险及治理[J].山西财经大学学报,2023,45(S02):77-79. 被引量：1
6梅立润.人工智能如何向善:基于技术威胁与国家责任的思考[J].社会主义研究,2022(6):105-113. 被引量：5
7查云飞.算法的行政法属性及其规范[J].法制与社会发展,2023,29(6):168-185. 被引量：13
8蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：59
9周光权.侵犯公民个人信息罪的行为对象[J].清华法学,2021,15(3):25-40. 被引量：120
10何明.盲人摸象、削足适履与刻舟求剑:制约知识生产的认识论根源[J].开放时代,2021(1):88-90. 被引量：3

引证文献68

1张跃胜,金文俊.ChatGPT的关键技术、应用场景及未来展望[J].信息技术与管理应用,2023(5):64-74. 被引量：1
2李海原.人工智能大语言模型对高校会计专业人才培养的冲击与启示[J].科教导刊,2023(15):51-53. 被引量：2
3李颖婷.生成式人工智能给图书馆带来的机遇、挑战及应对策略[J].图书与情报,2023(2):42-48. 被引量：25
4赵红勋,班苗苗.ChatGPT的传播特征及伦理困境[J].视听界,2023(3):34-38. 被引量：3
5严驰.GPT4发展中的若干问题及其规制方案[J].信息安全研究,2023,9(6):510-517. 被引量：12
6郑永和,周丹华,张永和,田雪葳,王晶莹,郑一.计算教育学视域下的ChatGPT:内涵、主题、反思与挑战[J].华东师范大学学报（教育科学版）,2023,41(7):91-102. 被引量：20
7邱冬阳,蓝宇.ChatGPT给金融行业带来的机遇、挑战及问题[J].西南金融,2023(6):18-29. 被引量：23
8匡文波,王天娇.新一代人工智能ChatGPT传播特点研究[J].重庆理工大学学报（社会科学）,2023,37(6):8-16. 被引量：10
9李翔,旷银.ChatGPT类人工智能及其生成物的刑法思考[J].贵州师范大学学报（社会科学版）,2023(4):78-91. 被引量：16
10孟庆振,王少峰,温玄林,张炜琛,周红,陈松.ChatGPT在犯罪中的潜在应用分析及执法应对策略初探[J].刑事技术,2023,48(4):331-339. 被引量：6

二级引证文献223

1杨杰.ChatGPT赋能公路检测行业带来的机遇、挑战及展望[J].交通与运输,2024,40(S01):252-254.
2邓双霜.学术期刊高质量发展的价值导向、基本逻辑与实践路径[J].社会科学家,2024(4):192-196.
3田峰.论算法的私法调整进路[J].法制与社会发展,2024,30(5):188-204.
4林健飞.生成式人工智能技术应用于公安数字化建设的风险及其控制[J].四川警察学院学报,2023,35(4):85-92.
5赵建辉.企业数据资产审计:逻辑机理、现实挑战与实践路径[J].中国注册会计师,2024(8):59-65.
6许世杰.基于大语言模型能力匹配与进度管理的项目管理应用实践[J].仪器仪表用户,2024,31(5):71-73.
7罗飞,崔滨,辛小江,郭云鹏.大语言模型嵌入图书馆知识服务的风险范式与管控策略[J].图书与情报,2023(3):99-106. 被引量：9
8赵磊磊,闫志明.生成式人工智能教育应用的生态伦理与风险纾解[J].贵州师范大学学报（社会科学版）,2023(5):151-160. 被引量：15
9刘昭,王波.ChatGPT对数字金融的影响及其法律规制[J].海南金融,2023(9):41-53. 被引量：2
10翟雪松,楚肖燕,焦丽珍,童兆平,李艳.基于“生成式人工智能+元宇宙”的人机协同学习模式研究[J].开放教育研究,2023,29(5):26-36. 被引量：19

数据分析与知识发现

2023年第3期

浏览历史

内容加载中请稍等...

ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路被引量：68

同被引文献845

引证文献68

二级引证文献223

相关作者

相关机构

相关主题

浏览历史

ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路 被引量：68

同被引文献845

引证文献68

二级引证文献223

相关作者

相关机构

相关主题

浏览历史

ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路被引量：68