期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

大语言模型发展综述

Overview of the Development of Large Language Models

下载PDF

导出

摘要在分析大语言模型特征的基础上,阐述了大语言模型的技术进展与应用领域,认为大语言模型在模型设计、数据结构、预训练和微调方面进步显著,展示了卓越的语言生成、知识运用和复杂逻辑推理等特性,这些特性使其在构建专业模型、提升知识整合和梳理水平、数据挖掘和分析、智能设计与操作领域展现出极大的应用潜力和实用价值。然而,目前模型在可解释性、安全性、真实性及训练成本等方面仍存在诸多挑战。随着算法和结构的优化,模型将实现更高效、更精确的训练,文本学习与生成性能将进一步增强,应用范围将拓展到多模态领域,实现多种类型数据的综合理解与处理。 This paper analyzed the characteristics of large language models and elucidated their technological advancements and application domains.It was posited that large language models have made significant strides in model design,data architecture,pre-training and fine-tuning,exhibiting exceptional capabilities in language generation,knowledge application,and complex logical reasoning.These attributes enabled them to demonstrate immense potential and practical value in constructing specialized models,enhancing knowledge integration and parsing capabilities,data mining and analysis,as well as intelligent design and operation.Nonetheless,current models still faced numerous challenges regarding explainability,security,authenticity,and training costs.As algorithms and structures have optimized,these models were anticipated to achieve more efficient and precise training,further enhancing text learning and generation capabilities.Their application scope was set to expand into multi-modal realms,facilitating comprehensive understanding and processing of diverse data types.

作者闫啸彤唐晓彬沈童雷诺 YAN Xiao-tong;TANG Xiao-bin;SHEN Tong;LEI Nuo(School of Statistics,University of International Business and Economics,Beijing 100029;Data Science Department,New York University,NY 10011,USA)

机构地区对外经济贸易大学统计学院美国纽约大学数据科学系

出处《统计学报》 2024年第4期13-18,共6页 Journal of Statistics

基金国家社会科学基金重点项目(21ATJ001)。

关键词大语言模型语言生成知识运用复杂逻辑推理数据挖掘 large language models language generation knowledge application complex logical reasoning data mining

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1肖大军,张逸茹,徐遐龄,刘涛,李翔.基于Bert的电网故障处置预案信息抽取研究与实现[J].电力信息与通信技术,2023,21(3):26-32. 被引量：2
2尹帮文,孙伟平.ChatGPT冲击波:类人恐惧与异化危机[J].理论月刊,2023(6):5-13. 被引量：12
3谢天,邱林,李雨曈,罗殷,刘盼.大模型时代的社会科学,何去何从?[J].图书情报知识,2023,40(6):6-9. 被引量：8
4潘正源,李樵,李月琳,孙劲松.智能信息检索研究范式的演进、反思与前瞻[J].图书馆论坛,2024,44(1):137-150. 被引量：2
5赵月,何锦雯,朱申辰,李聪仪,张英杰,陈恺.大语言模型安全现状与挑战[J].计算机科学,2024,51(1):68-71. 被引量：12
6肖艺能.数字经济时代人工智能的伦理风险及治理[J].山西财经大学学报,2023,45(S02):77-79. 被引量：1
7郝福锦.人工智能科技与毕业生高质量就业[J].山西财经大学学报,2023,45(S02):86-88. 被引量：2
8政光景,吕鹏.生成式人工智能与哲学社会科学新范式的涌现[J].江海学刊,2023(4):132-142. 被引量：10
9赵朝阳,朱贵波,王金桥.ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路[J].数据分析与知识发现,2023,7(3):26-35. 被引量：65
10刘倩倩,刘圣婴,刘炜.图书情报领域大模型的应用模式和数据治理[J].图书馆杂志,2023,42(12):22-35. 被引量：15

二级参考文献60

1马国洋.论刑事诉讼中人工智能证据的审查[J].中国刑事法杂志,2021(5):158-176. 被引量：22
2陈光中,周国均.论刑事诉讼中的证明对象[J].政法论坛,1983,1(3):60-66. 被引量：9
3叶鹰.智能信息分析的理论基础与技术模型[J].情报学报,2005,24(2):233-236. 被引量：16
4叶鹰.智能信息处理的基础理论探讨[J].情报科学,2008,26(9):1281-1285. 被引量：9
5鲁杰,曹福来.论证明对象的范围是诉辩双方的诉讼主张[J].政治与法律,2009(1):128-132. 被引量：4
6闵春雷,刘铭.证明对象研究走向评析[J].吉林大学社会科学学报,2009,49(2):47-51. 被引量：5
7刘栋,陈颖,沈沉,孙英云,李锐.电力应急预案数字化方法研究[J].电力系统自动化,2009,33(21):48-52. 被引量：15
8晁进,刘文颖.基于多智能体和专家系统的电网智能报警系统研究[J].现代电力,2010,27(5):1-5. 被引量：10
9郑杭生.学术话语权与中国社会学发展[J].中国社会科学,2011(2):27-34. 被引量：172
10张文鹏,王兴.基于中文关键词提取的预案智能匹配方案[J].科学技术与工程,2012,20(21):5192-5197. 被引量：3

共引文献147

1张跃胜,金文俊.ChatGPT的关键技术、应用场景及未来展望[J].信息技术与管理应用,2023(5):64-74. 被引量：1
2李海原.人工智能大语言模型对高校会计专业人才培养的冲击与启示[J].科教导刊,2023(15):51-53. 被引量：2
3任紫君,李渊.人工智能时代高校毕业生就业能力提升策略研究[J].创新创业理论研究与实践,2024(12):8-10.
4张诗濠,李赟,李韬.ChatGPT类生成式人工智能的风险及其治理[J].贵州社会科学,2023(11):138-143. 被引量：2
5李颖婷.生成式人工智能给图书馆带来的机遇、挑战及应对策略[J].图书与情报,2023(2):42-48. 被引量：25
6赵红勋,班苗苗.ChatGPT的传播特征及伦理困境[J].视听界,2023(3):34-38. 被引量：3
7严驰.GPT4发展中的若干问题及其规制方案[J].信息安全研究,2023,9(6):510-517. 被引量：10
8郑永和,周丹华,张永和,田雪葳,王晶莹,郑一.计算教育学视域下的ChatGPT:内涵、主题、反思与挑战[J].华东师范大学学报（教育科学版）,2023,41(7):91-102. 被引量：17
9邱冬阳,蓝宇.ChatGPT给金融行业带来的机遇、挑战及问题[J].西南金融,2023(6):18-29. 被引量：22
10匡文波,王天娇.新一代人工智能ChatGPT传播特点研究[J].重庆理工大学学报（社会科学）,2023,37(6):8-16. 被引量：10

1曾明,张亚华.生成式人工智能在行政执法领域的应用实践与探索[J].中国市场监管研究,2024(6):28-31.
2王雪莲,孙相宇,李孝朋.矿山生态修复技术的研究进展与应用[J].世界有色金属,2024(9):130-132.
3肖贵清.高校思政课如何讲好新时代党的创新理论[J].马克思主义与现实,2024(4):141-148.
4王旭旭.关联理论视角下单篇文本学习系列任务的构建[J].七彩语文,2024(28):5-8.
5关金子,郭昭军.名词“狗”与量词选择之影响因素的量化研究[J].南开语言学刊,2024(1):123-130.
6路美丽.太阳能光伏支撑结构的研究进展与应用[J].信息产业报道,2020(7):0042-0044.
7马吉军.人工智能在市场监管政务咨询服务工作中的应用研究——基于多模态大模型的即时交互功能[J].中国市场监管研究,2024(6):35-38.
8陈亚盛,蒋礼蔚,单敏,庄平.审计大模型的构建及应用研究——以员工违规经商办企业专项审计为例[J].审计研究,2024(4):139-149.
9王显赫,谢兴铖,杨剑,林中坤,史植广,刘皓,曹瑞军.TiB_(2)陶瓷研究进展与应用[J].粉末冶金技术,2024,42(4):427-436.
10苏简瑜,全汉锋,李达谅.生物化学和分子生物学技术在大黄鱼鱼病诊疗中的研究进展[J].福建畜牧兽医,2024,46(4):55-59.

统计学报

2024年第4期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部