大语言模型微调技术的研究综述

Comprehensive Review of Large Language Model Fine-Tuning

下载PDF

导出

摘要大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。 The rise of large-scale language models signifies a new milestone in the field of deep learning,with fine-tuning techniques playing a crucial role in optimizing model performance.This paper provides a comprehensive overview of fine tuning techniques for large-scale language models.It reviews the development stages of language models,including statis-tical language models,neural network language models,pre-trained language models,and large language models.The basic concepts of fine-tuning are explored,covering classic fine-tuning,efficient parameter fine-tuning,prompt tuning,and reinforcement learning fine-tuning.The paper delves into the principles and development of each fine-tuning tech-nique,offering a comparative analysis across these four major categories.In conclusion,the paper summarizes the current state of research on fine-tuning techniques and underscores the potential research value in this domain,providing insights into future directions of development.

作者张钦彤王昱超王鹤羲王俊鑫陈海 ZHANG Qintong;WANG Yuchao;WANG Hexi;WANG Junxin;CHEN Hai(School of Arts and Sciences,Beijing Normal University at Zhuhai,Zhuhai,Guangdong 519087,China)

机构地区北京师范大学珠海校区文理学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第17期17-33,共17页 Computer Engineering and Applications

基金广东省教育科学规划课题(2022GXJK47) 认知智能全国重点实验室智能教育开放课题(iED2023-005)。

关键词大语言模型微调方法预训练模型自然语言处理 large language model fine-tuning methods pre-trained models natural language processing

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1携手同行比亚迪第500万辆新能源汽车下线[J].汽车之友,2023(9):88-91.
2潘晓辉.物联网中智能传感器的实践应用[J].光源与照明,2023(10):154-156. 被引量：1
3比亚迪达成第500万辆新能源汽车下线[J].车主之友,2023(5):113-113.
4比亚迪第500万辆新能源汽车下线全球首家达成这一里程碑[J].磁性元件与电源,2023(9):94-94.
5温昕.20年王传福证明了一件事[J].智能网联汽车,2023(5):12-14.
6NavVis推出新一代可穿戴式移动扫描系统VLX3[J].机械制造,2023,61(7):61-61.
7第500万辆新能源汽车下线比亚迪携手同行打造世界级汽车品牌[J].产品可靠性报告,2023(8):33-33.
8Chaos.TUDOR 开启制表新时代[J].钟表,2023(4):80-83.
9王昀,胡珉,塔娜,孙海涛,郭毅峰,周武爱,郭昱,张皖哲,冯建华.大语言模型及其在政务领域的应用[J].清华大学学报（自然科学版）,2024,64(4):649-658. 被引量：3
10宗学军,隋一凡,王国刚,宁博伟,何戡,连莲,孙逸菲.基于生成对抗网络的工控协议模糊测试研究[J].网络安全与数据治理,2024,43(7):13-20.

计算机工程与应用

2024年第17期

浏览历史

内容加载中请稍等...

大语言模型微调技术的研究综述

相关作者

相关机构

相关主题

浏览历史