期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大语言模型微调技术的研究综述
1
作者 张钦彤 王昱超 +2 位作者 王鹤羲 王俊鑫 陈海 《计算机工程与应用》 CSCD 北大核心 2024年第17期17-33,共17页
大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发... 大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。 展开更多
关键词 大语言模型 微调方法 预训练模型 自然语言处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部