大语言模型对齐研究综述

Survey on large language models alignment research

下载PDF

导出

摘要随着人工智能技术的飞速发展,大语言模型已在众多领域得到了广泛应用。然而,大语言模型可能会生成不准确、有误导性甚至有害的内容,这引发了人们对大语言模型可靠性的担忧,采用对齐技术来确保大语言模型的行为与人类价值观一致已经成为一个亟待解决的问题。对近年来大语言模型对齐技术的研究进展进行综述。介绍了常用的指令数据收集方法和人类偏好数据集,概述了监督调整和对齐调整的相关研究,讨论了模型评估常用的数据集和方法,总结并展望了未来的研究方向。 With the rapid development of artificial intelligence technology,large language models have been widely applied in numerous fields.However,the potential of large language models to generate inaccurate,misleading,or even harmful contents has raised concerns about their reliability.Adopting alignment techniques to ensure the behavior of large language models is consistent with human values has become an urgent issue to address.Recent research progress on alignment techniques for large language models were surveyed.Common methods for collecting instruction data and human preference datasets were introduced,research on supervised tuning and alignment adjustments was summarized,commonly used datasets and methods for model evaluation were discussed,and future research directions were concluded.

作者刘昆麟屈新纪谭芳康红辉赵少伟施嵘 LIU Kunlin;QU Xinji;TAN Fang;KANG Honghui;ZHAO Shaowei;SHI Rong(ZTE Corporation,Shenzhen 518057,China)

机构地区中兴通讯股份有限公司

出处《电信科学》北大核心 2024年第6期173-194,共22页 Telecommunications Science

关键词大语言模型对齐技术调整强化学习 large language model alignment technique tune reinforcement learning

分类号 TN92 [电子电信—通信与信息系统]

引文网络
相关文献

1黄峻,林飞,杨静,王兴霞,倪清桦,王雨桐,田永林,李娟娟,王飞跃.生成式AI的大模型提示工程:方法、现状与展望[J].智能科学与技术学报,2024,6(2):115-133. 被引量：1
2彭慧媛.行政处罚权下放乡镇街道的现实困境与应对[J].中南财经政法大学研究生论丛,2023(2):152-160.
3王一帆,姜翔巍.AI包浆:一种思辨性设计[J].中国艺术,2024(3):80-87.
4景毅.基于生涯意识唤醒的大学生职业生涯规划路径[J].人才资源开发,2022(3):68-70. 被引量：2
5彭兰.智能传播中的人类行动者[J].西北师大学报（社会科学版）,2024,61(4):25-35. 被引量：7
6陈冰.当AI沾染人类恶习之后……[J].新民周刊,2023(26):52-55.
7王增辉,王丽丽.使用Petri网进行Web系统异常行为识别[J].佳木斯大学学报（自然科学版）,2024,42(7):10-14.
8王振生.提高风电场运行效率的大数据评估方法及应用研究[J].产业科技创新,2024,6(3):87-89.
9苏宝,陆媛斌,刘曦瞳.大模型视域下研究生心理危机预警机制的构建与应用实践[J].教书育人（高教论坛）,2024(7):76-83.
10解江,潘汉源,蒋逸伦,杨祥,李漩,郭德龙,冯振宇.带剪切销抗爆容器定向泄压特性研究[J].爆炸与冲击,2024,44(7):137-154.

电信科学

2024年第6期

浏览历史

内容加载中请稍等...

大语言模型对齐研究综述

相关作者

相关机构

相关主题

浏览历史