大语言模型评估技术研究进展

Research Progress in Evaluation Techniques for Large Language Models

下载PDF

导出

摘要随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通过分析传统软件、深度学习模型与大模型的共性与差异,借鉴传统软件测评和深度学习模型评估的指标体系,从大语言模型功能评估、性能评估、对齐评估和安全性评估几个维度对现有工作进行总结,并对大模型的评测基准进行介绍。最后依据现有研究与潜在的机遇和挑战,对大语言模型评估技术方向和发展前景进行了展望。 With the widespread application of large language models,the evaluation of large language models has become crucial.In addition to the performance of large language models in downstream tasks,some potential risks should also be evaluated,such as the possibility that large language models may violate human values and be induced by malicious input to trigger security issues.This paper analyzes the commonalities and differences between traditional software,deep learning systems,and large model systems.It summarizes the existing work from the dimensions of functional evaluation,performance evaluation,alignment evaluation,and security evaluation of large language models,and introduces the evaluation criteria for large models.Finally,based on existing research and potential opportunities and challenges,the direction and development prospects of large language models evaluation technology are discussed.

作者赵睿卓曲紫畅陈国英王坤龙徐哲炜柯文俊汪鹏 ZHAO Ruizhuo;QU Zichang;CHEN Guoying;WANG Kunlong;XU Zhewei;KE Wenjun;WANG Peng(Beijing Computer Technology and Applied Research Institute,Beijing 100854,China;School of Computer Science and Engineering,Southeast University,Nanjing 211189,China)

机构地区北京计算机技术及应用研究所东南大学计算机科学与工程学院

出处《数据采集与处理》 CSCD 北大核心 2024年第3期502-523,共22页 Journal of Data Acquisition and Processing

基金国家自然科学基金(62376057) 东南大学启动研究基金(RF1028623234)。

关键词大语言模型功能评估性能评估对齐评估安全性评估 large language models functional evaluation performance evaluation alignment evaluation security evaluation

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1邓梓焌,何相腾,彭宇新.文本到视频生成:研究现状、进展和挑战[J].电子与信息学报,2024,46(5):1632-1644.
2王嵩立,荆一楠,何震瀛,张凯,王晓阳.支持混合事务和分析处理的数据库管理系统综述[J].软件学报,2024,35(1):405-429.
3化睿云.讲好中国式现代化的科技文化故事:以“秦创原”为例的对外话语体系研究[J].科技传播,2024,16(6):143-146.
4滕梓洁.JJF 1521-2023《燃油加油机型式评价大纲(试行)》解读[J].中国计量,2024(5):85-88.
5刘帅,乔颖,罗雄飞,赵怡婧,王宏安.时序数据库关键技术综述[J].计算机研究与发展,2024,61(3):614-638. 被引量：2
6罗文,王厚峰.大语言模型评测综述[J].中文信息学报,2024,38(1):1-23. 被引量：2
7冯尊磊,娄恒瑞,贝毅君,宋明黎.人脸视频伪造检测技术进展与趋势[J].人工智能,2024(2):63-69.
8任增元,沈玥彤.高等教育服务于人类命运共同体建设的逻辑、优势与使命[J].高等教育评论,2023,11(2):100-111.
9吕婷钰,李晓瑛,张颖,刘宇炀,杜晋华,李心怡,罗妍,唐小利,任慧玲,刘辉,尹浩.中文医学知识大模型问答语料数据集构建研究[J].医学信息学杂志,2024,45(5):20-25.
10阳振坤,杨传辉,韩富晟,王国平,杨志丰,成肖君.OceanBase分布式关系数据库架构与技术[J].计算机研究与发展,2024,61(3):540-554.

数据采集与处理

2024年第3期

浏览历史

内容加载中请稍等...

大语言模型评估技术研究进展

相关作者

相关机构

相关主题

浏览历史