期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
大语言模型评估技术研究进展 被引量:1
1
作者 赵睿卓 曲紫畅 +4 位作者 陈国英 王坤龙 徐哲炜 柯文俊 汪鹏 《数据采集与处理》 CSCD 北大核心 2024年第3期502-523,共22页
随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通... 随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通过分析传统软件、深度学习模型与大模型的共性与差异,借鉴传统软件测评和深度学习模型评估的指标体系,从大语言模型功能评估、性能评估、对齐评估和安全性评估几个维度对现有工作进行总结,并对大模型的评测基准进行介绍。最后依据现有研究与潜在的机遇和挑战,对大语言模型评估技术方向和发展前景进行了展望。 展开更多
关键词 大语言模型 功能评估 性能评估 对齐评估 安全性评估
下载PDF
基于树形语义框架的神经语义解析方法 被引量:4
2
作者 赵睿卓 高金华 +3 位作者 孙晓茜 徐力 沈华伟 程学旗 《中文信息学报》 CSCD 北大核心 2021年第1期9-16,共8页
语义解析的目标是将自然语言表达映射为机器可理解的逻辑表达,该任务的关键挑战在于难以刻画自然语言中蕴含的组合语义。目前,结合深度神经网络模型的语义解析方法已经成为该领域的主流方法,该类方法通常采用编码器—解码器框架,通过设... 语义解析的目标是将自然语言表达映射为机器可理解的逻辑表达,该任务的关键挑战在于难以刻画自然语言中蕴含的组合语义。目前,结合深度神经网络模型的语义解析方法已经成为该领域的主流方法,该类方法通常采用编码器—解码器框架,通过设计树形结构的解码器或者在解码器中添加语法限制,从语法层面上提升逻辑表达生成的准确率。与现有的神经语义解析方法不同,该文从语义建模角度出发,以语义框架作为中间形式,通过自顶向下的生成方式,显式地建模自然语言表达中蕴含的层次化语义结构。模型先根据自然语言输入,自顶向下地生成语义框架,再将语义框架表示融入到逻辑表达的生成过程中。三个数据集上的实验结果表明,该文提出的模型能更准确地生成语义框架,并且在语义解析任务中取得更好的效果。 展开更多
关键词 神经语义解析 层次化语义结构 树形语义框架
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部