期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大语言模型评估技术研究进展
被引量:
1
1
作者
赵睿卓
曲紫畅
+4 位作者
陈国英
王坤龙
徐哲炜
柯文俊
汪鹏
《数据采集与处理》
CSCD
北大核心
2024年第3期502-523,共22页
随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通...
随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通过分析传统软件、深度学习模型与大模型的共性与差异,借鉴传统软件测评和深度学习模型评估的指标体系,从大语言模型功能评估、性能评估、对齐评估和安全性评估几个维度对现有工作进行总结,并对大模型的评测基准进行介绍。最后依据现有研究与潜在的机遇和挑战,对大语言模型评估技术方向和发展前景进行了展望。
展开更多
关键词
大语言模型
功能评估
性能评估
对齐评估
安全性评估
下载PDF
职称材料
基于树形语义框架的神经语义解析方法
被引量:
4
2
作者
赵睿卓
高金华
+3 位作者
孙晓茜
徐力
沈华伟
程学旗
《中文信息学报》
CSCD
北大核心
2021年第1期9-16,共8页
语义解析的目标是将自然语言表达映射为机器可理解的逻辑表达,该任务的关键挑战在于难以刻画自然语言中蕴含的组合语义。目前,结合深度神经网络模型的语义解析方法已经成为该领域的主流方法,该类方法通常采用编码器—解码器框架,通过设...
语义解析的目标是将自然语言表达映射为机器可理解的逻辑表达,该任务的关键挑战在于难以刻画自然语言中蕴含的组合语义。目前,结合深度神经网络模型的语义解析方法已经成为该领域的主流方法,该类方法通常采用编码器—解码器框架,通过设计树形结构的解码器或者在解码器中添加语法限制,从语法层面上提升逻辑表达生成的准确率。与现有的神经语义解析方法不同,该文从语义建模角度出发,以语义框架作为中间形式,通过自顶向下的生成方式,显式地建模自然语言表达中蕴含的层次化语义结构。模型先根据自然语言输入,自顶向下地生成语义框架,再将语义框架表示融入到逻辑表达的生成过程中。三个数据集上的实验结果表明,该文提出的模型能更准确地生成语义框架,并且在语义解析任务中取得更好的效果。
展开更多
关键词
神经语义解析
层次化语义结构
树形语义框架
下载PDF
职称材料
题名
大语言模型评估技术研究进展
被引量:
1
1
作者
赵睿卓
曲紫畅
陈国英
王坤龙
徐哲炜
柯文俊
汪鹏
机构
北京计算机技术及应用研究所
东南大学计算机科学与工程学院
出处
《数据采集与处理》
CSCD
北大核心
2024年第3期502-523,共22页
基金
国家自然科学基金(62376057)
东南大学启动研究基金(RF1028623234)。
文摘
随着大语言模型的广泛应用,针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外,其存在的一些潜在风险更需要评估,例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通过分析传统软件、深度学习模型与大模型的共性与差异,借鉴传统软件测评和深度学习模型评估的指标体系,从大语言模型功能评估、性能评估、对齐评估和安全性评估几个维度对现有工作进行总结,并对大模型的评测基准进行介绍。最后依据现有研究与潜在的机遇和挑战,对大语言模型评估技术方向和发展前景进行了展望。
关键词
大语言模型
功能评估
性能评估
对齐评估
安全性评估
Keywords
large language models
functional evaluation
performance evaluation
alignment evaluation
security evaluation
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于树形语义框架的神经语义解析方法
被引量:
4
2
作者
赵睿卓
高金华
孙晓茜
徐力
沈华伟
程学旗
机构
中国科学院计算技术研究所网络数据科学与技术重点实验室
中国科学院大学计算机与控制学院
出处
《中文信息学报》
CSCD
北大核心
2021年第1期9-16,共8页
基金
国家自然科学基金(91746301,61802370,61425016,61902380)。
文摘
语义解析的目标是将自然语言表达映射为机器可理解的逻辑表达,该任务的关键挑战在于难以刻画自然语言中蕴含的组合语义。目前,结合深度神经网络模型的语义解析方法已经成为该领域的主流方法,该类方法通常采用编码器—解码器框架,通过设计树形结构的解码器或者在解码器中添加语法限制,从语法层面上提升逻辑表达生成的准确率。与现有的神经语义解析方法不同,该文从语义建模角度出发,以语义框架作为中间形式,通过自顶向下的生成方式,显式地建模自然语言表达中蕴含的层次化语义结构。模型先根据自然语言输入,自顶向下地生成语义框架,再将语义框架表示融入到逻辑表达的生成过程中。三个数据集上的实验结果表明,该文提出的模型能更准确地生成语义框架,并且在语义解析任务中取得更好的效果。
关键词
神经语义解析
层次化语义结构
树形语义框架
Keywords
neural semantic parsing
compositional semantics
tree-structured sketch
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
大语言模型评估技术研究进展
赵睿卓
曲紫畅
陈国英
王坤龙
徐哲炜
柯文俊
汪鹏
《数据采集与处理》
CSCD
北大核心
2024
1
下载PDF
职称材料
2
基于树形语义框架的神经语义解析方法
赵睿卓
高金华
孙晓茜
徐力
沈华伟
程学旗
《中文信息学报》
CSCD
北大核心
2021
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部