期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
语义理解与常识推理的机器表现和人类基线之比较——怎样评估ChatGPT等大型语言模型的语言运用能力?
1
作者
袁毓林
《汉语学报》
北大核心
2024年第4期2-16,共15页
本文讨论怎样通过跟人类基线的比较,来合理地评估ChatGPT等现代大型语言模型的语言运用能力。首先,用代词指称歧义和否定辖域问题测试ChatGPT,展示语言大模型在语义理解和常识推理方面的优秀表现;接着简介维诺格拉德模式挑战及其升级版...
本文讨论怎样通过跟人类基线的比较,来合理地评估ChatGPT等现代大型语言模型的语言运用能力。首先,用代词指称歧义和否定辖域问题测试ChatGPT,展示语言大模型在语义理解和常识推理方面的优秀表现;接着简介维诺格拉德模式挑战及其升级版本WinoGrande数据集,还介绍了我们对于这种类型的测试题和机器表现的评估方式的改进方案(把仅触发词不同的“句对”扩展为锚定词也不同的“句偶”,把机器表现跟人类被试的表现进行比较);然后介绍我们怎样用“句对”和“句偶”测试ChatGPT和人类被试,并且把人类和机器的表现进行对比,从而得出语言大模型的语言运用能力接近人类的结论。
展开更多
关键词
语义理解/常识推理
ChatGPT/大型语言模型
维诺格拉德模式/句对与句偶
机器表现
/人类基线
下载PDF
职称材料
机器的意识
2
作者
陈昆良
《工业控制计算机》
2023年第12期54-55,共2页
机器的意识基于主张其存在性,但这种存在性与人类的存在性是不一样的,是只考虑广义科学的存在性,同时不考虑“人文”的必要的存在性。就是说,从机器意识的角度,除了要“理解”人类,其自身是对“人文”没有需求的。最终机器意识的建立,...
机器的意识基于主张其存在性,但这种存在性与人类的存在性是不一样的,是只考虑广义科学的存在性,同时不考虑“人文”的必要的存在性。就是说,从机器意识的角度,除了要“理解”人类,其自身是对“人文”没有需求的。最终机器意识的建立,还是基于:一、按照变化是有过程的,以能够表现现实为目标来追求细粒度;二、按照世界是熵增的,并以此细粒度来构建丰富的映射;三、按照变化是互相影响的,也可以学习此细粒度之间的相互影响,从而构建“可能”的结果。
展开更多
关键词
机器
意识的载体
机器
意识的
表现
机器
意识的形成
下载PDF
职称材料
中文空间语义理解评测数据集质量评估研究
3
作者
岳朋雪
王诚文
+2 位作者
孙春晖
詹卫东
穗志方
《语言文字应用》
北大核心
2023年第1期101-113,共13页
中文空间语义理解能力评测(Spa CE2021)可以看作类人机器语言能力评测的一项重要尝试,其通过空间方位义词语替换的办法生成大量富含空间义信息的语料,构建了中文空间语义理解评测数据集。本文从生成题目的原句情况、可替换词与替换词的...
中文空间语义理解能力评测(Spa CE2021)可以看作类人机器语言能力评测的一项重要尝试,其通过空间方位义词语替换的办法生成大量富含空间义信息的语料,构建了中文空间语义理解评测数据集。本文从生成题目的原句情况、可替换词与替换词的结构类型、测试集题目答案的正误分布及空间类型等四个方面分析了中文空间语义理解能力评测数据集的特点,进而通过人类被试和参赛系统的比较,详细分析了机器在不同类型空间词汇上的性能表现,总结了机器空间语义理解的一般规律,并从题目的无偏性和延续性两方面入手,为构建高质量中文评测数据集提出了具体建议。以上工作有助于提升空间语义评测数据集的质量,从而更好地提升相关评测任务的准确性和可靠性。
展开更多
关键词
中文空间语义理解
数据集
机器表现
NLP评测
下载PDF
职称材料
题名
语义理解与常识推理的机器表现和人类基线之比较——怎样评估ChatGPT等大型语言模型的语言运用能力?
1
作者
袁毓林
机构
澳门大学人文学院中国语言文学系
北京大学中文系、中国语言学研究中心
出处
《汉语学报》
北大核心
2024年第4期2-16,共15页
基金
澳门大学讲座教授研究与发展基金(编号:CPG2024-00005-FAH)
启动研究基金(编号:SRG2022-00011-FAH)的资助。
文摘
本文讨论怎样通过跟人类基线的比较,来合理地评估ChatGPT等现代大型语言模型的语言运用能力。首先,用代词指称歧义和否定辖域问题测试ChatGPT,展示语言大模型在语义理解和常识推理方面的优秀表现;接着简介维诺格拉德模式挑战及其升级版本WinoGrande数据集,还介绍了我们对于这种类型的测试题和机器表现的评估方式的改进方案(把仅触发词不同的“句对”扩展为锚定词也不同的“句偶”,把机器表现跟人类被试的表现进行比较);然后介绍我们怎样用“句对”和“句偶”测试ChatGPT和人类被试,并且把人类和机器的表现进行对比,从而得出语言大模型的语言运用能力接近人类的结论。
关键词
语义理解/常识推理
ChatGPT/大型语言模型
维诺格拉德模式/句对与句偶
机器表现
/人类基线
Keywords
semantic understanding/commonsense reasoning
ChatGPT/large language models
Winograd Schema/sentence pairs and sentence couples
machine performance/human baseline
分类号
G63 [文化科学—教育学]
下载PDF
职称材料
题名
机器的意识
2
作者
陈昆良
机构
云南烟叶复烤有限责任公司泸西复烤厂
出处
《工业控制计算机》
2023年第12期54-55,共2页
文摘
机器的意识基于主张其存在性,但这种存在性与人类的存在性是不一样的,是只考虑广义科学的存在性,同时不考虑“人文”的必要的存在性。就是说,从机器意识的角度,除了要“理解”人类,其自身是对“人文”没有需求的。最终机器意识的建立,还是基于:一、按照变化是有过程的,以能够表现现实为目标来追求细粒度;二、按照世界是熵增的,并以此细粒度来构建丰富的映射;三、按照变化是互相影响的,也可以学习此细粒度之间的相互影响,从而构建“可能”的结果。
关键词
机器
意识的载体
机器
意识的
表现
机器
意识的形成
Keywords
carrier of machine consciousness
expression of machine consciousness
formation of machine consciousness
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
N02 [自然科学总论—科学技术哲学]
下载PDF
职称材料
题名
中文空间语义理解评测数据集质量评估研究
3
作者
岳朋雪
王诚文
孙春晖
詹卫东
穗志方
机构
北京大学计算语言学教育部重点实验室
北京大学中国语言学研究中心/中文系
出处
《语言文字应用》
北大核心
2023年第1期101-113,共13页
基金
国家科技创新2030“新一代人工智能”重大项目(2020AAA0106701)的资助。
文摘
中文空间语义理解能力评测(Spa CE2021)可以看作类人机器语言能力评测的一项重要尝试,其通过空间方位义词语替换的办法生成大量富含空间义信息的语料,构建了中文空间语义理解评测数据集。本文从生成题目的原句情况、可替换词与替换词的结构类型、测试集题目答案的正误分布及空间类型等四个方面分析了中文空间语义理解能力评测数据集的特点,进而通过人类被试和参赛系统的比较,详细分析了机器在不同类型空间词汇上的性能表现,总结了机器空间语义理解的一般规律,并从题目的无偏性和延续性两方面入手,为构建高质量中文评测数据集提出了具体建议。以上工作有助于提升空间语义评测数据集的质量,从而更好地提升相关评测任务的准确性和可靠性。
关键词
中文空间语义理解
数据集
机器表现
NLP评测
Keywords
Chinese spatial semantic comprehension
data set
machine performance
NLP evaluation
分类号
H087 [语言文字—语言学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
语义理解与常识推理的机器表现和人类基线之比较——怎样评估ChatGPT等大型语言模型的语言运用能力?
袁毓林
《汉语学报》
北大核心
2024
0
下载PDF
职称材料
2
机器的意识
陈昆良
《工业控制计算机》
2023
0
下载PDF
职称材料
3
中文空间语义理解评测数据集质量评估研究
岳朋雪
王诚文
孙春晖
詹卫东
穗志方
《语言文字应用》
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部