期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据驱动方法的历史报纸词汇变化研究
1
作者
西蒙·恒晨
鲁本·罗斯
+2 位作者
亚尼·马尔亚宁
米科·托洛宁
方华康(译)
《数字人文研究》
2022年第4期74-92,共19页
“民族”(nation)和“民族性”(nationhood)属于思想史领域最常研究的概念,而“民族”一词及其历史用法又十分模糊。文章旨在开发一种利用依存分析和神经词嵌入的数据驱动方法,以澄清这一概念的演变过程。为此提出以下两个步骤。首先,...
“民族”(nation)和“民族性”(nationhood)属于思想史领域最常研究的概念,而“民族”一词及其历史用法又十分模糊。文章旨在开发一种利用依存分析和神经词嵌入的数据驱动方法,以澄清这一概念的演变过程。为此提出以下两个步骤。首先,使用语言处理,创建一个与“民族”主题相关的大型单词集合。其次,训练历时词嵌入,并使用它们来量化这些词之间语义相似性的强度,从而创建有意义的聚类,然后将之历时排列。为了说明该方法在跨语言、多时间段及大型数据集研究上的稳健性,将其应用于荷兰语、瑞典语、芬兰语和英语共五份全套历史报纸档案集合。迄今为止,还没有如此大规模的比较研究——以数据驱动方法掌握多达四种不同语言的长期发展。文章所描述的方法还有一个特殊优势:通过设计,该方法可扩展应用至其他问题,而不仅限于对“民族性”的研究,并且可在不同语境中重复使用。
展开更多
关键词
数字人文
数据驱动
历史报纸
词汇变化
原文传递
题名
基于数据驱动方法的历史报纸词汇变化研究
1
作者
西蒙·恒晨
鲁本·罗斯
亚尼·马尔亚宁
米科·托洛宁
方华康(译)
机构
瑞典哥德堡大学瑞典语系
卢森堡大学当代与数字历史研究中心
芬兰赫尔辛基大学数字人文系
上海师范大学人文学院
出处
《数字人文研究》
2022年第4期74-92,共19页
基金
欧盟“地平线2020”研究与创新项目770299(NewsEye)的支持,计算资源由CSC-IT科学中心有限公司提供
瑞典研究委员会支持的计算词汇语义变化检测项目(2019-2022,dnr2018-01184)资助
文摘
“民族”(nation)和“民族性”(nationhood)属于思想史领域最常研究的概念,而“民族”一词及其历史用法又十分模糊。文章旨在开发一种利用依存分析和神经词嵌入的数据驱动方法,以澄清这一概念的演变过程。为此提出以下两个步骤。首先,使用语言处理,创建一个与“民族”主题相关的大型单词集合。其次,训练历时词嵌入,并使用它们来量化这些词之间语义相似性的强度,从而创建有意义的聚类,然后将之历时排列。为了说明该方法在跨语言、多时间段及大型数据集研究上的稳健性,将其应用于荷兰语、瑞典语、芬兰语和英语共五份全套历史报纸档案集合。迄今为止,还没有如此大规模的比较研究——以数据驱动方法掌握多达四种不同语言的长期发展。文章所描述的方法还有一个特殊优势:通过设计,该方法可扩展应用至其他问题,而不仅限于对“民族性”的研究,并且可在不同语境中重复使用。
关键词
数字人文
数据驱动
历史报纸
词汇变化
Keywords
digital humanities
data-driven
historical newspapers
vocabulary change
分类号
G212 [文化科学—新闻学]
H313 [语言文字—英语]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于数据驱动方法的历史报纸词汇变化研究
西蒙·恒晨
鲁本·罗斯
亚尼·马尔亚宁
米科·托洛宁
方华康(译)
《数字人文研究》
2022
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部