期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Scrapy与规则的公共文化机构官网信息采集与内容抽取
1
作者
申泳国
化柏林
《图书情报研究》
2021年第2期21-27,37,共8页
[目的/意义]公共文化服务机构在服务运营的过程中产生大量数据,既有宏观的年度统计数据,也有微观的活动通知、参加人数等细节数据,如何快速全面地获取这些数据并进行有效集成,是公共文化大数据分析与挖掘的一个前提。[方法/过程]在分析...
[目的/意义]公共文化服务机构在服务运营的过程中产生大量数据,既有宏观的年度统计数据,也有微观的活动通知、参加人数等细节数据,如何快速全面地获取这些数据并进行有效集成,是公共文化大数据分析与挖掘的一个前提。[方法/过程]在分析公共文化服务数据分布与特点的基础上,研究信息采集与数据抽取技术。[结果/结论]通过网络爬虫技术获取官网上的数据,利用正则表达式从半结构化及非结构化的文本中抽取目标数据。
展开更多
关键词
公共文化
信息采集
信息抽取
图书馆
文化馆
Scrapy
下载PDF
职称材料
公共文化服务大数据集成架构设计研究
被引量:
10
2
作者
化柏林
赵东在
申泳国
《图书情报工作》
CSSCI
北大核心
2020年第10期3-11,共9页
[目的/意义]针对当前各图书馆、文化馆等公共文化服务机构的多源异构数据,设计出一套行之有效的集成架构。[方法/过程]在充分分析公共文化大数据资源的基础上,对公共文化服务大数据的类型与分布进行分析,结合公共文化服务大数据的应用场...
[目的/意义]针对当前各图书馆、文化馆等公共文化服务机构的多源异构数据,设计出一套行之有效的集成架构。[方法/过程]在充分分析公共文化大数据资源的基础上,对公共文化服务大数据的类型与分布进行分析,结合公共文化服务大数据的应用场景,设计公共文化大数据集成的架构。[结果/结论]提出一个由数据来源层、系统集成层、数据融合层、存储层、应用层五个层次构成的公共文化服务大数据集成架构,并对其中的采集、存储等关键技术进行研究。
展开更多
关键词
图书馆
文化馆
公共文化
大数据
数据集成
集成架构
原文传递
题名
基于Scrapy与规则的公共文化机构官网信息采集与内容抽取
1
作者
申泳国
化柏林
机构
北京大学信息管理系
公共文化服务大数据应用文化和旅游部重点实验室
出处
《图书情报研究》
2021年第2期21-27,37,共8页
基金
文化和旅游部重点实验室项目“公共文化智慧化模式聚类与动态展示系统研究”(项目编号:2020008)的阶段研究成果之一。
文摘
[目的/意义]公共文化服务机构在服务运营的过程中产生大量数据,既有宏观的年度统计数据,也有微观的活动通知、参加人数等细节数据,如何快速全面地获取这些数据并进行有效集成,是公共文化大数据分析与挖掘的一个前提。[方法/过程]在分析公共文化服务数据分布与特点的基础上,研究信息采集与数据抽取技术。[结果/结论]通过网络爬虫技术获取官网上的数据,利用正则表达式从半结构化及非结构化的文本中抽取目标数据。
关键词
公共文化
信息采集
信息抽取
图书馆
文化馆
Scrapy
Keywords
public culture
information collection
information extraction
library
cultural center
Scrapy
分类号
G249.2 [文化科学]
下载PDF
职称材料
题名
公共文化服务大数据集成架构设计研究
被引量:
10
2
作者
化柏林
赵东在
申泳国
机构
北京大学信息管理系
出处
《图书情报工作》
CSSCI
北大核心
2020年第10期3-11,共9页
基金
公共文化服务大数据应用文化部重点实验室项目"公共文化大数据系统的集成应用研究"(项目编号:2017001)研究成果之一。
文摘
[目的/意义]针对当前各图书馆、文化馆等公共文化服务机构的多源异构数据,设计出一套行之有效的集成架构。[方法/过程]在充分分析公共文化大数据资源的基础上,对公共文化服务大数据的类型与分布进行分析,结合公共文化服务大数据的应用场景,设计公共文化大数据集成的架构。[结果/结论]提出一个由数据来源层、系统集成层、数据融合层、存储层、应用层五个层次构成的公共文化服务大数据集成架构,并对其中的采集、存储等关键技术进行研究。
关键词
图书馆
文化馆
公共文化
大数据
数据集成
集成架构
Keywords
library
cultural center
public culture
big data
data integration
integrated architecture
分类号
G250 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于Scrapy与规则的公共文化机构官网信息采集与内容抽取
申泳国
化柏林
《图书情报研究》
2021
0
下载PDF
职称材料
2
公共文化服务大数据集成架构设计研究
化柏林
赵东在
申泳国
《图书情报工作》
CSSCI
北大核心
2020
10
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部