-
题名数据仓库视角下多源异构专利数据集成研究
被引量:1
- 1
-
-
作者
郑皓
许琦
-
机构
台州职业技术学院台州中小企业信息化应用技术协同创新中心
浙江省工业机器人与智能制造生产线集成推广应用协同创新中心
-
出处
《科技创新发展战略研究》
2020年第3期14-17,共4页
-
基金
台州市大学生科技创新项目(一类)“基于数据仓库的专利信息分析系统研究”(台教高[2018]202号)
台州职业技术学院大学生科技创新项目“基于数据仓库的专利信息分析系统研究”(2019DKC11)。
-
文摘
遵循数据仓库的架构模式,将分布在不同地点、不同系统的异构专利数据集成到一个数据中心,方便专利数据的统一存储、访问、分析。封装所有数据源的异构专利数据细节,对用户提供统一、透明的访问接口,用户只需关注自身的访问需求,无需过多关注各底层数据源的差异结构。综合采用快照法、触发器法、日志法、时间戳法、影子表法等各类数据提取方法,扬长避短,提高专利数据集成效率。并以时间戳法为例,应用Kettle工具实现增量专利数据提取,对文章提出的理论进行验证。
-
关键词
专利数据集成
数据仓库
多源异构性
Kettle工具
-
Keywords
patent data integration
data warehouse
multi-source heterogeneity
Kettle
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-