数据仓库视角下多源异构专利数据集成研究被引量：1

Research on the Integration of Multi-source Heterogeneous Patent Data from the Perspective of Data Warehouse

下载PDF

导出

摘要遵循数据仓库的架构模式,将分布在不同地点、不同系统的异构专利数据集成到一个数据中心,方便专利数据的统一存储、访问、分析。封装所有数据源的异构专利数据细节,对用户提供统一、透明的访问接口,用户只需关注自身的访问需求,无需过多关注各底层数据源的差异结构。综合采用快照法、触发器法、日志法、时间戳法、影子表法等各类数据提取方法,扬长避短,提高专利数据集成效率。并以时间戳法为例,应用Kettle工具实现增量专利数据提取,对文章提出的理论进行验证。 Following the architectural pattern of data warehouse,heterogeneous patent data distributed in different locations and different systems are integrated into a data center,which facilitates the unified storage,access and analysis of patent data.Encapsulate the heterogeneous proprietary data details of all data sources to provide unifi ed and transparent access interface for users,uers only need to focus on their own access requirements,and do not need to pay too much attention to the different structure of the underlying data sources.Various data extraction methods such as snapshot method,trigger method,log method,timestamp method and shadow table method are adopted comprehensively to enhance strengths and circumvent weaknesses,which helps improve the effi ciency of patent data integration.Taking the time-stamp method as an example,the above theory is verifi ed by using the tool of Kettle to extract incremental patent data.

作者郑皓许琦 ZHENG Hao;XU Qi(Taizhou Informatization Application Technology Collaborative Innovation Center for Small and Medium-sized Enterprises,Taizhou Vocational and Technical College;Zhejiang Collaborative Innovation Center of Industrial Robot and Intelligent Manufacturing Line Integration Promotion Application,Taizhou 318000,China)

机构地区台州职业技术学院台州中小企业信息化应用技术协同创新中心浙江省工业机器人与智能制造生产线集成推广应用协同创新中心

出处《科技创新发展战略研究》 2020年第3期14-17,共4页 Strategy for Innovation and Development of Science and Technology

基金台州市大学生科技创新项目(一类)“基于数据仓库的专利信息分析系统研究”(台教高[2018]202号) 台州职业技术学院大学生科技创新项目“基于数据仓库的专利信息分析系统研究”(2019DKC11)。

关键词专利数据集成数据仓库多源异构性 Kettle工具 patent data integration data warehouse multi-source heterogeneity Kettle

分类号 TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1袁晓东,蔡学辉.政策引导创新模式下的专利集成失败问题研究[J].科学学研究,2018,36(6):967-973. 被引量：3
2周绍钧,吕学强,李卓,都云程.基于多策略融合的专利术语自动抽取[J].计算机应用与软件,2015,32(2):28-32. 被引量：4
3张端阳,肖国华,李文燕.面向专利集成的专利技术相关性测度方法研究[J].情报杂志,2014,33(11):54-61. 被引量：17
4刘会景,凌锋,朱新超,齐萍,杨冠灿.多源专利信息资源集成研究——以美国专利数据为例[J].数字图书馆论坛,2015(9):22-26. 被引量：2
5朱新超,霍翠婷,刘会景.不同来源的中国专利信息资源整合研究[J].情报理论与实践,2014,37(11):90-93. 被引量：5
6邓勇,房俊民,文奕.专利信息集成服务平台的构建设想[J].情报理论与实践,2007,30(1):88-92. 被引量：18
7杨冠灿,张静,望俊成.PATSTAT专利数据库数据集成策略研究[J].数字图书馆论坛,2015(9):10-16. 被引量：1

二级参考文献89

1李广建,张智雄.国外跨库检索系统研究项目及其特点[J].情报理论与实践,2004,27(4):444-447. 被引量：50
2钟佳奇.我国专利网站建设现状分析[J].现代情报,2004,24(9):63-66. 被引量：3
3卢共平.论数字图书馆的服务集成[J].图书馆,2004(5):47-50. 被引量：21
4常唯.学科信息门户的资源选择与组织[J].图书馆,2005(1):60-62. 被引量：20
5胡昌平,周永红.信息集成服务回顾与展望[J].图书馆论坛,2005,25(4):1-7. 被引量：24
6刘林青,谭力文.专利竞争优势的理论探源[J].中国工业经济,2005(11):89-94. 被引量：40
7黄德才,戚华春.PageRank算法研究[J].计算机工程,2006,32(4):145-146. 被引量：69
8黄圆圆,朱东华,任智军,张诚.对比分析方法在专利情报分析中的应用研究[J].现代图书情报技术,2006(10):60-65. 被引量：21
9马文峰,杜小勇.基于数据的资源整合[J].情报资料工作,2007,28(1):41-45. 被引量：13
10刘婕.世界林业专利信息资源的整合与利用[J].世界林业研究,2007,20(3):70-73. 被引量：3

共引文献42

1刘素梅,王中,梁勇,杨颖,赵小璟.科研图书馆建立网络化工信息资源导航的构想[J].图书情报工作,2009,53(S1):79-80. 被引量：1
2杨木容.面向科技创新的专利信息检索与咨询服务研究[J].现代情报,2009,29(1):156-158. 被引量：4
3王云,黄建.网络信息服务的集成:推送、漫游加代理[J].科技文献信息管理,2010,24(3):7-8.
4杜海洲,王天津,刘桂玲,刘娜,吕婷.医药卫生信息资源整合与集成的开放存取服务平台[J].预防医学情报杂志,2010,26(11):895-899. 被引量：3
5杨丽.高校专利信息服务调查分析[J].图书馆论坛,2011,31(2):68-70. 被引量：23
6龙仕柏.网络环境下医院科研信息服务的思考[J].海南医学,2011,22(14):83-85. 被引量：1
7杨丽.服务自主创新的高校专利信息整合研究[J].图书情报工作,2012,56(2):121-125. 被引量：7
8张晓艳,李剑,黄凯文.科技查新在科技创新中的作用研究[J].医学信息学杂志,2013,34(4):51-55. 被引量：4
9董玉鹏,包逸萍.专利信息服务标准规范体系构建研究[J].中国科技论坛,2013(9):97-101. 被引量：12
10张莉,刘昱显.基于语序位置特征的汉英术语对自动抽取研究[J].南京大学学报（自然科学版）,2015,51(4):707-713. 被引量：6

同被引文献10

1田竞.基于MVC框架高校多媒体管理系统的设计与实现[J].机械设计,2021,38(9):123-124. 被引量：7
2孙安健,王星,闫晓瑜.通用ETL工具的研究与实现[J].计算机应用与软件,2012,29(12):175-178. 被引量：10
3刘云生,梁爽.实时数据库的定时调度策略[J].小型微型计算机系统,2001,22(11):1375-1377. 被引量：1
4刘红霞,陆文迪.改进的MVC设计模式的研究与应用[J].计算机工程与科学,2015,37(9):1688-1691. 被引量：35
5卢伟,孟婥,孙以泽,朱荷蕾,罗娟.基于Modbus/TCP及FINS/TCP协议的数据采集与通讯系统设计[J].仪表技术与传感器,2017(1):88-91. 被引量：18
6刘正,张书锋,赵鹤鸣.MVC模式下多层分布式软件系统架构设计[J].现代电子技术,2018,41(7):135-139. 被引量：23
7赵亚伟.一种基于Kettle的无损增量数据同步方法研究[J].软件导刊,2019,18(10):55-58. 被引量：7
8张新聚,陈宁,马秀红.基于TCP/IP协议的PLC远程数据采集系统设计[J].组合机床与自动化加工技术,2020(4):91-94. 被引量：20
9曹惠茹,成海秀,刘永鑫,陈凤宜,詹锡隆.基于云计算的城市轨道交通数据可视化方法及案例研究[J].计算机应用与软件,2021,38(2):33-36. 被引量：9
10傅汤毅,宁爱兵,孙智勇,林道晗,张惠珍.有约束竞争选址问题的降阶回溯算法[J].计算机应用研究,2021,38(12):3678-3682. 被引量：1

引证文献1

1赵业海,孙传凤,张斌.基于kettle的冲压设备数据处理与监测系统的设计与实现[J].装备制造技术,2023(7):195-199.

1沈黎.数据库原理及应用课程中触发器实现的课堂教学[J].学园,2020,0(6):18-19.
2王晶,崔然,胡晓亮.基于工作流的跨部门协同业务管理系统[J].软件,2020,41(5):184-188. 被引量：3
3任军.山羊分腿腾跃触发器的制作及妙用[J].体育教学,2020,40(5):87-87.
4李佳伦.直播电商中的“带货网红”主体定位与法律责任[J].中国市场监管研究,2020(5):16-18. 被引量：19
5高新杰.光伏电站设备的可靠性分析[J].集成电路应用,2020,37(4):126-127. 被引量：1
6张道一.工艺美术的性质和特点[J].南京艺术学院学报（美术与设计）,1982(4):49-57. 被引量：2
7高月.船舶轮机自动化机舱动力装置与系统研究[J].中国航班,2020(7):121-121.
8龚勋,王淑营.基于C#的OPC客户端设计[J].计算机系统应用,2020,29(5):239-244. 被引量：6
9宋扬,张增一,石勇,邹臣国.基于蜂窝移动网络的车地无线传输系统设计及应用[J].电声技术,2020,44(3):60-60. 被引量：2
10薛黎明,李长明,郑志学,沈文龙,王豪杰.基于二维云模型和Apriori算法的围岩稳定性分级研究[J].铁道学报,2020,42(6):121-128. 被引量：7

科技创新发展战略研究

2020年第3期

浏览历史

内容加载中请稍等...

数据仓库视角下多源异构专利数据集成研究被引量：1

参考文献7

二级参考文献89

共引文献42

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

数据仓库视角下多源异构专利数据集成研究 被引量：1

参考文献7

二级参考文献89

共引文献42

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

数据仓库视角下多源异构专利数据集成研究被引量：1