期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
ETL中的数据增量抽取机制研究 被引量:33
1
作者 戴浩 杨波 《计算机工程与设计》 CSCD 北大核心 2009年第23期5552-5555,共4页
为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4... 为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4个方面分析和比较了各种数据增量抽取机制的优劣性。最后,总结了选取数据增量抽取机制所应遵循的主要原则和标准。 展开更多
关键词 数据抽取转换与加载 增量抽取 数据仓库 商业智能
下载PDF
ETL中增量抽取的机制及其Kette实现
2
作者 冉德彤 陈天明 马记 《网络安全和信息化》 2021年第12期96-99,共4页
目前,数据仓库工具中并没有提供自动生成增量抽取数据的功能,而是需要用户自行实现。本文主要介绍了增量抽取的几种机制,并利用开源ETL工具Kettle进行实现,为数据仓库项目中ETL的实施提供参考和帮助。
关键词 增量抽取 ETL 数据仓库工具 自动生成 数据仓库项目
下载PDF
SAP商务智能数据增量抽取机制及应用
3
作者 刘晓利 王运生 《科技风》 2011年第14期88-88,共1页
本文针对SAPBW中抽取大量数据造成系统抽取效率下降等问题,文中采用增量数据抽取机制,在对数据源进行相关设置后,实现数据增量抽取,避免了因全量抽取造成的抽取效率低下等问题,提高了效率。
关键词 BW增量抽取 机制
下载PDF
基于关键属性比对的增量数据抽取方法 被引量:4
4
作者 刘胜 杨岳湘 +1 位作者 邓劲生 李阳 《计算机工程与应用》 CSCD 2012年第4期115-117,共3页
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词 关键属性 增量数据抽取 全表比对 提取转换加载(ETL)
下载PDF
基于可变时间窗口的增量数据抽取模型 被引量:4
5
作者 刘杰 王桂玲 左小将 《计算机科学》 CSCD 北大核心 2018年第11期204-209,230,共7页
基于合适的数据抽取模型持续不断地将变化的数据从各个数据源系统进行抽取集成,是各个异构系统之间进行数据共享融合的关键,也是构建增量式数据仓库来进行数据分析的关键。传统的时间戳变化数据捕获方式存在因数据抽取过程中发生异常而... 基于合适的数据抽取模型持续不断地将变化的数据从各个数据源系统进行抽取集成,是各个异构系统之间进行数据共享融合的关键,也是构建增量式数据仓库来进行数据分析的关键。传统的时间戳变化数据捕获方式存在因数据抽取过程中发生异常而导致数据抽取失效,进而影响数据抽取效率的问题。鉴于此,文中借鉴时间窗口的思想,采用先抽取少量重复记录再去重的做法,对传统的时间戳增量数据捕获模型进行了改进,提出了基于可变时间窗口的增量数据抽取模型。该模型减少了异常对数据抽取的影响,增强了时间戳增量数据抽取ETL流程的可靠性,在一定程度上提高了数据的抽取效率。 展开更多
关键词 变化数据的捕获 增量抽取 时间戳 ETL
下载PDF
基于BCV和LogMiner实现增量数据抽取的应用 被引量:1
6
作者 杨从法 宋兴彬 《计算机系统应用》 2010年第4期192-196,共5页
介绍了不同数据抽取方式的优缺点,基于EMC存储联机业务持续性卷BCV数据备份和Oracle LogMiner分析归档日志原理,分析了数据抽取复制方案,实现了省级数据集中应用生产环境到分析平台中增量数据抽取。
关键词 数据抽取 业务持续性卷 重做日志 归档日志 增量抽取
下载PDF
一种新型增量数据抽取方法的研究
7
作者 蔡立新 徐国强 金香 《黑龙江科技信息》 2016年第36期271-271,共1页
针对当前增量数据抽取中存在的主要问题,本文研究了一种增量数据的抽取方法。实际应用表明,该方法可以大大提高系统的吞吐能力;数据处理准确、高效。
关键词 并行处理 增量数据抽取 比对式
下载PDF
大数据平台对医院数据抽取方案的研究与应用 被引量:2
8
作者 赵浩宇 周琳 +1 位作者 罗浩 汪鹏 《中国数字医学》 2021年第10期108-112,共5页
目的:通过抽取HIS库数据的方式建设大数据平台,构建临床大数据科研系统,为医护人员提供准确的医疗科研数据。方法:通过比较各数据抽取方式的优劣,选用OGG软件、CDC技术,通过分析数据库自身的日志来判断变化的数据,以增量抽取的方式将医... 目的:通过抽取HIS库数据的方式建设大数据平台,构建临床大数据科研系统,为医护人员提供准确的医疗科研数据。方法:通过比较各数据抽取方式的优劣,选用OGG软件、CDC技术,通过分析数据库自身的日志来判断变化的数据,以增量抽取的方式将医院数据抽取到大数据平台。结果:通过比较,增量抽取数据相对应全量抽取数据更加省时,抽取效率更高,对在用生产库影响也较小,对于建设医院大数据平台是现阶段最有效的数据提取方式。结论:运用增量抽取数据,可最大限度保障平台数据的准确性和完整性,在不影响生产库系统运行的同时还能为临床医护工作者提供科研数据的分析和查询。 展开更多
关键词 大数据平台 数据抽取技术 增量抽取 医院数据
下载PDF
烟草数据中心ETL技术应用 被引量:10
9
作者 密红 何利力 杨秀梅 《计算机系统应用》 2011年第5期184-187,共4页
简要介绍了ETL技术的主要功能和主要实现方法,并结合国内某烟草省公司数据中心营销主题域建设项目的具体需要,提出了一种适合该项目的具体ETL实现方法,该方法成功将市烟草公司业务系统中主数据和营销业务数据抽取到省公司数据仓库中,对... 简要介绍了ETL技术的主要功能和主要实现方法,并结合国内某烟草省公司数据中心营销主题域建设项目的具体需要,提出了一种适合该项目的具体ETL实现方法,该方法成功将市烟草公司业务系统中主数据和营销业务数据抽取到省公司数据仓库中,对整个数据中心项目的顺利完成起到了至关重要的作用,也对其他行业数据中心建设提供了相关经验。 展开更多
关键词 ETL 数据仓库 增量抽取 商务智能 数据模型
下载PDF
基于大数据高校教学数据智能处理平台的设计 被引量:2
10
作者 房亚群 田其英 《湖南工业职业技术学院学报》 2016年第2期10-11,28,共3页
大数据的分析和挖掘过程,数据抽取是关键环节。目前大多采用全量抽取、CDC等方式,具有一定的局限性。本文提出了一种基于日志分析的增量抽取,并设计了基于大数据的高校教学数据智能处理平台,实现"业务与数据"的分离。ETL数据... 大数据的分析和挖掘过程,数据抽取是关键环节。目前大多采用全量抽取、CDC等方式,具有一定的局限性。本文提出了一种基于日志分析的增量抽取,并设计了基于大数据的高校教学数据智能处理平台,实现"业务与数据"的分离。ETL数据抽取关键功能,采用数据库增量抽取方式,与传统方式相比,具有很好的实用价值。 展开更多
关键词 大数据 ETL 日志分析 增量抽取
下载PDF
基于微云技术的高校教育信息化服务平台研发设计
11
作者 房亚群 田其英 《重庆城市管理职业学院学报》 2016年第1期84-86,共3页
大数据的分析和挖掘过程,数据抽取是关键环节。目前大多采用全量抽取、CDC等方式,具有一定的局限性。本文提出了一种基于日志分析的增量抽取,并设计了基于大数据的高校教学数据智能处理平台,实现"业务与数据"的分离。ETL数据... 大数据的分析和挖掘过程,数据抽取是关键环节。目前大多采用全量抽取、CDC等方式,具有一定的局限性。本文提出了一种基于日志分析的增量抽取,并设计了基于大数据的高校教学数据智能处理平台,实现"业务与数据"的分离。ETL数据抽取关键功能,采用数据库增量抽取方式,与传统方式相比,具有很好的实用价值。 展开更多
关键词 大数据 ETL 日志分析 增量抽取
下载PDF
ETL在公安部门数据共享与资源整合中的应用 被引量:4
12
作者 高立春 徐叶强 《情报杂志》 CSSCI 北大核心 2010年第B12期190-192,共3页
公安各主要业务部门的业务工作已实现了电脑化、流程化管理。由于各个系统之间拥有各自的数据存储与访问方式,彼此独立,形成一个"信息孤岛",大量的业务数据没有得到充分的利用。为了解决此问题,讨论了ETL技术的特点、本质及... 公安各主要业务部门的业务工作已实现了电脑化、流程化管理。由于各个系统之间拥有各自的数据存储与访问方式,彼此独立,形成一个"信息孤岛",大量的业务数据没有得到充分的利用。为了解决此问题,讨论了ETL技术的特点、本质及其重要性。最后,结合公安各业务数据库的特点,使用开源的ETL工具KETTLE实现共享资源的集成。 展开更多
关键词 ETL 数据共享 增量抽取 KETTLE
下载PDF
企业决策支持系统ETL建构技术研究 被引量:6
13
作者 孙水华 林志强 《福建工程学院学报》 CAS 2011年第1期83-85,91,共4页
决策支持系统构建的关键在于ETL系统的开发。文章从ETL模型设计、ETL策略及实现技术、ETL数据质量控制技术等方面进行研究设计,提出适应中小型企业数据整合需求的ETL解决方案。
关键词 决策支持系统 模型设计 增量数据抽取技术 数据质量控制
下载PDF
温州市浙南产业集聚区智慧海塘数据中心的设计 被引量:1
14
作者 周昌臣 吴炎 张守楠 《水电站机电技术》 2022年第8期26-29,52,共5页
针对温州市浙南产业集聚区智慧海塘工程提升的实际需要,为了能够为多元异构采集体系的数据汇聚与融合共享、与大数据和省市县数据的数据交互、软件系统的数据支撑等数据支撑服务,并为后期建设提供数据可拓展性设计,设计和建设温州市浙... 针对温州市浙南产业集聚区智慧海塘工程提升的实际需要,为了能够为多元异构采集体系的数据汇聚与融合共享、与大数据和省市县数据的数据交互、软件系统的数据支撑等数据支撑服务,并为后期建设提供数据可拓展性设计,设计和建设温州市浙南产业集聚区智慧海塘数据中心。该数据中心采用云技术、数据归集、数据清洗、数据清洗等特色设计,采用视图、函数、触发器、存储过程、时间戳、全表比对、MD5校验、日志对比等技术的联合应用。在数据备份恢复和容灾方面,采用多种安全可靠的方式。针对实时水雨情、水质、实时工情等专业数据库,采用增量抽取方式,并将抽取周期设为1次/3~5 min。在敎据的加载策略上,依据数据抽取的策略以及业务规则方式,采用直接、全部、更新3种加载方式。实践应用表明,温州市浙南产业集聚区智慧海塘数据中心的设计符合应用多种的要求,在智慧海塘的数据中心设计与应用中具有借鉴意义。 展开更多
关键词 智慧海塘 数据中心 触发器 增量抽取 数据交互 加载策略
下载PDF
信息集成平台中关键技术研究 被引量:1
15
作者 刘军 《电脑知识与技术》 2014年第11X期8027-8029,共3页
当前信息集成平台主要包括中介器和物化视图两种方法。该文就物化视图方法中的增量抽取、数据交换以及完整性约束等热门问题进行了探讨,并针对各问题提出了相应的解决方案。
关键词 信息集成 增量抽取 数据交换 完整性约束
下载PDF
基于XML的内外网数据交换与同步的研究与应用
16
作者 张志英 《商情》 2008年第2期174-,199,共2页
让数据在异构系统间跨网络传输,实现内外网间的数据同步,提出了利用J2EE技术进行分层架构设计,采用注册同步队列表的机制来增量抽取同步信息并通过XML技术进行封装的解决方案。
关键词 XML J2EE HIBERNATE 增量抽取
下载PDF
校园信息服务平台的分析与设计
17
作者 林伟烜 《价值工程》 2012年第11期172-173,共2页
针对校园信息化建设过程中产生的一些数据问题,结合已经使用的信息系统进行系统分析。从数据的抽取、转换和存储整个流程进行分析设计,应用J2EE平台和Oracle数据库开发基于网络浏览器/服务器结构的服务平台,实现了ETL过程设置、ETL实时... 针对校园信息化建设过程中产生的一些数据问题,结合已经使用的信息系统进行系统分析。从数据的抽取、转换和存储整个流程进行分析设计,应用J2EE平台和Oracle数据库开发基于网络浏览器/服务器结构的服务平台,实现了ETL过程设置、ETL实时监控、数据统计设置、数据展现等功能模块。 展开更多
关键词 ETL 增量数据抽取(CDC) 数据仓库 数据整合
下载PDF
SAP商业智能数据增量更新模式的实现 被引量:1
18
作者 丁建德 《才智》 2009年第31期37-38,共2页
数据ETL是商业智能应用的一个重要环节,数据增量抽取和更新可以提高系统的性能和降低数据存储空间,但大部分外部数据源均无法直接实现增量抽取,利用SAPBW产品的特性并通过编程可以实现数据的增量抽取和更新。
关键词 商业智能 SAP ETL 源系统 数据源 信息包 增量抽取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部