期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
一种标准的ETL的设计思想及其实现 被引量:14
1
作者 程跟上 郑洪源 丁秋林 《计算机应用研究》 CSCD 北大核心 2005年第3期101-103,共3页
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
关键词 etl CWM 抽取元数据 转换元数据 元数据
下载PDF
基于大数据处理的ETL框架的研究与设计 被引量:20
2
作者 沈琦 陈博 《电子设计工程》 2016年第2期25-27,34,共4页
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、... 针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。 展开更多
关键词 大数据处理 数据抽取 数据转换 数据 etl框架
下载PDF
数据仓库实现中ETL的应用研究 被引量:3
3
作者 先晓兵 常晋义 《计算机与现代化》 2007年第10期43-46,共4页
通过外贸业务分析决策系统的实现,探讨在数据仓库项目应用过程中,如何针对来自不同应用系统、不同数据平台、不同数据源形式的源数据系统存在的数据质量的差异性、缺乏一致性等问题,设计较好的ETL(Extract,Transform,Load)过程解决方案... 通过外贸业务分析决策系统的实现,探讨在数据仓库项目应用过程中,如何针对来自不同应用系统、不同数据平台、不同数据源形式的源数据系统存在的数据质量的差异性、缺乏一致性等问题,设计较好的ETL(Extract,Transform,Load)过程解决方案,将数据从源数据系统中抽取、转换成数据仓库需要的格式和统一数据类型,并正确加载到数据仓库中,为决策支持系统的实现提供高质量的基础数据。 展开更多
关键词 数据仓库 数据提取 数据转换 数据 DTS(数据转换系统)
下载PDF
面向ETL的数据起源追踪系统 被引量:1
4
作者 戴超凡 王涛 《计算机工程》 CAS CSCD 北大核心 2011年第17期256-258,261,共4页
提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行... 提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行相关处理,构建各个层次的转换起源信息图,从而实现数据起源的追踪。 展开更多
关键词 数据起源 起源管理系统 提取-转换- 同步/异步转换
下载PDF
零售业数据仓库中ETL技术的研究 被引量:1
5
作者 黄丽娟 郑雪峰 靳风荣 《计算机与现代化》 2004年第9期63-65,共3页
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际... 数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。 展开更多
关键词 零售业 数据仓库 etl 数据抽取 数据转换 数据清洗 数据
下载PDF
教学管理数据仓库中ETL的实现 被引量:1
6
作者 占小忆 《科技创新导报》 2011年第16期17-18,共2页
ETL工具从异构数据源抽取数据,并将数据清洗,规范化后装载到数据仓库。文章从前期的数据理解阶段入手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案。提出了以数据理解为根基,以清洗转换为中心... ETL工具从异构数据源抽取数据,并将数据清洗,规范化后装载到数据仓库。文章从前期的数据理解阶段入手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案。提出了以数据理解为根基,以清洗转换为中心的设计思想,并给出成绩管理模块的具体实施步骤。 展开更多
关键词 etl 数据仓库 数据抽取 数据转换 数据
下载PDF
分布式环境下ETL系统的优化策略研究 被引量:1
7
作者 陈盛荣 刘广钟 《现代计算机(中旬刊)》 2016年第8期39-42,80,共5页
ETL是将数据由不同数据源抽取到数据仓库的重要过程,ETL的过程设计、维护和修改直接影响数据仓库中数据处理的效率和数据的质量。通过分析ETL活动的模型特点,结合分布式计算的思想提出一种新的ETL系统模型,并提出基于该系统架构的满足ET... ETL是将数据由不同数据源抽取到数据仓库的重要过程,ETL的过程设计、维护和修改直接影响数据仓库中数据处理的效率和数据的质量。通过分析ETL活动的模型特点,结合分布式计算的思想提出一种新的ETL系统模型,并提出基于该系统架构的满足ETL任务形态特征的优化方案,详细描述数据以及调度信息在系统中的周转过程。 展开更多
关键词 数据仓库 分布式系统 抽取转换(etl)
下载PDF
基于SOA的国家级油气资源数据库ETL系统设计与实现
8
作者 李颖 凤丽洲 +2 位作者 贾字田 姜悦 公维学 《吉林大学学报(地球科学版)》 EI CAS CSCD 北大核心 2011年第S1期414-418,共5页
针对我国油气资源数据相对多源、异构、分散的现状,根据OLAP的实际需求,采用MVC模式作为系统架构模式,实现了国家油气资源数据库数据提取、转换和加载(ETL)系统。阐述了系统所采用的基于面向对象体系结构(SOA)的5层结构模型,使用ODBC和... 针对我国油气资源数据相对多源、异构、分散的现状,根据OLAP的实际需求,采用MVC模式作为系统架构模式,实现了国家油气资源数据库数据提取、转换和加载(ETL)系统。阐述了系统所采用的基于面向对象体系结构(SOA)的5层结构模型,使用ODBC和XML技术实现数据库连接的动态映射,应用Oracle DB解决了多媒体数据处理等关键问题。 展开更多
关键词 国家级油气资源数据库 面向服务的体系结构 联机分析处理 数据提取、转换和
下载PDF
元数据驱动ETL的研究 被引量:5
9
作者 宿芳 寿永熙 苏依拉 《计算机工程与应用》 CSCD 2012年第6期114-118,125,共6页
对原始数据的提取、转换、加载(ETL)是数据仓库开发的重要步骤。一个稳定而可靠的ETL系统取决于它的总体设计。在原有ETL基础上,提出了元数据驱动ETL的思想,利用包引擎和SQL引擎以及相关算法,对传统ETL的方法进行改进,目的是提高ETL系... 对原始数据的提取、转换、加载(ETL)是数据仓库开发的重要步骤。一个稳定而可靠的ETL系统取决于它的总体设计。在原有ETL基础上,提出了元数据驱动ETL的思想,利用包引擎和SQL引擎以及相关算法,对传统ETL的方法进行改进,目的是提高ETL系统的稳定性和可靠性,使用户通过对元数据的维护来控制ETL的执行过程。 展开更多
关键词 抽取、转换和加(etl) 数据仓库 元数据 SQL引擎 包引擎
下载PDF
基于MAS的分布式ETL模型 被引量:6
10
作者 徐艳华 郭朝珍 《郑州大学学报(理学版)》 CAS 2007年第4期118-121,共4页
提出了基于MAS的分布式ETL模型,该模型将数据处理分配到多计算服务器,利用Agent的协作性、主动性、反应性和交互性,控制多计算服务器的协同处理来提高系统计算能力.与原有的ETL工具相比,该模型不仅可以提高ETL流程的运行效率,而且充分... 提出了基于MAS的分布式ETL模型,该模型将数据处理分配到多计算服务器,利用Agent的协作性、主动性、反应性和交互性,控制多计算服务器的协同处理来提高系统计算能力.与原有的ETL工具相比,该模型不仅可以提高ETL流程的运行效率,而且充分利用了企业系统中所有的服务器资源,从而降低了运行ETL服务器的硬件成本. 展开更多
关键词 数据仓库 数据抽取 数据转换 数据 etl 分布式计算 AGENT MAS
下载PDF
基于子模式的关系数据到图数据ETL方法研究 被引量:4
11
作者 丁强龙 王津 张学杰 《计算机工程与应用》 CSCD 北大核心 2017年第12期76-84,共9页
图数据库在解决多层关系查询、社区发现等问题时性能优于关系数据库。然而目前大量的数据以关系数据的形式存储,如何高效完整地进行关系数据到图数据的ETL,即抽取、转换、加载,是图数据库应用领域研究的重要问题。国内外对该问题有了一... 图数据库在解决多层关系查询、社区发现等问题时性能优于关系数据库。然而目前大量的数据以关系数据的形式存储,如何高效完整地进行关系数据到图数据的ETL,即抽取、转换、加载,是图数据库应用领域研究的重要问题。国内外对该问题有了一些研究,但存在转换后的图数据质量不高、转换效率低、转换结果不利于分布式存储等问题。因此,提出基于子模式的关系数据到图数据ETL方法,改进原有ETL方法的流程和算法。该方法将关系数据库模式拆分为若干个子模式,并行进行ETL。不仅提高了ETL的效率,转换结果能满足图数据的分布式存储要求,也可以作为Spark GraphX计算框架的基础数据。最后,使用Java EE和Neo4j开发了原型系统,并进行了实验验证。结果表明,改进后的ETL方法获得了较已有方法更好的转化性能。 展开更多
关键词 图数据库 分布式存储 etl(数据提取、转换和) 子模式
下载PDF
粒子群算法在分布式ETL任务调度中的应用 被引量:3
12
作者 王春阳 赵书良 王长宾 《计算机工程与应用》 CSCD 2013年第9期150-155,共6页
随着分布式数据环境越来越复杂,ETL工具要面临数据源多、分布地域广和海量数据等因素带来的挑战。原有的集中式ETL工作流优化理论不能满足现在复杂数据环境的要求。介绍了如何将基于置换的离散型粒子群算法应用到分布式ETL任务优化调度... 随着分布式数据环境越来越复杂,ETL工具要面临数据源多、分布地域广和海量数据等因素带来的挑战。原有的集中式ETL工作流优化理论不能满足现在复杂数据环境的要求。介绍了如何将基于置换的离散型粒子群算法应用到分布式ETL任务优化调度问题上,主要工作围绕ETL工作调度模型、算法编码设计、目标函数选择等内容来展开,给出了分布式ETL工作调度策略的实现过程和伪代码。理论分析和实验证明了实际应用的有效可行性。 展开更多
关键词 分布式抽取-转换-(etl) 任务调度 基于置换的离散型粒子群算法
下载PDF
报表系统中ETL通用框架的设计与研究 被引量:4
13
作者 范金花 梁正和 《计算机技术与发展》 2009年第6期202-205,209,共5页
目前,随着企业信息的集成交换需求越来越频繁,使得大型报表系统研究中主要存在以下缺陷:前端数据源的分析处理能力低,导致报表生成和维护时间过长。文中在报表系统中引进了ETL技术对前端异构数据进行有效的汇总、分析和数据的抽取转换加... 目前,随着企业信息的集成交换需求越来越频繁,使得大型报表系统研究中主要存在以下缺陷:前端数据源的分析处理能力低,导致报表生成和维护时间过长。文中在报表系统中引进了ETL技术对前端异构数据进行有效的汇总、分析和数据的抽取转换加载,缩短了报表系统中数据的处理时间,提高了报表生成的速度和效率,使得报表系统的通用化得到加强。同时引入了XML技术实现了抽取和转换规则的定义,使得ETL模块具备良好的通用性和可扩展性。 展开更多
关键词 etl XML 异构数据 抽取转换
下载PDF
基于DirectShow的ETL工具的设计 被引量:2
14
作者 孟宪明 王正方 牛奔 《微计算机信息》 北大核心 2008年第30期145-146,157,共3页
ETL工具从异构数据源抽取数据,并将数据清洗、规范化后装载入数据仓库。数据源的多样性及数据集的复杂性为ETL工具的设计提出了挑战。本文设计并实现了一种基于微软DirectShow技术的ETL工具框架,使用通用数据访问接口屏蔽数据源的差异,... ETL工具从异构数据源抽取数据,并将数据清洗、规范化后装载入数据仓库。数据源的多样性及数据集的复杂性为ETL工具的设计提出了挑战。本文设计并实现了一种基于微软DirectShow技术的ETL工具框架,使用通用数据访问接口屏蔽数据源的差异,将转换图的概念引入ETL工具的设计中,灵活应对复杂的ETL转换。 展开更多
关键词 etl DIRECTSHOW 数据抽取 数据转换 数据
下载PDF
ETL技术在商业银行数据整合中的研究与应用 被引量:5
15
作者 解筱 张克 +2 位作者 任伯群 韩培 闫秀君 《信息技术与信息化》 2019年第7期45-47,共3页
互联网、大数据、人工智能时代数据已成为银行的重要资产,越来越多的商业银行积极建立全行级数据体系以满足其在数据关系分析、数据价值挖掘、数据应用等领域的需求。本文通过分析商业银行数据架构,提出对异构数据源高并发ETL处理技术,... 互联网、大数据、人工智能时代数据已成为银行的重要资产,越来越多的商业银行积极建立全行级数据体系以满足其在数据关系分析、数据价值挖掘、数据应用等领域的需求。本文通过分析商业银行数据架构,提出对异构数据源高并发ETL处理技术,可高效实现海量数据抽取、清洗、标准化、转换、加载及整合,解决了现有技术问题中多种异构数据源无法并发ETL处理、无法按系统优先级处理等导致的数据整合不灵活、批量总体运行时间过长、资源利用效率低等问题。 展开更多
关键词 etl(抽取、转换) 数据整合 数据架构
下载PDF
基于ETL技术的数据交换平台在电子政务领域中的应用 被引量:3
16
作者 王晓波 《电脑知识与技术》 2016年第7X期278-280,共3页
ETL作为构建数据仓库的一项重要技术,越来越多地应用于各个领域。该文简单介绍了ETL的基本原理,以及利用ETL技术,建立数据交换平台,实现电子政务领域的数据整合。
关键词 电子政务 etl 抽取 转换 数据交换平台
下载PDF
保险业数据参考模型对ETL的影响和作用
17
作者 郑擎宇 郭妍 左春 《计算机系统应用》 2007年第3期50-54,共5页
本文在简略回顾保险业通用数据参考模型之后,以数据仓库技术中的ETL过程为着眼点,对基于保险业数据参考模型的ETL过程进行设计和分析,从而有针对性地提出一种保险行业数据抽取转换和加载的方法,最后探讨该设计在保险公司的应用。
关键词 数据参考模型 数据仓库 etl 数据抽取转换 保险
下载PDF
ETL在水路客运行业项目中的应用
18
作者 刘娜嘉 朱力 《计算机工程》 CAS CSCD 北大核心 2007年第19期283-284,F0003,共3页
通过讨论数据提取、转换、加载(ETL)技术在上海水路客运票务系统项目中的实践应用,说明了ETL技术的特点、本质及其重要性。其中,ETL的具体应用包括数据查找、变更以及维护。采用ETL技术可以使数据库系统完全分离,大大减轻了数据汇总查... 通过讨论数据提取、转换、加载(ETL)技术在上海水路客运票务系统项目中的实践应用,说明了ETL技术的特点、本质及其重要性。其中,ETL的具体应用包括数据查找、变更以及维护。采用ETL技术可以使数据库系统完全分离,大大减轻了数据汇总查询对实时票务系统的负荷,提高了查询分析速度。 展开更多
关键词 数据提取、转换 水路客运 数据转换
下载PDF
一种基于MySQL的可扩展ETL系统的研究与实现 被引量:2
19
作者 冯运辉 《电子技术与软件工程》 2018年第5期185-187,共3页
数据抽取、转换和装载(Extraction,Transformation and Loading,简称ETL)是构建数据仓库的重要步骤,对数据仓库数据质量有着至关重要的影响。但是目前大多数ETL系统都以图形化设计ETL作业为目标,从而导致ETL系统操作复杂、在数据量较大... 数据抽取、转换和装载(Extraction,Transformation and Loading,简称ETL)是构建数据仓库的重要步骤,对数据仓库数据质量有着至关重要的影响。但是目前大多数ETL系统都以图形化设计ETL作业为目标,从而导致ETL系统操作复杂、在数据量较大时处理效率偏低且功能难以扩展。针对这些问题,在PERL方法属性处理器和Mysql数据库基础之上,设计并实现了一个轻量级、可扩展、高效的ETL系统(SETL),应用SETL系统可以将大量数据高效地加载到数据仓库中。最后通过试验验证了该系统具有更高效率。 展开更多
关键词 etl 数据库 数据 数据转换
下载PDF
电信经营分析系统中抽取转换子系统的设计与实现
20
作者 周亚宁 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第6期688-691,共4页
针对电信运营分析系统的特殊要求,仔细分析了系统的数据源情况和数据转换要求,设计并实现了一个能够完成经营分析系统数据抽取转换工具.
关键词 经营分析系统 etl 数据抽取 数据转换 数据
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部