期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
71
篇文章
<
1
2
…
4
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于XML的数据转换系统SuperETL
被引量:
4
1
作者
柴胜
周云轩
+2 位作者
黄永平
王洪媛
王云霄
《计算机应用研究》
CSCD
北大核心
2006年第1期16-18,共3页
针对政府机构和企事业单位对数据资源整合的需求,提出一个数据转换系统SuperETL,主要介绍其设计目标、体系结构,并给出了系统中任务的XML定义标准。测试结果表明,SuperETL能够高效、智能地完成数据抽取(Extract)、清洗(C leaning)、转换...
针对政府机构和企事业单位对数据资源整合的需求,提出一个数据转换系统SuperETL,主要介绍其设计目标、体系结构,并给出了系统中任务的XML定义标准。测试结果表明,SuperETL能够高效、智能地完成数据抽取(Extract)、清洗(C leaning)、转换(Transformation)、装载(Loading)及ETL任务。
展开更多
关键词
抽取
清洗
转换
装载
下载PDF
职称材料
电信经营分析系统中抽取转换子系统的设计与实现
2
作者
周亚宁
《内蒙古大学学报(自然科学版)》
CAS
CSCD
北大核心
2004年第6期688-691,共4页
针对电信运营分析系统的特殊要求,仔细分析了系统的数据源情况和数据转换要求,设计并实现了一个能够完成经营分析系统数据抽取转换工具.
关键词
经营分析系统
etl
数据
抽取
数据
转换
数据加载
下载PDF
职称材料
数据仓库中ETL技术的研究
被引量:
118
3
作者
张宁
贾自艳
史忠植
《计算机工程与应用》
CSCD
北大核心
2002年第24期213-216,共4页
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL...
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
展开更多
关键词
数据仓库
etl
数据库
数据模型
数据
抽取
数据
转换
数据清洗
数据
装载
下载PDF
职称材料
面向数据质量的ETL过程建模与实现
被引量:
23
4
作者
贾自艳
黄友平
+3 位作者
罗平
李嘉佑
秦亮曦
史忠植
《系统仿真学报》
CAS
CSCD
2004年第5期907-911,914,共6页
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程...
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。
展开更多
关键词
数据仓库
数据质量
抽取
-
转换
-
装载
(
etl
)
数据挖掘
数据清洗
下载PDF
职称材料
一种可靠的数据仓库中ETL策略与架构设计
被引量:
46
5
作者
尤玉林
张宪民
《计算机工程与应用》
CSCD
北大核心
2005年第10期172-174,229,共4页
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地...
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。
展开更多
关键词
数据仓库
etl
数据
抽取
数据
转换
数据清洗
数据
装载
下载PDF
职称材料
面向数据集成的ETL系统设计与实现
被引量:
21
6
作者
钟华
冯文澜
+1 位作者
谭红星
黄涛
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了...
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
展开更多
关键词
etl
数据集成
过程模型
数据
抽取
企业应用集成
数据仓库
转换
系统总体结构
业务数据
信息系统
下载PDF
职称材料
一种标准的ETL的设计思想及其实现
被引量:
14
7
作者
程跟上
郑洪源
丁秋林
《计算机应用研究》
CSCD
北大核心
2005年第3期101-103,共3页
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
关键词
etl
CWM
抽取
元数据
转换
元数据
加载元数据
下载PDF
职称材料
面向数据质量的ETL框架的设计与实现
被引量:
20
8
作者
李庆阳
彭宏
《计算机工程与设计》
CSCD
北大核心
2010年第9期2057-2060,共4页
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建...
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。
展开更多
关键词
数据仓库
数据质量
抽取
-
转换
-
装载
(
etl
)
规则推导
数据清洗
下载PDF
职称材料
基于关键属性比对的增量数据抽取方法
被引量:
4
9
作者
刘胜
杨岳湘
+1 位作者
邓劲生
李阳
《计算机工程与应用》
CSCD
2012年第4期115-117,共3页
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词
关键属性
增量数据
抽取
全表比对
提取
转换
加载(
etl
)
下载PDF
职称材料
公共数据中心的ETL系统设计与实现
被引量:
10
10
作者
赵俊
夏小玲
《计算机应用与软件》
CSCD
2011年第10期167-169,190,共4页
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领...
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
展开更多
关键词
etl
数据仓库
数据
抽取
数据
转换
数据质量
下载PDF
职称材料
基于大数据处理的ETL框架的研究与设计
被引量:
20
11
作者
沈琦
陈博
《电子设计工程》
2016年第2期25-27,34,共4页
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、...
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。
展开更多
关键词
大数据处理
数据
抽取
数据
转换
数据加载
etl
框架
下载PDF
职称材料
ETL架构研究
被引量:
21
12
作者
孙伟
张忠能
《微型电脑应用》
2005年第3期13-15,1,共3页
ETL(Extract、Transform、Loading)是企业数据中心(EDC)建设过程中必不可少的、最重要的环节。传统的采集模式中,整个ETL过程在一起被顺序的执行,这样对于有许多采集点(数据源)来说降低了工作效率,同时也增加了ETL的编写难度。本文提出...
ETL(Extract、Transform、Loading)是企业数据中心(EDC)建设过程中必不可少的、最重要的环节。传统的采集模式中,整个ETL过程在一起被顺序的执行,这样对于有许多采集点(数据源)来说降低了工作效率,同时也增加了ETL的编写难度。本文提出一种新的ETL方式,通过增加中间层——临时数据存储区,把ETL的三个过程拆开,形成三个独立的服务进程,采集服务进程、装载服务进程和转换服务进程,达到提升数据抽取、转换和装载的效率,同时降低ETL代码编写的复杂度。
展开更多
关键词
数据采集系统
数据处理
数据中心
数据
抽取
数据
转换
数据
装载
etl
架构
下载PDF
职称材料
基于ETL的金融数据集成过程模型
被引量:
5
13
作者
苌程
李善平
《计算机工程与设计》
CSCD
北大核心
2010年第9期2070-2072,2104,共4页
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事...
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题。通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性。
展开更多
关键词
数据
抽取
转换
装载
数据集成
元数据映射
业务规则
转换
按需交互
下载PDF
职称材料
基于电信行业的ETL系统的设计与实现
被引量:
1
14
作者
刘强
翁惠玉
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期30-31,42,共3页
基于电信行业的数据仓库,对其数据抽取、数据转换和数据装载的实现方法进行了探讨,这些方法对其他行业数据仓库的构建具有 借鉴作用。
关键词
数据仓库
etl
数据
抽取
数据
转换
数据
装载
下载PDF
职称材料
ETL技术在监测中心数据集成中的应用
被引量:
9
15
作者
朱重吉
岑柏霖
+1 位作者
罗金全
谢国俊
《广西电力》
2010年第6期28-29,48,共3页
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集...
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集成过程中ELT技术的应用,并提出1套电网范围内在线监测数据抽取、转换和加载的整体解决方案。
展开更多
关键词
etl
在线监测
数据集成
抽取
转换
下载PDF
职称材料
零售业数据仓库中ETL技术的研究
被引量:
1
16
作者
黄丽娟
郑雪峰
靳风荣
《计算机与现代化》
2004年第9期63-65,共3页
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际...
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。
展开更多
关键词
零售业
数据仓库
etl
数据
抽取
数据
转换
数据清洗
数据加载
下载PDF
职称材料
半结构化数据装载到数据仓库的设计与实现
被引量:
1
17
作者
王静婷
王艳丽
王振辉
《计算机与数字工程》
2014年第11期2198-2201,共4页
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo.xml)为例,利用DOM对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XML文件进行数据仓库...
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo.xml)为例,利用DOM对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XML文件进行数据仓库数据加载的弊端,为XML半结构化数据的抽取并装载到数据仓库当前细节级中的这一问题的解决进行了有益的探索。
展开更多
关键词
XML数据
DOM对象
半结构化数据
抽取
装载
etl
工具
数据仓库
下载PDF
职称材料
基于水厂数据仓库系统的ETL技术研究
被引量:
1
18
作者
洪东忍
《云南民族大学学报(自然科学版)》
CAS
2012年第5期365-369,共5页
ETL是指数据抽取(extract)、转换(transform)、装载(load)的过程,是数据仓库构建过程中的核心环节和技术难点.基于水厂数据仓库系统,研究了如何运用ETL技术实现水厂数据仓库中数据的抽取、转换和装载.
关键词
数据仓库
etl
数据
抽取
转换
装载
下载PDF
职称材料
ETL开发实施中质量保证的关键步骤
被引量:
2
19
作者
郑承满
石爱华
刘宏吉
《中国金融电脑》
2006年第1期60-62,共3页
关键词
质量保证
开发
etl
数据仓库项目
数据标准化
质量问题
数据
抽取
项目实施
仓库建设
转换
过程
下载PDF
职称材料
ETL在青海省电力公司数据中心系统中的应用
被引量:
5
20
作者
白莉珍
《青海电力》
2008年第2期62-64,共3页
依据国家电网公司"SG186"工程的总体规划,青海省电力公司于2006年11月开始实施青海电力公司数据中心项目。ETL作为数据中心系统的关键部件,主要完成数据抽取、清洗、转换和装载工作,它是构建数据中心的重要环节,同时也是构建...
依据国家电网公司"SG186"工程的总体规划,青海省电力公司于2006年11月开始实施青海电力公司数据中心项目。ETL作为数据中心系统的关键部件,主要完成数据抽取、清洗、转换和装载工作,它是构建数据中心的重要环节,同时也是构建数据中心过程中出现问题最多的环节。文章通过ETL技术在青海电力公司数据中心项目中的应用,介绍了ETL的功能及作用,同时对ETL的数据处理过程做了详细的论述。
展开更多
关键词
数据中心
etl
数据
抽取
数据
转换
数据清洗
数据
装载
下载PDF
职称材料
题名
基于XML的数据转换系统SuperETL
被引量:
4
1
作者
柴胜
周云轩
黄永平
王洪媛
王云霄
机构
吉林大学计算机科学与技术学院
吉林大学地球探测科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2006年第1期16-18,共3页
基金
国家"863"计划资助项目(2003AA118020)
教育部高等学校优秀青年教师教学科研奖励计划资助项目
文摘
针对政府机构和企事业单位对数据资源整合的需求,提出一个数据转换系统SuperETL,主要介绍其设计目标、体系结构,并给出了系统中任务的XML定义标准。测试结果表明,SuperETL能够高效、智能地完成数据抽取(Extract)、清洗(C leaning)、转换(Transformation)、装载(Loading)及ETL任务。
关键词
抽取
清洗
转换
装载
Keywords
Extract
Cleaning
Transformation
Loading
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
电信经营分析系统中抽取转换子系统的设计与实现
2
作者
周亚宁
机构
内蒙古通信公司
出处
《内蒙古大学学报(自然科学版)》
CAS
CSCD
北大核心
2004年第6期688-691,共4页
文摘
针对电信运营分析系统的特殊要求,仔细分析了系统的数据源情况和数据转换要求,设计并实现了一个能够完成经营分析系统数据抽取转换工具.
关键词
经营分析系统
etl
数据
抽取
数据
转换
数据加载
Keywords
operation analysis system
etl
data extraction
data transformation
data loading
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数据仓库中ETL技术的研究
被引量:
118
3
作者
张宁
贾自艳
史忠植
机构
中国科技大学研究生院计算机学部
中科院计算技术研究所智能信息处理重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2002年第24期213-216,共4页
基金
国家自然科学基金(编号:60173017
90104021)
北京自然科学基金(编号:4011003)
文摘
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
关键词
数据仓库
etl
数据库
数据模型
数据
抽取
数据
转换
数据清洗
数据
装载
Keywords
Data warehouse,
etl
,Data Extract,Data Transform,Data Cleansing,Data Loading
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据质量的ETL过程建模与实现
被引量:
23
4
作者
贾自艳
黄友平
罗平
李嘉佑
秦亮曦
史忠植
机构
中国科学院计算技术研究所智能信息处理重点实验室
出处
《系统仿真学报》
CAS
CSCD
2004年第5期907-911,914,共6页
基金
国家自然科学基金(60173017
90104021)
北京自然科学基金(4011003)
文摘
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。
关键词
数据仓库
数据质量
抽取
-
转换
-
装载
(
etl
)
数据挖掘
数据清洗
Keywords
data warehouse
data quality
extraction-transformation-loading (
etl
)
data mining
data cleaning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种可靠的数据仓库中ETL策略与架构设计
被引量:
46
5
作者
尤玉林
张宪民
机构
上海交通大学图像处理与模式识别研究所
出处
《计算机工程与应用》
CSCD
北大核心
2005年第10期172-174,229,共4页
文摘
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。
关键词
数据仓库
etl
数据
抽取
数据
转换
数据清洗
数据
装载
Keywords
data warehouse,
etl
,data extract,data transform,data clean,data loading
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据集成的ETL系统设计与实现
被引量:
21
6
作者
钟华
冯文澜
谭红星
黄涛
机构
中国科学院软件研究所计算机科学重点实验室
中国科学院软件研究所软件工程技术中心
出处
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
基金
国家863高科技发展计划项目(编号Z002AA113040)
国家重点基础研究发展规划973项目(编号2002CB312005)的资助
文摘
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
关键词
etl
数据集成
过程模型
数据
抽取
企业应用集成
数据仓库
转换
系统总体结构
业务数据
信息系统
Keywords
Data integration,Data warehouse,
etl
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
F626 [经济管理—产业经济]
下载PDF
职称材料
题名
一种标准的ETL的设计思想及其实现
被引量:
14
7
作者
程跟上
郑洪源
丁秋林
机构
南京航空航天大学信息科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2005年第3期101-103,共3页
文摘
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
关键词
etl
CWM
抽取
元数据
转换
元数据
加载元数据
Keywords
etl
(Etract-Transform-Load)
CWM(Common Warehouse Metamodel)
Metadata about Extract
Metadata about Transformation
Metadata about Load
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据质量的ETL框架的设计与实现
被引量:
20
8
作者
李庆阳
彭宏
机构
华南理工大学计算机科学与工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2057-2060,共4页
基金
广东省自然科学基金项目(07006474)
广东省科技攻关基金项目(2007B010200044)
文摘
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。
关键词
数据仓库
数据质量
抽取
-
转换
-
装载
(
etl
)
规则推导
数据清洗
Keywords
data warehouse
data quality
extract-transform-load (
etl
)
rule deduction
data cleaning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于关键属性比对的增量数据抽取方法
被引量:
4
9
作者
刘胜
杨岳湘
邓劲生
李阳
机构
国防科技大学计算机学院
国防科技大学信息中心
出处
《计算机工程与应用》
CSCD
2012年第4期115-117,共3页
文摘
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词
关键属性
增量数据
抽取
全表比对
提取
转换
加载(
etl
)
Keywords
pivotal attributes
incremental data extraction
entire table contract
Extraction Transformation Loading(
etl
)
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
公共数据中心的ETL系统设计与实现
被引量:
10
10
作者
赵俊
夏小玲
机构
东华大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2011年第10期167-169,190,共4页
文摘
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
关键词
etl
数据仓库
数据
抽取
数据
转换
数据质量
Keywords
etl
Data warehouse Data extraction Data transform Data quality
分类号
TP311.133 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于大数据处理的ETL框架的研究与设计
被引量:
20
11
作者
沈琦
陈博
机构
北京工业大学
出处
《电子设计工程》
2016年第2期25-27,34,共4页
文摘
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。
关键词
大数据处理
数据
抽取
数据
转换
数据加载
etl
框架
Keywords
data processing
data extraction
data conversion
data loading
etl
framework
分类号
TN709 [电子电信—电路与系统]
下载PDF
职称材料
题名
ETL架构研究
被引量:
21
12
作者
孙伟
张忠能
机构
上海交通大学软件学院
出处
《微型电脑应用》
2005年第3期13-15,1,共3页
文摘
ETL(Extract、Transform、Loading)是企业数据中心(EDC)建设过程中必不可少的、最重要的环节。传统的采集模式中,整个ETL过程在一起被顺序的执行,这样对于有许多采集点(数据源)来说降低了工作效率,同时也增加了ETL的编写难度。本文提出一种新的ETL方式,通过增加中间层——临时数据存储区,把ETL的三个过程拆开,形成三个独立的服务进程,采集服务进程、装载服务进程和转换服务进程,达到提升数据抽取、转换和装载的效率,同时降低ETL代码编写的复杂度。
关键词
数据采集系统
数据处理
数据中心
数据
抽取
数据
转换
数据
装载
etl
架构
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于ETL的金融数据集成过程模型
被引量:
5
13
作者
苌程
李善平
机构
浙江大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2070-2072,2104,共4页
文摘
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题。通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性。
关键词
数据
抽取
转换
装载
数据集成
元数据映射
业务规则
转换
按需交互
Keywords
etl
data integration
metadata mapping
business rule transform
on demand request
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于电信行业的ETL系统的设计与实现
被引量:
1
14
作者
刘强
翁惠玉
机构
上海交通大学软件学院
上海交通大学计算机系
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期30-31,42,共3页
文摘
基于电信行业的数据仓库,对其数据抽取、数据转换和数据装载的实现方法进行了探讨,这些方法对其他行业数据仓库的构建具有 借鉴作用。
关键词
数据仓库
etl
数据
抽取
数据
转换
数据
装载
Keywords
Data warehouse
etl
Data extract
Data transform
Data loading
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
ETL技术在监测中心数据集成中的应用
被引量:
9
15
作者
朱重吉
岑柏霖
罗金全
谢国俊
机构
广西电网公司电力科学研究院
出处
《广西电力》
2010年第6期28-29,48,共3页
文摘
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集成过程中ELT技术的应用,并提出1套电网范围内在线监测数据抽取、转换和加载的整体解决方案。
关键词
etl
在线监测
数据集成
抽取
转换
分类号
TM769 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
零售业数据仓库中ETL技术的研究
被引量:
1
16
作者
黄丽娟
郑雪峰
靳风荣
机构
广州大学计算机科学与技术系
北京科技大学信息工程学院
出处
《计算机与现代化》
2004年第9期63-65,共3页
文摘
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。
关键词
零售业
数据仓库
etl
数据
抽取
数据
转换
数据清洗
数据加载
Keywords
retail trade data warehouse
etl
data extract
data transform
data cleaning
data loading
分类号
F713.32 [经济管理—产业经济]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
半结构化数据装载到数据仓库的设计与实现
被引量:
1
17
作者
王静婷
王艳丽
王振辉
机构
西安翻译学院工程技术学院
出处
《计算机与数字工程》
2014年第11期2198-2201,共4页
基金
陕西省教育厅科研计划专项项目(编号:12JK1055)资助
文摘
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo.xml)为例,利用DOM对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XML文件进行数据仓库数据加载的弊端,为XML半结构化数据的抽取并装载到数据仓库当前细节级中的这一问题的解决进行了有益的探索。
关键词
XML数据
DOM对象
半结构化数据
抽取
装载
etl
工具
数据仓库
Keywords
XML(eXtensible Markup Language) data, DOM(Document Object Model) object, semi-structured data,extraction, loading,
etl
(Extract-Transform-Load) tool, data warehouse
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于水厂数据仓库系统的ETL技术研究
被引量:
1
18
作者
洪东忍
机构
福建教育学院
出处
《云南民族大学学报(自然科学版)》
CAS
2012年第5期365-369,共5页
文摘
ETL是指数据抽取(extract)、转换(transform)、装载(load)的过程,是数据仓库构建过程中的核心环节和技术难点.基于水厂数据仓库系统,研究了如何运用ETL技术实现水厂数据仓库中数据的抽取、转换和装载.
关键词
数据仓库
etl
数据
抽取
转换
装载
Keywords
data warehouse
etl
Extract
Transform
Load
分类号
TP392 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
ETL开发实施中质量保证的关键步骤
被引量:
2
19
作者
郑承满
石爱华
刘宏吉
机构
中国建设银行信息技术管理部厦门开发中心
出处
《中国金融电脑》
2006年第1期60-62,共3页
关键词
质量保证
开发
etl
数据仓库项目
数据标准化
质量问题
数据
抽取
项目实施
仓库建设
转换
过程
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
ETL在青海省电力公司数据中心系统中的应用
被引量:
5
20
作者
白莉珍
机构
西宁供电公司信息通讯中心
出处
《青海电力》
2008年第2期62-64,共3页
文摘
依据国家电网公司"SG186"工程的总体规划,青海省电力公司于2006年11月开始实施青海电力公司数据中心项目。ETL作为数据中心系统的关键部件,主要完成数据抽取、清洗、转换和装载工作,它是构建数据中心的重要环节,同时也是构建数据中心过程中出现问题最多的环节。文章通过ETL技术在青海电力公司数据中心项目中的应用,介绍了ETL的功能及作用,同时对ETL的数据处理过程做了详细的论述。
关键词
数据中心
etl
数据
抽取
数据
转换
数据清洗
数据
装载
Keywords
information center
etl
data sample
data transformation
data cleanout
data load
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于XML的数据转换系统SuperETL
柴胜
周云轩
黄永平
王洪媛
王云霄
《计算机应用研究》
CSCD
北大核心
2006
4
下载PDF
职称材料
2
电信经营分析系统中抽取转换子系统的设计与实现
周亚宁
《内蒙古大学学报(自然科学版)》
CAS
CSCD
北大核心
2004
0
下载PDF
职称材料
3
数据仓库中ETL技术的研究
张宁
贾自艳
史忠植
《计算机工程与应用》
CSCD
北大核心
2002
118
下载PDF
职称材料
4
面向数据质量的ETL过程建模与实现
贾自艳
黄友平
罗平
李嘉佑
秦亮曦
史忠植
《系统仿真学报》
CAS
CSCD
2004
23
下载PDF
职称材料
5
一种可靠的数据仓库中ETL策略与架构设计
尤玉林
张宪民
《计算机工程与应用》
CSCD
北大核心
2005
46
下载PDF
职称材料
6
面向数据集成的ETL系统设计与实现
钟华
冯文澜
谭红星
黄涛
《计算机科学》
CSCD
北大核心
2004
21
下载PDF
职称材料
7
一种标准的ETL的设计思想及其实现
程跟上
郑洪源
丁秋林
《计算机应用研究》
CSCD
北大核心
2005
14
下载PDF
职称材料
8
面向数据质量的ETL框架的设计与实现
李庆阳
彭宏
《计算机工程与设计》
CSCD
北大核心
2010
20
下载PDF
职称材料
9
基于关键属性比对的增量数据抽取方法
刘胜
杨岳湘
邓劲生
李阳
《计算机工程与应用》
CSCD
2012
4
下载PDF
职称材料
10
公共数据中心的ETL系统设计与实现
赵俊
夏小玲
《计算机应用与软件》
CSCD
2011
10
下载PDF
职称材料
11
基于大数据处理的ETL框架的研究与设计
沈琦
陈博
《电子设计工程》
2016
20
下载PDF
职称材料
12
ETL架构研究
孙伟
张忠能
《微型电脑应用》
2005
21
下载PDF
职称材料
13
基于ETL的金融数据集成过程模型
苌程
李善平
《计算机工程与设计》
CSCD
北大核心
2010
5
下载PDF
职称材料
14
基于电信行业的ETL系统的设计与实现
刘强
翁惠玉
《计算机工程》
CAS
CSCD
北大核心
2004
1
下载PDF
职称材料
15
ETL技术在监测中心数据集成中的应用
朱重吉
岑柏霖
罗金全
谢国俊
《广西电力》
2010
9
下载PDF
职称材料
16
零售业数据仓库中ETL技术的研究
黄丽娟
郑雪峰
靳风荣
《计算机与现代化》
2004
1
下载PDF
职称材料
17
半结构化数据装载到数据仓库的设计与实现
王静婷
王艳丽
王振辉
《计算机与数字工程》
2014
1
下载PDF
职称材料
18
基于水厂数据仓库系统的ETL技术研究
洪东忍
《云南民族大学学报(自然科学版)》
CAS
2012
1
下载PDF
职称材料
19
ETL开发实施中质量保证的关键步骤
郑承满
石爱华
刘宏吉
《中国金融电脑》
2006
2
下载PDF
职称材料
20
ETL在青海省电力公司数据中心系统中的应用
白莉珍
《青海电力》
2008
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
4
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部