期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
130
篇文章
<
1
2
…
7
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于工作流的数据抽取转换加载
被引量:
5
1
作者
谭支鹏
冯丹
+1 位作者
吴永英
彭峰
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第2期61-63,69,共4页
将数据的抽取转换加载(ETL)过程和工作流技术结合起来,研究了ETL过程的工作流调度问题,设计了一种简单串行和稳定可靠的循环遍历算法.为了提高ETL效率,将并行机制引入到节点访问算法中,对节点访问算法进行了改进,设计了新的节点访问算法...
将数据的抽取转换加载(ETL)过程和工作流技术结合起来,研究了ETL过程的工作流调度问题,设计了一种简单串行和稳定可靠的循环遍历算法.为了提高ETL效率,将并行机制引入到节点访问算法中,对节点访问算法进行了改进,设计了新的节点访问算法,并讨论了加入并行机制后可能会遇到的数据源并发控制等问题,并给出了解决方法.所提出的方法对提高数据集成效率很有效,在国产数据库系统的应用中可起到积极推动作用.
展开更多
关键词
数据
的
抽取
转换
加
载
数据
仓库
数据
迁移
工作流
下载PDF
职称材料
面向空间数据抽取、转换、加载的元数据管理系统实现
2
作者
唐捷
《电脑编程技巧与维护》
2011年第8期52-55,共4页
空间数据仓库技术是为地理信息以及为社会经济发展提供高质量的决策信息而产生的技术,而空间数据抽取、转换和加载(ETL)是构建空间数据仓库必经的步骤,空间ETL过程面临的主要难点是空间数据的多源异质性问题。采用元数据技术辅助空间ET...
空间数据仓库技术是为地理信息以及为社会经济发展提供高质量的决策信息而产生的技术,而空间数据抽取、转换和加载(ETL)是构建空间数据仓库必经的步骤,空间ETL过程面临的主要难点是空间数据的多源异质性问题。采用元数据技术辅助空间ETL方法,实现了空间元数据管理系统。
展开更多
关键词
空间
数据
抽取、
转换
、
加
载
空间元
数据
元
数据
库管理系统
下载PDF
职称材料
基于ETL技术的多源异构数据融合方法研究
3
作者
杨国立
姜树明
《齐鲁工业大学学报》
CAS
2024年第4期18-24,共7页
在多源大数据融合阶段处理历年异构的数据时,涉及到多指标和多维度的问题,需要清洗、转换、映射和对齐等操作。相关数据处理工具和方法逐步涌现,但仍难以解决大量数据的交叉融合问题。为此,研究了基于ETL技术的多源异构数据融合方法,分...
在多源大数据融合阶段处理历年异构的数据时,涉及到多指标和多维度的问题,需要清洗、转换、映射和对齐等操作。相关数据处理工具和方法逐步涌现,但仍难以解决大量数据的交叉融合问题。为此,研究了基于ETL技术的多源异构数据融合方法,分析了常用的ETL工具和数据融合技术,包括数据抽取、转换、加载工具以及数据处理算法。分析了面向灵活需求、业务交叉较多和实时数据流场景时,遇到的数据源异构、数据结构差异、数据更新频率困难等问题,并从模块化设计、逻辑和参数分离、标准化构件库、轻量级JSON格式的配置文件等方面研究了ETL工具模块化扩展和构件重复使用的方法,以便更好地处理大规模异构数据。解决了多源大数据融合阶段的交叉融合问题,对提高数据处理效率、确保数据质量以及支持更深入的数据分析和决策具有重要意义。
展开更多
关键词
教育统计
数据
挖掘
转换
-
抽取
-
加
载
软件工程
下载PDF
职称材料
ETL中的数据增量抽取机制研究
被引量:
34
4
作者
戴浩
杨波
《计算机工程与设计》
CSCD
北大核心
2009年第23期5552-5555,共4页
为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4...
为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4个方面分析和比较了各种数据增量抽取机制的优劣性。最后,总结了选取数据增量抽取机制所应遵循的主要原则和标准。
展开更多
关键词
数据
抽取
转换
与
加
载
增量
抽取
数据
仓库
商业智能
下载PDF
职称材料
录井现场地质数据网络加载技术应用研究方法探讨
5
作者
牛丽岩
《信息系统工程》
2014年第9期135-135,共1页
为了实现录井数据的电子化、数据共享,为生产应用人员、科研人员提供丰富的数据基础,大庆油田地质录井一公司建立了录井专业数据库,现场地质数据也是该数据库的重要组成部分之一。这些数据怎么能方便、高效地保存到数据库中,这就是本文...
为了实现录井数据的电子化、数据共享,为生产应用人员、科研人员提供丰富的数据基础,大庆油田地质录井一公司建立了录井专业数据库,现场地质数据也是该数据库的重要组成部分之一。这些数据怎么能方便、高效地保存到数据库中,这就是本文所要阐述的问题。
展开更多
关键词
现场报表
地质
数据
加
载
转换
下载PDF
职称材料
数字化转型浪潮下高校数据治理框架设计
6
作者
潘燕红
《科技视界》
2024年第7期28-31,共4页
随着数字技术的快速发展与应用,全球掀起了数字化转型浪潮,数据治理已成为当前高校探索教育数字化转型过程中的重要课题。在分析当前高校数据治理现状的基础上,采用数据存储分层建设思路,研究设计了基于数据中台的高校数据治理框架,加...
随着数字技术的快速发展与应用,全球掀起了数字化转型浪潮,数据治理已成为当前高校探索教育数字化转型过程中的重要课题。在分析当前高校数据治理现状的基础上,采用数据存储分层建设思路,研究设计了基于数据中台的高校数据治理框架,加强顶层设计,自下而上逐步推进数据采集、数据存储、数据管理和数据应用,实现高校数据的全生命周期管理。
展开更多
关键词
教育数字化转型
数据
治理
数据
中台
数据
抽取、
转换和
装
载
(
etl
)
下载PDF
职称材料
数据仓库中ETL技术的研究
被引量:
117
7
作者
张宁
贾自艳
史忠植
《计算机工程与应用》
CSCD
北大核心
2002年第24期213-216,共4页
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL...
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
展开更多
关键词
数据
仓库
etl
数据
库
数据
模型
数据
抽取
数据
转换
数据
清洗
数据
装
载
下载PDF
职称材料
面向数据质量的ETL过程建模与实现
被引量:
23
8
作者
贾自艳
黄友平
+3 位作者
罗平
李嘉佑
秦亮曦
史忠植
《系统仿真学报》
CAS
CSCD
2004年第5期907-911,914,共6页
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程...
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。
展开更多
关键词
数据
仓库
数据
质量
抽取
-
转换
-装
载
(
etl
)
数据
挖掘
数据
清洗
下载PDF
职称材料
面向数据集成的ETL系统设计与实现
被引量:
21
9
作者
钟华
冯文澜
+1 位作者
谭红星
黄涛
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了...
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
展开更多
关键词
etl
数据
集成
过程模型
数据
抽取
企业应用集成
数据
仓库
转换
系统总体结构
业务
数据
信息系统
下载PDF
职称材料
一种可靠的数据仓库中ETL策略与架构设计
被引量:
46
10
作者
尤玉林
张宪民
《计算机工程与应用》
CSCD
北大核心
2005年第10期172-174,229,共4页
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地...
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。
展开更多
关键词
数据
仓库
etl
数据
抽取
数据
转换
数据
清洗
数据
装
载
下载PDF
职称材料
一种通用的多数据库间数据抽取方法及应用
被引量:
16
11
作者
刘如九
张振山
柴天佑
《北京交通大学学报》
EI
CAS
CSCD
北大核心
2008年第4期14-18,共5页
为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽...
为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽取转换基于抽取规则,抽取规则采用可视化方法编辑生成;抽取规则存储于规则库,供多次调用修改;多个抽取任务组成抽取任务队列.开发的抽取工具软件DbBridge,支持从Oracle,SQL Server,SAS,Access,Excel等数据源抽取数据.软件成功应用于某数据仓库的建立及数据迁移工作.
展开更多
关键词
数据
仓库
数据
的
抽取
转换
加
载
数据
迁移
关系型
数据
库
下载PDF
职称材料
基于关键属性比对的增量数据抽取方法
被引量:
4
12
作者
刘胜
杨岳湘
+1 位作者
邓劲生
李阳
《计算机工程与应用》
CSCD
2012年第4期115-117,共3页
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词
关键属性
增量
数据
抽取
全表比对
提取
转换
加
载
(
etl
)
下载PDF
职称材料
数据仓库ETL元模型设计
被引量:
9
13
作者
宋旭东
闫晓岚
+1 位作者
刘晓冰
杨莉国
《计算机仿真》
CSCD
北大核心
2010年第9期106-108,119,共4页
针对传统的ETL(Extract/Transform/Load)开发方法难以满足企业的决策需求,复杂性和高效性是ETL开发面临的两大主要问题。为此,在数据仓库系统统一集成建模框架下,为提高管理质量和快速性,提出一种数据仓库ETL元模型设计方法,取代了以往...
针对传统的ETL(Extract/Transform/Load)开发方法难以满足企业的决策需求,复杂性和高效性是ETL开发面临的两大主要问题。为此,在数据仓库系统统一集成建模框架下,为提高管理质量和快速性,提出一种数据仓库ETL元模型设计方法,取代了以往在特定的数据仓库中对ETL建模的方法,使得ETL过程较早地进入数据仓库设计阶段,实现了ETL与数据仓库在概念层上的无缝融合,减少了开发时间和成本代价。最后通过模型实际应用,验证了方法的可行性和高效性。
展开更多
关键词
数据
仓库
抽取
-
转换
-
加
载
统一建模语言扩展
元模型
下载PDF
职称材料
面向数据质量的ETL框架的设计与实现
被引量:
20
14
作者
李庆阳
彭宏
《计算机工程与设计》
CSCD
北大核心
2010年第9期2057-2060,共4页
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建...
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。
展开更多
关键词
数据
仓库
数据
质量
抽取
-
转换
-装
载
(
etl
)
规则推导
数据
清洗
下载PDF
职称材料
公共数据中心的ETL系统设计与实现
被引量:
10
15
作者
赵俊
夏小玲
《计算机应用与软件》
CSCD
2011年第10期167-169,190,共4页
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领...
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
展开更多
关键词
etl
数据
仓库
数据
抽取
数据
转换
数据
质量
下载PDF
职称材料
基于大数据处理的ETL框架的研究与设计
被引量:
20
16
作者
沈琦
陈博
《电子设计工程》
2016年第2期25-27,34,共4页
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、...
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。
展开更多
关键词
大
数据
处理
数据
抽取
数据
转换
数据
加
载
etl
框架
下载PDF
职称材料
零售业数据仓库中ETL技术的研究
被引量:
1
17
作者
黄丽娟
郑雪峰
靳风荣
《计算机与现代化》
2004年第9期63-65,共3页
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际...
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。
展开更多
关键词
零售业
数据
仓库
etl
数据
抽取
数据
转换
数据
清洗
数据
加
载
下载PDF
职称材料
ETL技术在监测中心数据集成中的应用
被引量:
9
18
作者
朱重吉
岑柏霖
+1 位作者
罗金全
谢国俊
《广西电力》
2010年第6期28-29,48,共3页
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集...
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集成过程中ELT技术的应用,并提出1套电网范围内在线监测数据抽取、转换和加载的整体解决方案。
展开更多
关键词
etl
在线监测
数据
集成
抽取
转换
下载PDF
职称材料
数据仓库实现中ETL的应用研究
被引量:
3
19
作者
先晓兵
常晋义
《计算机与现代化》
2007年第10期43-46,共4页
通过外贸业务分析决策系统的实现,探讨在数据仓库项目应用过程中,如何针对来自不同应用系统、不同数据平台、不同数据源形式的源数据系统存在的数据质量的差异性、缺乏一致性等问题,设计较好的ETL(Extract,Transform,Load)过程解决方案...
通过外贸业务分析决策系统的实现,探讨在数据仓库项目应用过程中,如何针对来自不同应用系统、不同数据平台、不同数据源形式的源数据系统存在的数据质量的差异性、缺乏一致性等问题,设计较好的ETL(Extract,Transform,Load)过程解决方案,将数据从源数据系统中抽取、转换成数据仓库需要的格式和统一数据类型,并正确加载到数据仓库中,为决策支持系统的实现提供高质量的基础数据。
展开更多
关键词
数据
仓库
数据
提取
数据
转换
数据
加
载
DTS(
数据
转换
系统)
下载PDF
职称材料
面向ETL的数据起源追踪系统
被引量:
1
20
作者
戴超凡
王涛
《计算机工程》
CAS
CSCD
北大核心
2011年第17期256-258,261,共4页
提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行...
提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行相关处理,构建各个层次的转换起源信息图,从而实现数据起源的追踪。
展开更多
关键词
数据
起源
起源管理系统
提取-
转换
-
加
载
同步/异步
转换
下载PDF
职称材料
题名
基于工作流的数据抽取转换加载
被引量:
5
1
作者
谭支鹏
冯丹
吴永英
彭峰
机构
华中科技大学计算机科学与技术学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第2期61-63,69,共4页
基金
霍英东教育基金资助项目(91068)
文摘
将数据的抽取转换加载(ETL)过程和工作流技术结合起来,研究了ETL过程的工作流调度问题,设计了一种简单串行和稳定可靠的循环遍历算法.为了提高ETL效率,将并行机制引入到节点访问算法中,对节点访问算法进行了改进,设计了新的节点访问算法,并讨论了加入并行机制后可能会遇到的数据源并发控制等问题,并给出了解决方法.所提出的方法对提高数据集成效率很有效,在国产数据库系统的应用中可起到积极推动作用.
关键词
数据
的
抽取
转换
加
载
数据
仓库
数据
迁移
工作流
Keywords
extraction-transformation-loading
data warehouse
data transformation
workflow
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向空间数据抽取、转换、加载的元数据管理系统实现
2
作者
唐捷
机构
江汉艺术职业学院
出处
《电脑编程技巧与维护》
2011年第8期52-55,共4页
基金
广东省科技厅资助项目
基于XML公益性空间信息服务系统研究(No.2005B30801006)
文摘
空间数据仓库技术是为地理信息以及为社会经济发展提供高质量的决策信息而产生的技术,而空间数据抽取、转换和加载(ETL)是构建空间数据仓库必经的步骤,空间ETL过程面临的主要难点是空间数据的多源异质性问题。采用元数据技术辅助空间ETL方法,实现了空间元数据管理系统。
关键词
空间
数据
抽取、
转换
、
加
载
空间元
数据
元
数据
库管理系统
Keywords
Spatial data extraction
Translation and loading
Spatial metadata
metadata database Management system
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于ETL技术的多源异构数据融合方法研究
3
作者
杨国立
姜树明
机构
浪潮通用软件有限公司
齐鲁工业大学(山东省科学院)情报研究所
出处
《齐鲁工业大学学报》
CAS
2024年第4期18-24,共7页
基金
国家重点研发计划项目(2019YFB1404700)。
文摘
在多源大数据融合阶段处理历年异构的数据时,涉及到多指标和多维度的问题,需要清洗、转换、映射和对齐等操作。相关数据处理工具和方法逐步涌现,但仍难以解决大量数据的交叉融合问题。为此,研究了基于ETL技术的多源异构数据融合方法,分析了常用的ETL工具和数据融合技术,包括数据抽取、转换、加载工具以及数据处理算法。分析了面向灵活需求、业务交叉较多和实时数据流场景时,遇到的数据源异构、数据结构差异、数据更新频率困难等问题,并从模块化设计、逻辑和参数分离、标准化构件库、轻量级JSON格式的配置文件等方面研究了ETL工具模块化扩展和构件重复使用的方法,以便更好地处理大规模异构数据。解决了多源大数据融合阶段的交叉融合问题,对提高数据处理效率、确保数据质量以及支持更深入的数据分析和决策具有重要意义。
关键词
教育统计
数据
挖掘
转换
-
抽取
-
加
载
软件工程
Keywords
educational statistics
data mining
extract-transform-load
software engineering
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
ETL中的数据增量抽取机制研究
被引量:
34
4
作者
戴浩
杨波
机构
广东邮电职业技术学院计算机系
广州粤信计算机科技有限公司
出处
《计算机工程与设计》
CSCD
北大核心
2009年第23期5552-5555,共4页
基金
国家科技型中小企业技术创新基金项目(08C26214401212)
文摘
为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4个方面分析和比较了各种数据增量抽取机制的优劣性。最后,总结了选取数据增量抽取机制所应遵循的主要原则和标准。
关键词
数据
抽取
转换
与
加
载
增量
抽取
数据
仓库
商业智能
Keywords
etl
incremental data extraction
data warehouse
business intelligence
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
录井现场地质数据网络加载技术应用研究方法探讨
5
作者
牛丽岩
机构
大庆钻探工程公司地质录井一公司信息中心
出处
《信息系统工程》
2014年第9期135-135,共1页
文摘
为了实现录井数据的电子化、数据共享,为生产应用人员、科研人员提供丰富的数据基础,大庆油田地质录井一公司建立了录井专业数据库,现场地质数据也是该数据库的重要组成部分之一。这些数据怎么能方便、高效地保存到数据库中,这就是本文所要阐述的问题。
关键词
现场报表
地质
数据
加
载
转换
分类号
TE142 [石油与天然气工程—油气勘探]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数字化转型浪潮下高校数据治理框架设计
6
作者
潘燕红
机构
湄洲湾职业技术学院
出处
《科技视界》
2024年第7期28-31,共4页
基金
2023年度湄洲湾职业技术学院职业教育研究专项课题,项目名称“职业教育数字化转型背景下高校数据治理研究”(ZJYJ003)。
文摘
随着数字技术的快速发展与应用,全球掀起了数字化转型浪潮,数据治理已成为当前高校探索教育数字化转型过程中的重要课题。在分析当前高校数据治理现状的基础上,采用数据存储分层建设思路,研究设计了基于数据中台的高校数据治理框架,加强顶层设计,自下而上逐步推进数据采集、数据存储、数据管理和数据应用,实现高校数据的全生命周期管理。
关键词
教育数字化转型
数据
治理
数据
中台
数据
抽取、
转换和
装
载
(
etl
)
分类号
G64 [文化科学—高等教育学]
下载PDF
职称材料
题名
数据仓库中ETL技术的研究
被引量:
117
7
作者
张宁
贾自艳
史忠植
机构
中国科技大学研究生院计算机学部
中科院计算技术研究所智能信息处理重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2002年第24期213-216,共4页
基金
国家自然科学基金(编号:60173017
90104021)
北京自然科学基金(编号:4011003)
文摘
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
关键词
数据
仓库
etl
数据
库
数据
模型
数据
抽取
数据
转换
数据
清洗
数据
装
载
Keywords
Data warehouse,
etl
,Data Extract,Data Transform,Data Cleansing,Data Loading
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据质量的ETL过程建模与实现
被引量:
23
8
作者
贾自艳
黄友平
罗平
李嘉佑
秦亮曦
史忠植
机构
中国科学院计算技术研究所智能信息处理重点实验室
出处
《系统仿真学报》
CAS
CSCD
2004年第5期907-911,914,共6页
基金
国家自然科学基金(60173017
90104021)
北京自然科学基金(4011003)
文摘
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。
关键词
数据
仓库
数据
质量
抽取
-
转换
-装
载
(
etl
)
数据
挖掘
数据
清洗
Keywords
data warehouse
data quality
extraction-transformation-loading (
etl
)
data mining
data cleaning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据集成的ETL系统设计与实现
被引量:
21
9
作者
钟华
冯文澜
谭红星
黄涛
机构
中国科学院软件研究所计算机科学重点实验室
中国科学院软件研究所软件工程技术中心
出处
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
基金
国家863高科技发展计划项目(编号Z002AA113040)
国家重点基础研究发展规划973项目(编号2002CB312005)的资助
文摘
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
关键词
etl
数据
集成
过程模型
数据
抽取
企业应用集成
数据
仓库
转换
系统总体结构
业务
数据
信息系统
Keywords
Data integration,Data warehouse,
etl
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
F626 [经济管理—产业经济]
下载PDF
职称材料
题名
一种可靠的数据仓库中ETL策略与架构设计
被引量:
46
10
作者
尤玉林
张宪民
机构
上海交通大学图像处理与模式识别研究所
出处
《计算机工程与应用》
CSCD
北大核心
2005年第10期172-174,229,共4页
文摘
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。
关键词
数据
仓库
etl
数据
抽取
数据
转换
数据
清洗
数据
装
载
Keywords
data warehouse,
etl
,data extract,data transform,data clean,data loading
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种通用的多数据库间数据抽取方法及应用
被引量:
16
11
作者
刘如九
张振山
柴天佑
机构
东北大学流程工业综合自动化教育部重点实验室
出处
《北京交通大学学报》
EI
CAS
CSCD
北大核心
2008年第4期14-18,共5页
基金
国家“863”高技术项目(2006AA04Z17)
国家自然科学基金资助项目(60534010)
文摘
为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽取转换基于抽取规则,抽取规则采用可视化方法编辑生成;抽取规则存储于规则库,供多次调用修改;多个抽取任务组成抽取任务队列.开发的抽取工具软件DbBridge,支持从Oracle,SQL Server,SAS,Access,Excel等数据源抽取数据.软件成功应用于某数据仓库的建立及数据迁移工作.
关键词
数据
仓库
数据
的
抽取
转换
加
载
数据
迁移
关系型
数据
库
Keywords
data warehouses
extraction-transformation-loading (
etl
)
data processing
relationaldatabase systems
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于关键属性比对的增量数据抽取方法
被引量:
4
12
作者
刘胜
杨岳湘
邓劲生
李阳
机构
国防科技大学计算机学院
国防科技大学信息中心
出处
《计算机工程与应用》
CSCD
2012年第4期115-117,共3页
文摘
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词
关键属性
增量
数据
抽取
全表比对
提取
转换
加
载
(
etl
)
Keywords
pivotal attributes
incremental data extraction
entire table contract
Extraction Transformation Loading(
etl
)
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数据仓库ETL元模型设计
被引量:
9
13
作者
宋旭东
闫晓岚
刘晓冰
杨莉国
机构
大连交通大学软件学院
大连理工大学CIMS
出处
《计算机仿真》
CSCD
北大核心
2010年第9期106-108,119,共4页
基金
国家自然科学基金项目
(70572098)
产品知识资源管理理论与方法研究(70471056)
文摘
针对传统的ETL(Extract/Transform/Load)开发方法难以满足企业的决策需求,复杂性和高效性是ETL开发面临的两大主要问题。为此,在数据仓库系统统一集成建模框架下,为提高管理质量和快速性,提出一种数据仓库ETL元模型设计方法,取代了以往在特定的数据仓库中对ETL建模的方法,使得ETL过程较早地进入数据仓库设计阶段,实现了ETL与数据仓库在概念层上的无缝融合,减少了开发时间和成本代价。最后通过模型实际应用,验证了方法的可行性和高效性。
关键词
数据
仓库
抽取
-
转换
-
加
载
统一建模语言扩展
元模型
Keywords
Data warehouse
etl
UML profile
Metamodel
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向数据质量的ETL框架的设计与实现
被引量:
20
14
作者
李庆阳
彭宏
机构
华南理工大学计算机科学与工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2057-2060,共4页
基金
广东省自然科学基金项目(07006474)
广东省科技攻关基金项目(2007B010200044)
文摘
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。
关键词
数据
仓库
数据
质量
抽取
-
转换
-装
载
(
etl
)
规则推导
数据
清洗
Keywords
data warehouse
data quality
extract-transform-load (
etl
)
rule deduction
data cleaning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
公共数据中心的ETL系统设计与实现
被引量:
10
15
作者
赵俊
夏小玲
机构
东华大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2011年第10期167-169,190,共4页
文摘
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
关键词
etl
数据
仓库
数据
抽取
数据
转换
数据
质量
Keywords
etl
Data warehouse Data extraction Data transform Data quality
分类号
TP311.133 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于大数据处理的ETL框架的研究与设计
被引量:
20
16
作者
沈琦
陈博
机构
北京工业大学
出处
《电子设计工程》
2016年第2期25-27,34,共4页
文摘
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。
关键词
大
数据
处理
数据
抽取
数据
转换
数据
加
载
etl
框架
Keywords
data processing
data extraction
data conversion
data loading
etl
framework
分类号
TN709 [电子电信—电路与系统]
下载PDF
职称材料
题名
零售业数据仓库中ETL技术的研究
被引量:
1
17
作者
黄丽娟
郑雪峰
靳风荣
机构
广州大学计算机科学与技术系
北京科技大学信息工程学院
出处
《计算机与现代化》
2004年第9期63-65,共3页
文摘
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。
关键词
零售业
数据
仓库
etl
数据
抽取
数据
转换
数据
清洗
数据
加
载
Keywords
retail trade data warehouse
etl
data extract
data transform
data cleaning
data loading
分类号
F713.32 [经济管理—产业经济]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
ETL技术在监测中心数据集成中的应用
被引量:
9
18
作者
朱重吉
岑柏霖
罗金全
谢国俊
机构
广西电网公司电力科学研究院
出处
《广西电力》
2010年第6期28-29,48,共3页
文摘
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集成过程中ELT技术的应用,并提出1套电网范围内在线监测数据抽取、转换和加载的整体解决方案。
关键词
etl
在线监测
数据
集成
抽取
转换
分类号
TM769 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
数据仓库实现中ETL的应用研究
被引量:
3
19
作者
先晓兵
常晋义
机构
常熟理工学院计算机系
出处
《计算机与现代化》
2007年第10期43-46,共4页
基金
北京市科委基金资助项目(H010110400112)
文摘
通过外贸业务分析决策系统的实现,探讨在数据仓库项目应用过程中,如何针对来自不同应用系统、不同数据平台、不同数据源形式的源数据系统存在的数据质量的差异性、缺乏一致性等问题,设计较好的ETL(Extract,Transform,Load)过程解决方案,将数据从源数据系统中抽取、转换成数据仓库需要的格式和统一数据类型,并正确加载到数据仓库中,为决策支持系统的实现提供高质量的基础数据。
关键词
数据
仓库
数据
提取
数据
转换
数据
加
载
DTS(
数据
转换
系统)
Keywords
data warehouse
data extract
data transform
data load
DTS
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向ETL的数据起源追踪系统
被引量:
1
20
作者
戴超凡
王涛
机构
国防科学技术大学信息系统与管理学院信息系统工程重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第17期256-258,261,共4页
文摘
提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行相关处理,构建各个层次的转换起源信息图,从而实现数据起源的追踪。
关键词
数据
起源
起源管理系统
提取-
转换
-
加
载
同步/异步
转换
Keywords
data provenance
provenance management system
Extraction-Transform-Load(
etl
)
synchronous/asynchronous transformation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于工作流的数据抽取转换加载
谭支鹏
冯丹
吴永英
彭峰
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006
5
下载PDF
职称材料
2
面向空间数据抽取、转换、加载的元数据管理系统实现
唐捷
《电脑编程技巧与维护》
2011
0
下载PDF
职称材料
3
基于ETL技术的多源异构数据融合方法研究
杨国立
姜树明
《齐鲁工业大学学报》
CAS
2024
0
下载PDF
职称材料
4
ETL中的数据增量抽取机制研究
戴浩
杨波
《计算机工程与设计》
CSCD
北大核心
2009
34
下载PDF
职称材料
5
录井现场地质数据网络加载技术应用研究方法探讨
牛丽岩
《信息系统工程》
2014
0
下载PDF
职称材料
6
数字化转型浪潮下高校数据治理框架设计
潘燕红
《科技视界》
2024
0
下载PDF
职称材料
7
数据仓库中ETL技术的研究
张宁
贾自艳
史忠植
《计算机工程与应用》
CSCD
北大核心
2002
117
下载PDF
职称材料
8
面向数据质量的ETL过程建模与实现
贾自艳
黄友平
罗平
李嘉佑
秦亮曦
史忠植
《系统仿真学报》
CAS
CSCD
2004
23
下载PDF
职称材料
9
面向数据集成的ETL系统设计与实现
钟华
冯文澜
谭红星
黄涛
《计算机科学》
CSCD
北大核心
2004
21
下载PDF
职称材料
10
一种可靠的数据仓库中ETL策略与架构设计
尤玉林
张宪民
《计算机工程与应用》
CSCD
北大核心
2005
46
下载PDF
职称材料
11
一种通用的多数据库间数据抽取方法及应用
刘如九
张振山
柴天佑
《北京交通大学学报》
EI
CAS
CSCD
北大核心
2008
16
下载PDF
职称材料
12
基于关键属性比对的增量数据抽取方法
刘胜
杨岳湘
邓劲生
李阳
《计算机工程与应用》
CSCD
2012
4
下载PDF
职称材料
13
数据仓库ETL元模型设计
宋旭东
闫晓岚
刘晓冰
杨莉国
《计算机仿真》
CSCD
北大核心
2010
9
下载PDF
职称材料
14
面向数据质量的ETL框架的设计与实现
李庆阳
彭宏
《计算机工程与设计》
CSCD
北大核心
2010
20
下载PDF
职称材料
15
公共数据中心的ETL系统设计与实现
赵俊
夏小玲
《计算机应用与软件》
CSCD
2011
10
下载PDF
职称材料
16
基于大数据处理的ETL框架的研究与设计
沈琦
陈博
《电子设计工程》
2016
20
下载PDF
职称材料
17
零售业数据仓库中ETL技术的研究
黄丽娟
郑雪峰
靳风荣
《计算机与现代化》
2004
1
下载PDF
职称材料
18
ETL技术在监测中心数据集成中的应用
朱重吉
岑柏霖
罗金全
谢国俊
《广西电力》
2010
9
下载PDF
职称材料
19
数据仓库实现中ETL的应用研究
先晓兵
常晋义
《计算机与现代化》
2007
3
下载PDF
职称材料
20
面向ETL的数据起源追踪系统
戴超凡
王涛
《计算机工程》
CAS
CSCD
北大核心
2011
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
7
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部