-
题名数字化转型浪潮下高校数据治理框架设计
- 1
-
-
作者
潘燕红
-
机构
湄洲湾职业技术学院
-
出处
《科技视界》
2024年第7期28-31,共4页
-
基金
2023年度湄洲湾职业技术学院职业教育研究专项课题,项目名称“职业教育数字化转型背景下高校数据治理研究”(ZJYJ003)。
-
文摘
随着数字技术的快速发展与应用,全球掀起了数字化转型浪潮,数据治理已成为当前高校探索教育数字化转型过程中的重要课题。在分析当前高校数据治理现状的基础上,采用数据存储分层建设思路,研究设计了基于数据中台的高校数据治理框架,加强顶层设计,自下而上逐步推进数据采集、数据存储、数据管理和数据应用,实现高校数据的全生命周期管理。
-
关键词
教育数字化转型
数据治理
数据中台
数据抽取、转换和装载(etl)
-
分类号
G64
[文化科学—高等教育学]
-
-
题名数据仓库中ETL技术的研究
被引量:118
- 2
-
-
作者
张宁
贾自艳
史忠植
-
机构
中国科技大学研究生院计算机学部
中科院计算技术研究所智能信息处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第24期213-216,共4页
-
基金
国家自然科学基金(编号:60173017
90104021)
北京自然科学基金(编号:4011003)
-
文摘
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
-
关键词
数据仓库
etl
数据库
数据模型
数据抽取
数据转换
数据清洗
数据装载
-
Keywords
Data warehouse,etl,Data Extract,Data Transform,Data Cleansing,Data Loading
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向数据质量的ETL过程建模与实现
被引量:23
- 3
-
-
作者
贾自艳
黄友平
罗平
李嘉佑
秦亮曦
史忠植
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《系统仿真学报》
CAS
CSCD
2004年第5期907-911,914,共6页
-
基金
国家自然科学基金(60173017
90104021)
北京自然科学基金(4011003)
-
文摘
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。
-
关键词
数据仓库
数据质量
抽取-转换-装载(etl)
数据挖掘
数据清洗
-
Keywords
data warehouse
data quality
extraction-transformation-loading (etl)
data mining
data cleaning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向数据集成的ETL系统设计与实现
被引量:21
- 4
-
-
作者
钟华
冯文澜
谭红星
黄涛
-
机构
中国科学院软件研究所计算机科学重点实验室
中国科学院软件研究所软件工程技术中心
-
出处
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
-
基金
国家863高科技发展计划项目(编号Z002AA113040)
国家重点基础研究发展规划973项目(编号2002CB312005)的资助
-
文摘
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
-
关键词
etl
数据集成
过程模型
数据抽取
企业应用集成
数据仓库
转换
系统总体结构
业务数据
信息系统
-
Keywords
Data integration,Data warehouse,etl
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
F626
[经济管理—产业经济]
-
-
题名一种可靠的数据仓库中ETL策略与架构设计
被引量:46
- 5
-
-
作者
尤玉林
张宪民
-
机构
上海交通大学图像处理与模式识别研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第10期172-174,229,共4页
-
文摘
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。
-
关键词
数据仓库
etl
数据抽取
数据转换
数据清洗
数据装载
-
Keywords
data warehouse,etl,data extract,data transform,data clean,data loading
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向数据质量的ETL框架的设计与实现
被引量:20
- 6
-
-
作者
李庆阳
彭宏
-
机构
华南理工大学计算机科学与工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2057-2060,共4页
-
基金
广东省自然科学基金项目(07006474)
广东省科技攻关基金项目(2007B010200044)
-
文摘
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。
-
关键词
数据仓库
数据质量
抽取-转换-装载(etl)
规则推导
数据清洗
-
Keywords
data warehouse
data quality
extract-transform-load (etl)
rule deduction
data cleaning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于关键属性比对的增量数据抽取方法
被引量:4
- 7
-
-
作者
刘胜
杨岳湘
邓劲生
李阳
-
机构
国防科技大学计算机学院
国防科技大学信息中心
-
出处
《计算机工程与应用》
CSCD
2012年第4期115-117,共3页
-
文摘
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
-
关键词
关键属性
增量数据抽取
全表比对
提取转换加载(etl)
-
Keywords
pivotal attributes
incremental data extraction
entire table contract
Extraction Transformation Loading(etl)
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名公共数据中心的ETL系统设计与实现
被引量:10
- 8
-
-
作者
赵俊
夏小玲
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
2011年第10期167-169,190,共4页
-
文摘
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
-
关键词
etl
数据仓库
数据抽取
数据转换
数据质量
-
Keywords
etl Data warehouse Data extraction Data transform Data quality
-
分类号
TP311.133
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于大数据处理的ETL框架的研究与设计
被引量:20
- 9
-
-
作者
沈琦
陈博
-
机构
北京工业大学
-
出处
《电子设计工程》
2016年第2期25-27,34,共4页
-
文摘
针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。
-
关键词
大数据处理
数据抽取
数据转换
数据加载
etl框架
-
Keywords
data processing
data extraction
data conversion
data loading
etl framework
-
分类号
TN709
[电子电信—电路与系统]
-
-
题名基于ETL的金融数据集成过程模型
被引量:5
- 10
-
-
作者
苌程
李善平
-
机构
浙江大学计算机学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2070-2072,2104,共4页
-
文摘
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题。通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性。
-
关键词
数据抽取转换装载
数据集成
元数据映射
业务规则转换
按需交互
-
Keywords
etl
data integration
metadata mapping
business rule transform
on demand request
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名ETL技术在监测中心数据集成中的应用
被引量:9
- 11
-
-
作者
朱重吉
岑柏霖
罗金全
谢国俊
-
机构
广西电网公司电力科学研究院
-
出处
《广西电力》
2010年第6期28-29,48,共3页
-
文摘
广西电网在线监测中心要实现多设备、多特征量综合检测与诊断,将广西电网范围内各种分布的、异构在线监测数据源整合到在线监测中心数据库是技术关键。ELT技术是在线监测中心数据集成的关键环节,文章阐述了广西电网在线监测中心数据集成过程中ELT技术的应用,并提出1套电网范围内在线监测数据抽取、转换和加载的整体解决方案。
-
关键词
etl
在线监测
数据集成
抽取
转换
-
分类号
TM769
[电气工程—电力系统及自动化]
-
-
题名零售业数据仓库中ETL技术的研究
被引量:1
- 12
-
-
作者
黄丽娟
郑雪峰
靳风荣
-
机构
广州大学计算机科学与技术系
北京科技大学信息工程学院
-
出处
《计算机与现代化》
2004年第9期63-65,共3页
-
文摘
数据仓库中的数据不是传统数据库中数据的简单堆积,它是一个复杂的容纳数据集成的系统工程,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。本文针对于零售业,阐述了在零售业数据仓库系统中ETL的流程并结合实际应用提出了在零售业数据仓库系统中的ETL过程应考虑的诸多问题及解决方案。
-
关键词
零售业
数据仓库
etl
数据抽取
数据转换
数据清洗
数据加载
-
Keywords
retail trade data warehouse
etl
data extract
data transform
data cleaning
data loading
-
分类号
F713.32
[经济管理—产业经济]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名半结构化数据装载到数据仓库的设计与实现
被引量:1
- 13
-
-
作者
王静婷
王艳丽
王振辉
-
机构
西安翻译学院工程技术学院
-
出处
《计算机与数字工程》
2014年第11期2198-2201,共4页
-
基金
陕西省教育厅科研计划专项项目(编号:12JK1055)资助
-
文摘
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo.xml)为例,利用DOM对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XML文件进行数据仓库数据加载的弊端,为XML半结构化数据的抽取并装载到数据仓库当前细节级中的这一问题的解决进行了有益的探索。
-
关键词
XML数据
DOM对象
半结构化数据
抽取
装载
etl工具
数据仓库
-
Keywords
XML(eXtensible Markup Language) data, DOM(Document Object Model) object, semi-structured data,extraction, loading, etl(Extract-Transform-Load) tool, data warehouse
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于水厂数据仓库系统的ETL技术研究
被引量:1
- 14
-
-
作者
洪东忍
-
机构
福建教育学院
-
出处
《云南民族大学学报(自然科学版)》
CAS
2012年第5期365-369,共5页
-
文摘
ETL是指数据抽取(extract)、转换(transform)、装载(load)的过程,是数据仓库构建过程中的核心环节和技术难点.基于水厂数据仓库系统,研究了如何运用ETL技术实现水厂数据仓库中数据的抽取、转换和装载.
-
关键词
数据仓库
etl
数据抽取
转换
装载
-
Keywords
data warehouse
etl
Extract
Transform
Load
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名ETL在青海省电力公司数据中心系统中的应用
被引量:5
- 15
-
-
作者
白莉珍
-
机构
西宁供电公司信息通讯中心
-
出处
《青海电力》
2008年第2期62-64,共3页
-
文摘
依据国家电网公司"SG186"工程的总体规划,青海省电力公司于2006年11月开始实施青海电力公司数据中心项目。ETL作为数据中心系统的关键部件,主要完成数据抽取、清洗、转换和装载工作,它是构建数据中心的重要环节,同时也是构建数据中心过程中出现问题最多的环节。文章通过ETL技术在青海电力公司数据中心项目中的应用,介绍了ETL的功能及作用,同时对ETL的数据处理过程做了详细的论述。
-
关键词
数据中心
etl
数据抽取
数据转换
数据清洗
数据装载
-
Keywords
information center
etl
data sample
data transformation
data cleanout
data load
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于ETL的校园数据集成技术研究
被引量:1
- 16
-
-
作者
李军
孙蕾
王泽芳
-
机构
长沙环境保护职业技术学院
金鹰报社
-
出处
《电脑知识与技术》
2013年第10期6429-6430,共2页
-
基金
长沙环境保护职业技术学院院级课题资助项目:校园综合数据交换平台分析与设计(项目编号110KY004)
湖南省姑技展资助项目:湖南省环保信息资源共享机制平台开发研究(项目编号:2012GK3049)
+1 种基金
2013年湖南省教育科学“十二五”规划课题:云计算在区域教育资源公共服务模式的应用(编号:XJK013CXX005)
湖南省教育厅科学研究项目:基于云计算的区域教育资源公共服务模式的研究(编号:13C1001)
-
文摘
针对目前校园由于缺乏统一的数据规划导致各应用系统数据标准不一致,难以共享使用,出现了一个个的“信息孤岛”的现象,ETL通过建立底层数据交换平台来联系各个异构系统、应用、数据源,实现无缝共享和交换数据的需要。
-
关键词
etl
数据集成
数据转换
数据抽取
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名教学管理数据仓库中ETL的实现
被引量:1
- 17
-
-
作者
占小忆
-
机构
合肥工业大学计算机与信息学院
安徽三联学院计算机科学与技术系
-
出处
《科技创新导报》
2011年第16期17-18,共2页
-
文摘
ETL工具从异构数据源抽取数据,并将数据清洗,规范化后装载到数据仓库。文章从前期的数据理解阶段入手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案。提出了以数据理解为根基,以清洗转换为中心的设计思想,并给出成绩管理模块的具体实施步骤。
-
关键词
etl
数据仓库
数据抽取
数据转换
数据加载
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于ETL工具的数据集成和交换的研究
被引量:3
- 18
-
-
作者
刘三满
-
机构
山西警官高等专科学校
-
出处
《电脑开发与应用》
2011年第10期17-19,共3页
-
基金
山西省科技厅软科学基金资助项目(No2010041016)
(No2011041022-03)
-
文摘
数据的集成与交换,对企业的管理和决策意义重大。数据集成和交换必须解决抽取、转换和加载,但过去的异构系统很难实现,从需求分析、系统设计和系统实现3个方面,设计了一种针对数据抽取、转换和装载(Extract、Transform、Load)的ETL工具。根据ETL工具的综合要求,通过结构化分析需求,构建了系统逻辑模型;设计了总体框架、UI和类包,创新了UI界面、数据处理的若干关键技术;实现了系统目标。
-
关键词
数据抽取
数据转换
数据清洗
数据装载
-
Keywords
data extraction
data conversion
data cleansing
data loading
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名元数据驱动ETL的研究
被引量:5
- 19
-
-
作者
宿芳
寿永熙
苏依拉
-
机构
内蒙古工业大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第6期114-118,125,共6页
-
基金
内蒙古自然科学基金(No.20080404MS0904)
-
文摘
对原始数据的提取、转换、加载(ETL)是数据仓库开发的重要步骤。一个稳定而可靠的ETL系统取决于它的总体设计。在原有ETL基础上,提出了元数据驱动ETL的思想,利用包引擎和SQL引擎以及相关算法,对传统ETL的方法进行改进,目的是提高ETL系统的稳定性和可靠性,使用户通过对元数据的维护来控制ETL的执行过程。
-
关键词
抽取、转换和加载(etl)
数据仓库
元数据
SQL引擎
包引擎
-
Keywords
Extract, Transformation and Load(etl)
data warehouse
metadata
SQL engine
package engine
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据仓库中ETL技术的研究与改进
被引量:2
- 20
-
-
作者
白果
贾玉文
-
机构
辽宁师范大学管理学院
-
出处
《甘肃科技》
2012年第19期18-20,共3页
-
文摘
ETL是数据仓库构建中的核心环节,通过对传统的ETL架构体系的介绍,从数据抽取、数据转换等方面对ETL过程进行了改进,让数据转换环节在数据抽取和数据清洗加载的过程中同时进行,并增加了一个临时存储区,以此来缓解在数据抽取和转换过程中由于数据量太大或过于复杂而引起的数据拥堵和冗余的现象。通过改进后的ETL系统,可以提高整个数据仓库运行的效率,大大改善运行速度,提高了数据仓库的数据质量。
-
关键词
etl
数据仓库
数据转换
数据清洗
数据装载
异构数据源
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-