期刊文献+

ETL过程的思考 被引量:7

Thinking in ETL Process
下载PDF
导出
摘要 ETL是构建数据仓库的一个非常重要的环节,可以这样认为:ETL就是整个数据仓库系统乃至整个决策支持系统的基石。如何设计高效的ETL过程就成为了众多计划或正在实施数据仓库项目的企业考虑的重要问题。从前期的数据理解阶段入手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案。提出了以数据理解为根基,以清洗转换为中心的设计思想,并给出了具体的实施步骤。 ETL is one of the major processes when building a data warehouse. Can consider that ETL is the basis of the data warehouse even though the whole decision support system. Many enterprises which is planning or beginning to build a data warhorse now is highly concerned about how to design the ETL process effectively. Starts with the data comprehension, and discusses the design issues and its solutions about data extraction, data cleaning and data loading. Propose a method which is based on data comprehension and centered on data cleaning to design the ETL process and describe the steps to follow.
作者 王亮 葛玮
出处 《计算机技术与发展》 2008年第10期130-132,共3页 Computer Technology and Development
基金 国家"863"计划资助项目(2004AA115090)
关键词 ETL 商业智能 数据仓库 ETL business intelligence data warehouse
  • 相关文献

参考文献5

  • 1Rahmand E, Hong Haido. Data Cleaning, Problems and Current Approaches[J]. IEEE. Bulletin of the Tenniel Committee Data Engineering,2000,23(4) :3 - 13.
  • 2章水鑫,徐宏炳,于立.增量式ETL工具的研究与实现[J].现代计算机,2005,11(3):6-10. 被引量:20
  • 3Hernandez M. A Generation of Band Joins and the Merge/ Purge Problem[ R]. USA: Department of Computer Science, Columbia University, 1995.
  • 4Inmon W H. Building the Data Warehouse[M].北京:机械工业出版社,2007.
  • 5张宁,贾自艳,史忠植.数据仓库中ETL技术的研究[J].计算机工程与应用,2002,38(24):213-216. 被引量:118

二级参考文献13

  • 1王珊等.数据仓库技术与联机分析处理[M].北京:科学出版社,1999..
  • 2(美)Harjinder S GILL著.王仲谋,刘书舟译.数据仓库-客户/服务器计算指南[M].北京:清华大学出版社
  • 3张澜,康增培.数据仓库白皮书概念篇.http://www.ccidne1.com/tech/paper/2001/03/02/58_1770.html
  • 4Michael F Jennings.Strategies for Custom Data Warehouse ETL Processing. 2000
  • 5Common Warehouse Metamodel(CMW)Specification.http://www.cwm-forum.org/spec.btm, 2001
  • 6Prabhu Ram,Lyman Do. Extracting Delta for Incremental Data Warehouse Maintenance. 16th International Conference on Data Engineering, 2000.
  • 7王能斌.数据库管理系统[M].北京:电子工业出版社,2000..
  • 8.[EB/OL].数据库之路网站.www.dwway.com.,.
  • 9朱焱.浅论数据抽取、净化和转换工具[J].计算机应用,2000,20(4):1-3. 被引量:13
  • 10张宁,贾自艳,史忠植.数据仓库中ETL技术的研究[J].计算机工程与应用,2002,38(24):213-216. 被引量:118

共引文献133

同被引文献26

  • 1贾自艳,黄友平,罗平,李嘉佑,秦亮曦,史忠植.面向数据质量的ETL过程建模与实现[J].系统仿真学报,2004,16(5):907-911. 被引量:23
  • 2钟华,冯文澜,谭红星,黄涛.面向数据集成的ETL系统设计与实现[J].计算机科学,2004,31(9):87-89. 被引量:21
  • 3吴远红.ETL执行过程的优化研究[J].计算机科学,2007,34(1):81-83. 被引量:21
  • 4杨道建,赵喜仓,陈海波.科技计划项目绩效评价指标体系的构建[J].江苏大学学报(社会科学版),2007,9(2):89-92. 被引量:42
  • 5孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据的查询技术[J].软件学报,2007,18(6):1400-1418. 被引量:72
  • 6Chung C W. DATAPLEX: An Aeeess to Heterogeneous Distributed Database[ J ]. Comm. of the ACM, 1990,33 ( 1 ) : 102 - 108.
  • 7Sheth A P. Changing Focus on Imeroperability in Infomation Systems: From System, Syntax, Structure to Semantics [ C]// Interoperating Geograptfic Information Systems. [ s. l. ]: Kluwer Academic Publishers, 1998: 5 - 30.
  • 8Vassiliadis P, Vagena Z, Skiadopoulos S, et al. ARKTOS : to- wards the modeling, design, control and execution of ETL processes [ J ]. Information Systems,2001,26 ( 8 ) :537-561.
  • 9van Dongen J, Bouman R. Pentaho solutions:business intelli- gence and data warehousing with Peutaho and MySQL [ M ]. [ s. 1. ] :John Wiley & Sons Inc ,2009.
  • 10Kimball R, Ross M. The data warehouse toolkit : the definitive guide to dimensional modeling[ M]. 3rd ed. [ s. 1. ] :John Wi- ley & Sons Inc,2013.

引证文献7

二级引证文献51

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部