ETL执行的流水线优化被引量：15

Optimization of ETL Execution by Pipelining Method

下载PDF

导出

摘要 ETL工具是构建和维护数据仓库的基本构件,由于它处理的是海量数据,如何有效地加快响应时间成为值得研究的问题.本文提出了ETL过程的“主表衍生”模式,并针对这种模式采用流水线算法来提高并行性从而加快ETL过程的响应时间,理论分析和实验表明具有好的效果. ETL is a tool responsible for data loading and maintaining of data warehouse.How to efficiently shorten the execution time is a big challenge because the volume of data to be processed is very large.This paper discusses the model of 'derived by one view' for ETL execution and gives the pipelining method by view horizontal partition to shorten the exectutin time.The theory and experiment proves it to be efficient.

作者韩京宇徐立臻董逸生

机构地区东南大学计算机科学与工程系

出处《小型微型计算机系统》 CSCD 北大核心 2005年第6期1013-1017,共5页 Journal of Chinese Computer Systems

基金江苏省十五高科技项目(BG2001013)资助.

关键词 ETL 数据仓库流水线 ETL data warehouse pipelining

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Panos Vassiliadis, Chrstoph Quix, Yannis Vassiliou et al. A model for data warehouse operational processes[C]. The 12th Conference on Advanced Information Systems Engineering(CAISE'00),Stockholm, Sweden, 2000.
2Panos Vassiliadis, Zografoula Vagena, Spiros Skiadopoulos et al. ARKTOS: towards the modeling , design,control and execution of ETL processes[J]. Information Systems, 2001, 26(8):537-561.
3Timos K Sellie. Multiple-query optimization[J]. ACM trans-actions on database system, 1998,13 (1): 23- 52.
4Panos Vassiliadis, Alkis Simitsis, Spiros Skiadopoulos. Conceptual modeling for ETL processes[C]. Proceedings of the 5th ACM International Workshop on Data Warehousing and OLAP,2002:14-21.
5Panos Vassiliadis, Alkis Simitsis, Spiros Skiadopoulos. Modeling ETL activities as graphs [C]. In Proc. of 4th International Workshop on the Design and Management of Data Warehouses,Toronto Canada, 2002: 52-61.
6Bouzeghoub M, Fabret F, Matulovic M. Modeling data warehouse refreshment process as a workflow application [C]. In Proc. Intl. Workshop on Design and Management of Data Warehouses, Heidelberg, Germany, 1999.
7唐恒赵传立.排序引论[M].北京:科学出版社,2002..

共引文献1

1韩京宇,徐立臻,董逸生.基于数据水平分割的ETL执行优化[J].应用科学学报,2005,23(3):300-304. 被引量：3

同被引文献101

1贾自艳,黄友平,罗平,李嘉佑,秦亮曦,史忠植.面向数据质量的ETL过程建模与实现[J].系统仿真学报,2004,16(5):907-911. 被引量：23
2陈弦,陈松乔.基于数据仓库的通用ETL工具的设计与实现[J].计算机应用研究,2004,21(8):214-216. 被引量：26
3马慧麟.数据仓库的数据采集与建模问题研究[J].中央民族大学学报（自然科学版）,2004,13(4):339-342. 被引量：4
4史捷,鲍玉斌,刘运涛,张斌,孙焕良,于戈.数据仓库系统中任务调度策略研究[J].控制与决策,2005,20(1):109-112. 被引量：3
5尤玉林,张宪民.一种可靠的数据仓库中ETL策略与架构设计[J].计算机工程与应用,2005,41(10):172-174. 被引量：46
6盖九宇,张忠能,肖鹤.分布式数据库数据复制技术的分析与应用[J].计算机应用与软件,2005,22(7):36-38. 被引量：37
7潘定,沈钧毅.数据仓库中实时元数据管理的研究[J].计算机工程,2005,31(17):29-31. 被引量：4
8王木林.基于SQL优化提高数据仓库的ETL效率的方案[J].中国科技信息,2005(18A):95-95. 被引量：2
9刘建,李绪志.一种动态负载均衡机制的研究与实现[J].计算机工程与应用,2006,42(2):142-145. 被引量：9
10谭支鹏,冯丹,吴永英,彭峰.基于工作流的数据抽取转换加载[J].华中科技大学学报（自然科学版）,2006,34(2):61-63. 被引量：5

引证文献15

1郑洪源,周良.基于CWM的标准ETL的设计与实现[J].吉林大学学报（信息科学版）,2006,24(1):50-55. 被引量：10
2吴远红.ETL执行过程的优化研究[J].计算机科学,2007,34(1):81-83. 被引量：21
3吴远红,徐宏炳.基于状态空间搜索的ETL执行优化[J].计算机工程与设计,2007,28(10):2262-2264.
4BAO Yubin SONG Jie LENG Fangling WANG Daling YU Ge.Study and Implementation of a New SQL-Based ETL Approach[J].Wuhan University Journal of Natural Sciences,2007,12(5):804-808. 被引量：2
5宋杰,王大玲,鲍玉斌,于戈.一种元数据驱动的ETL方法的研究[J].小型微型计算机系统,2007,28(12):2167-2173. 被引量：15
6李庆阳,彭宏.面向数据质量的ETL框架的设计与实现[J].计算机工程与设计,2010,31(9):2057-2060. 被引量：20
7宋旭东,刘晓冰.数据仓库ETL任务调度模型研究[J].控制与决策,2011,26(2):271-275. 被引量：15
8王茜.ETL多数据流并行抽取中监控的研究与设计[J].微计算机信息,2011,27(3):200-201.
9张亮,夏秀峰.分布式ETL负载均衡策略研究[J].计算机与现代化,2011(9):201-204. 被引量：1
10陈红华,王志杰,郑加柱,史晓云.基于空间ETL实现VCT数据交换共享[J].测绘科学,2012,37(1):185-186. 被引量：7

二级引证文献95

1冯林,范成涛,孙焘,谢秀镯,勾哲华.基于CWM的平行多系统横向业务整合的研究[J].计算机技术与发展,2007,17(7):21-23.
2孟宪明,王正方,牛奔.基于DirectShow的ETL工具的设计[J].微计算机信息,2008,24(30):145-146. 被引量：2
3张忠平,赵瑞珍.结构图ETL概念模型的设计方法[J].计算机工程与应用,2009,45(6):161-164. 被引量：3
4唐捷.基于元数据的空间数据ETL规则库设计研究[J].现代计算机,2009,15(5):19-20.
5张忠平,赵瑞珍.基于元数据驱动的ETL架构设计[J].计算机应用与软件,2009,26(6):61-63. 被引量：7
6梁美红,张男楠,李建,伍东,胡永泉,杨静.一种钻井数据仓库ETL系统的设计[J].计算机技术与发展,2010,20(3):250-252. 被引量：2
7杨兴凯.基于本体的政务数据仓库构建方法研究[J].计算机工程与设计,2010,31(7):1492-1494. 被引量：4
8蔡海敏,张自力,曾铮,殷员分.基于数据仓库与联机分析技术的高考加分政策评估[J].计算机科学,2010,37(6):223-225. 被引量：7
9宋旭东,闫晓岚,刘晓冰,杨莉国.数据仓库ETL元模型设计[J].计算机仿真,2010,27(9):106-108. 被引量：9
10赵相东,张浩,陆剑峰.面向大型钢铁集团的商务智能应用系统解决方案[J].计算机集成制造系统,2010,16(9):1999-2008. 被引量：8

1韩毅,陈建,张靖波,肖永鹏.在Visual C#.Net下利用DataGrid控件实现主-从式查询[J].计算机系统应用,2005,14(6):76-79.
2蒋铁海,刘朝晖.VB.NET数据库编程中DataGrid控件的使用技巧[J].微机发展,2003,13(5):93-94.
3孙康,胡建平,孙日荣.多种查询功能的设计与实现[J].计算机工程与应用,2000,36(1):101-104.
4李琥,罗俊武,唐棣芳.客户/服务器系统前端开发技术[J].计算机工程与应用,1999,35(1):101-104. 被引量：2
5蔡勋,曾亮,王攀.基于GPU的体绘制流水线优化与预处理加速算法[J].系统仿真学报,2011,23(3):511-515. 被引量：3
6刘声,韩俊刚,韩帅.引导滤波的软硬件协同加速器设计与实现[J].电子技术应用,2016,42(11):44-45.
7李钊,高明亮,李业德.分形维数计算的流水线优化方法研究[J].仪器仪表学报,2015,36(12):2690-2696. 被引量：3
8陈剑骏,陈耀武.基于功能和数据划分的H.264并行解码算法[J].计算机工程,2012,38(12):214-217. 被引量：2
9王志军.借助Power Query实现数据的快速转换[J].电脑知识与技术（经验技巧）,2016,0(2):43-44.
10虞响,张笑微,潘泽友.实时目标跟踪中TMS320DM642的软件优化研究[J].兵工自动化,2009,28(6):86-88. 被引量：2

小型微型计算机系统

2005年第6期

浏览历史

内容加载中请稍等...

ETL执行的流水线优化被引量：15

参考文献7

共引文献1

同被引文献101

引证文献15

二级引证文献95

相关作者

相关机构

相关主题

浏览历史

ETL执行的流水线优化 被引量：15

参考文献7

共引文献1

同被引文献101

引证文献15

二级引证文献95

相关作者

相关机构

相关主题

浏览历史

ETL执行的流水线优化被引量：15