期刊文献+
共找到936篇文章
< 1 2 47 >
每页显示 20 50 100
基于ETL的飞行数据复盘软件设计研究
1
作者 王凯 殷华杰 张彦 《航空电子技术》 2024年第2期62-69,共8页
本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组... 本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组成、设计流程和实现原理。该方案降低了系统开发的复杂度,提高了飞行数据管理的效率和数据复盘自动化水平。 展开更多
关键词 飞行数据 etl 数据复盘
下载PDF
基于大数据ETL引擎的批量智能开发平台研究
2
作者 曾国文 梁华生 钟玲 《电信工程技术与标准化》 2024年第3期20-25,共6页
大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表... 大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表和数据质量稽核等XML脚本,转译ETL的XML代码为可执行Java代码,降低操作员使用平台的技术难度。通过实操验证,本文提出的方法能增加平台的开发效率,更快速实现需求。 展开更多
关键词 数据仓库 etl引擎 XML脚本 批量开发
下载PDF
Research on Enhanced Contraband Dataset ACXray Based on ETL
3
作者 Xueping Song Jianming Yang +1 位作者 Shuyu Zhang Jicun Zhang 《Computers, Materials & Continua》 SCIE EI 2024年第6期4551-4572,共22页
To address the shortage of public datasets for customs X-ray images of contraband and the difficulties in deploying trained models in engineering applications,a method has been proposed that employs the Extract-Transf... To address the shortage of public datasets for customs X-ray images of contraband and the difficulties in deploying trained models in engineering applications,a method has been proposed that employs the Extract-Transform-Load(ETL)approach to create an X-ray dataset of contraband items.Initially,X-ray scatter image data is collected and cleaned.Using Kafka message queues and the Elasticsearch(ES)distributed search engine,the data is transmitted in real-time to cloud servers.Subsequently,contraband data is annotated using a combination of neural networks and manual methods to improve annotation efficiency and implemented mean hash algorithm for quick image retrieval.The method of integrating targets with backgrounds has enhanced the X-ray contraband image data,increasing the number of positive samples.Finally,an Airport Customs X-ray dataset(ACXray)compatible with customs business scenarios has been constructed,featuring an increased number of positive contraband samples.Experimental tests using three datasets to train the Mask Region-based Convolutional Neural Network(Mask R-CNN)algorithm and tested on 400 real customs images revealed that the recognition accuracy of algorithms trained with Security Inspection X-ray(SIXray)and Occluded Prohibited Items X-ray(OPIXray)decreased by 16.3%and 15.1%,respectively,while the ACXray dataset trained algorithm’s accuracy was almost unaffected.This indicates that the ACXray dataset-trained algorithm possesses strong generalization capabilities and is more suitable for customs detection scenarios. 展开更多
关键词 X-ray contraband etl data enhancement DATASET
下载PDF
基于ETL工具开发的气象数据共享平台
4
作者 张蛟娇 《科技传播》 2024年第8期128-131,共4页
为打破行业数据壁垒,解决气象数据跨行业共享安全性较低、共享数据管理滞后等问题,内蒙古自治区气象数据中心基于ETL工具开发气象数据共享平台,平台针对不同数据共享清单定制数据推送策略,实现数据自动抽取、清洗、推送、全流程日志记录... 为打破行业数据壁垒,解决气象数据跨行业共享安全性较低、共享数据管理滞后等问题,内蒙古自治区气象数据中心基于ETL工具开发气象数据共享平台,平台针对不同数据共享清单定制数据推送策略,实现数据自动抽取、清洗、推送、全流程日志记录,开发可视化数据共享管理平台对交换数据进行统一管理,并将异常状态告警推送至“天镜”系统Alert平台实现告警信息可视化展示。该平台的建设为跨行业数据共享和产品融合提供安全可靠平台,为提高气象部门公共服务能力提供数据支持。 展开更多
关键词 etl工具 气象 管理平台 数据共享
下载PDF
基于ETL和触发器的数据采集整编复演方法研究
5
作者 潘阳 朱江 +3 位作者 钱诗君 韦涛 石进 高瀚远 《信息化研究》 2023年第1期32-37,共6页
数据整编复演对指挥信息系统优化决策、提升效能具有重要意义,逐渐成为研究热点。文章针对传统数据集中整编效率低、定制研发适应性差等问题提出一种基于ETL(Extraction,Transformation,Loading)和触发器的指挥信息系统过程数据自动采... 数据整编复演对指挥信息系统优化决策、提升效能具有重要意义,逐渐成为研究热点。文章针对传统数据集中整编效率低、定制研发适应性差等问题提出一种基于ETL(Extraction,Transformation,Loading)和触发器的指挥信息系统过程数据自动采集和整编复演方法。首先通过配置全量和增量数据抽取任务实现信息系统全过程数据自动采集引接;同时提出基于数据库触发器的数据整编模式,实现对ETL抽取到的增量数据进行伴随计算处理,平滑分散了集中整编的巨大工作量;然后构建回放复演引擎提供指挥信息系统复盘可视化呈现能力;最后通过仿真验证了该方法的整编处理效率和灵活扩展性,并且对自主可控环境有较好的兼容性。 展开更多
关键词 指挥信息系统 数据整编 复演 etl 触发器 自主可控环境
下载PDF
基于数据仓库ETL技术的电力技改大修项目数据清洗方法 被引量:1
6
作者 沈海天 嵇惠方 +2 位作者 游睿 唐梁 谢晓锋 《电工技术》 2023年第14期177-179,共3页
由于重复数据和空缺数据数量多,电力技改大修项目数据清洗方法不能实现脏数据的有效清洗,为此研究基于数据仓库ETL技术的电力技改大修项目数据清洗方法。通过对多数据源的电力技改大修项目脏数据质量的评估,判断符合预期标准后进行数据... 由于重复数据和空缺数据数量多,电力技改大修项目数据清洗方法不能实现脏数据的有效清洗,为此研究基于数据仓库ETL技术的电力技改大修项目数据清洗方法。通过对多数据源的电力技改大修项目脏数据质量的评估,判断符合预期标准后进行数据挖掘;结合数据仓库ETL技术对重复数据记录进行清洗;运用切比雪夫定理处理电力技改大修项目数据空缺值来完成对电力技改大修项目数据的有效清洗。实验结果表明,运用该方法清洗数据有效率最高,有效提高了数据的质量,实现了对数据的高质量清洗。 展开更多
关键词 数据仓库 etl技术 数据清洗
下载PDF
ETL Maturity Model for Data Warehouse Systems:A CMMI Compliant Framework
7
作者 Musawwer Khan Islam Ali +6 位作者 Shahzada Khurram Salman Naseer Shafiq Ahmad Ahmed T.Soliman Akber Abid Gardezi Muhammad Shafiq Jin-Ghoo Choi 《Computers, Materials & Continua》 SCIE EI 2023年第2期3849-3863,共15页
The effectiveness of the Business Intelligence(BI)system mainly depends on the quality of knowledge it produces.The decision-making process is hindered,and the user’s trust is lost,if the knowledge offered is undesir... The effectiveness of the Business Intelligence(BI)system mainly depends on the quality of knowledge it produces.The decision-making process is hindered,and the user’s trust is lost,if the knowledge offered is undesired or of poor quality.A Data Warehouse(DW)is a huge collection of data gathered from many sources and an important part of any BI solution to assist management in making better decisions.The Extract,Transform,and Load(ETL)process is the backbone of a DW system,and it is responsible for moving data from source systems into the DW system.The more mature the ETL process the more reliable the DW system.In this paper,we propose the ETL Maturity Model(EMM)that assists organizations in achieving a high-quality ETL system and thereby enhancing the quality of knowledge produced.The EMM is made up of five levels of maturity i.e.,Chaotic,Acceptable,Stable,Efficient and Reliable.Each level of maturity contains Key Process Areas(KPAs)that have been endorsed by industry experts and include all critical features of a good ETL system.Quality Objectives(QOs)are defined procedures that,when implemented,resulted in a high-quality ETL process.Each KPA has its own set of QOs,the execution of which meets the requirements of that KPA.Multiple brainstorming sessions with relevant industry experts helped to enhance the model.EMMwas deployed in two key projects utilizing multiple case studies to supplement the validation process and support our claim.This model can assist organizations in improving their current ETL process and transforming it into a more mature ETL system.This model can also provide high-quality information to assist users inmaking better decisions and gaining their trust. 展开更多
关键词 etl maturity model CMMI data warehouse maturity model
下载PDF
基于FME-ETL自动绘制盾构区间管片平面图的技术和应用
8
作者 肖云 孙有恒 李良 《价值工程》 2023年第21期75-77,共3页
在地铁区间盾构施工过程中,基于无人机航拍正射影像图叠加盾构施工设计管片图,并通过盾构实时监控系统获取当前施工对应的环号,可在无人机航拍正射影像图上清晰表达地下设备设施对应的地表环境,从而使管理者更全面、更精准掌控盾构施工... 在地铁区间盾构施工过程中,基于无人机航拍正射影像图叠加盾构施工设计管片图,并通过盾构实时监控系统获取当前施工对应的环号,可在无人机航拍正射影像图上清晰表达地下设备设施对应的地表环境,从而使管理者更全面、更精准掌控盾构施工面临的各类穿越风险。基于FME-ETL自动绘制盾构区间管片平面图的技术(以下简称“管片平面图自动生成技术”),是基于设计院提供的盾构施工设计中心线、盾构区间设计环数、管片外径设计参数,按依次对盾构施工中心线进行分段、计算分段端点的法线、绘制管环外径边线图形的技术路线。使用FME-TEL工具,自动绘制盾构区间管片平面图,并保持与盾构施工设计图相同的坐标系。该管片平面图自动生成技术,支持数据的批量处理,相比CAD人工绘图,既大幅提高了工作效率,也降低了人工绘图的错误率。 展开更多
关键词 FME etl 盾构施工 自动绘制 管片平面图
下载PDF
面向数据质量的ETL过程建模与实现 被引量:23
9
作者 贾自艳 黄友平 +3 位作者 罗平 李嘉佑 秦亮曦 史忠植 《系统仿真学报》 CAS CSCD 2004年第5期907-911,914,共6页
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程... 为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。 展开更多
关键词 数据仓库 数据质量 抽取-转换-装载(etl) 数据挖掘 数据清洗
下载PDF
基于Hadoop技术的加速器大数据安全存储与高效分析系统设计
10
作者 赵子晨 杨锋 +3 位作者 郭玉辉 陈又新 李钊扬 刘海涛 《现代电子技术》 北大核心 2024年第8期9-17,共9页
为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬... 为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬件架构以及将数据从现有数据库抽取、转换和加载到数据仓库的方案。特别是针对系统归档数据的存储和分析需求,根据实际应用场景设计一个基于HBase的存储解决方案。在系统部署完成后,进行了吞吐量测试,并与当前使用的传统数据库进行性能对比。测试结果显示,基于Hadoop的数据仓库系统在海量数据存储、高性能查询以及数据分析处理方面都表现出明显的优势。这一改进为加速器控制系统提供了更强大的数据管理和处理能力,有望为加速器在未来的发展提供更多可能性。 展开更多
关键词 数据仓库 Hadoop技术 加速器 大数据 安全存储 HBASE etl
下载PDF
数据仓库中ETL技术的研究 被引量:116
11
作者 张宁 贾自艳 史忠植 《计算机工程与应用》 CSCD 北大核心 2002年第24期213-216,共4页
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL... 作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。 展开更多
关键词 数据仓库 etl 数据库 数据模型 数据抽取 数据转换 数据清洗 数据装载
下载PDF
数据仓库中ETL技术的探讨与实践 被引量:31
12
作者 王克龙 王玲 +1 位作者 王平立 宋斌 《计算机应用与软件》 CSCD 北大核心 2005年第11期30-31,78,共3页
支持数据抽取、转换、清洗和装载的工具集对任何数据仓库工程都是一个必不可少的关键部件。本文重点探讨了ETL技术以及ETL工具的选择原则,并结合具体实例详细介绍了ETL过程的设计和实现方法。
关键词 数据仓库 etl技术 数据抽取 数据挖掘 联机分析 可靠性
下载PDF
面向数据质量的ETL框架的设计与实现 被引量:20
13
作者 李庆阳 彭宏 《计算机工程与设计》 CSCD 北大核心 2010年第9期2057-2060,共4页
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建... 针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理。基于该设计思想开发一个ETL工具-DQETL。DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理。最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤。 展开更多
关键词 数据仓库 数据质量 抽取-转换-装载(etl) 规则推导 数据清洗
下载PDF
数据ETL工具通用框架设计 被引量:26
14
作者 周宏广 周继承 +1 位作者 彭银桥 龙思锐 《计算机应用》 CSCD 北大核心 2003年第12期96-98,共3页
异构多数据源集成和数据清洗是将操作数据导入数据仓库过程中面临的两大挑战。从实践角度设计了数据ETL工具的整体框架,使用通用数据访问接口来屏蔽各种数据源之间的差异,并以数据清洗为主要目的,为消除多数据源的模式冲突和数据冲突提... 异构多数据源集成和数据清洗是将操作数据导入数据仓库过程中面临的两大挑战。从实践角度设计了数据ETL工具的整体框架,使用通用数据访问接口来屏蔽各种数据源之间的差异,并以数据清洗为主要目的,为消除多数据源的模式冲突和数据冲突提供了通用而有效的解决方案。 展开更多
关键词 数据etl 数据集成 数据清洗
下载PDF
增量ETL过程自动化产生方法的研究 被引量:19
15
作者 张旭峰 孙未未 +2 位作者 汪卫 冯雅慧 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1097-1103,共7页
ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自... ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自动化产生方法进行了研究,根据已有的全量ETL过程,可以自动产生增量ETL过程,从而降低设计增量ETL过程的代价·利用已有的物化视图增量维护的方法,给出了根据全量ETL过程自动产生增量ETL过程的方法·但是已有的研究集中在包含选择、投影、联接和聚合运算情况下物化视图的增量维护,未见对包括差运算情况下的讨论·作为研究工作的基础,还详细讨论了包含差运算情况下物化视图的增量维护问题· 展开更多
关键词 etl 数据仓库 增量维护 物化视图 自维护
下载PDF
面向数据集成的ETL系统设计与实现 被引量:21
16
作者 钟华 冯文澜 +1 位作者 谭红星 黄涛 《计算机科学》 CSCD 北大核心 2004年第9期87-89,F004,共4页
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了... ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。 展开更多
关键词 etl 数据集成 过程模型 数据抽取 企业应用集成 数据仓库 转换 系统总体结构 业务数据 信息系统
下载PDF
基于电信数据仓库系统的ETL研究与设计 被引量:12
17
作者 李颖 郝克刚 葛玮 《计算机应用与软件》 CSCD 2009年第1期178-180,共3页
电信行业大都建立了自己的数据仓库系统,而建立数据仓库的最重要环节便是数据的抽取、转换和加载ETL(Extracting、Transformation、Loading)。通过对现有ETL系统的分析研究,设计并部分实现了基于某省电信公司数据仓库的ETL系统。采取XM... 电信行业大都建立了自己的数据仓库系统,而建立数据仓库的最重要环节便是数据的抽取、转换和加载ETL(Extracting、Transformation、Loading)。通过对现有ETL系统的分析研究,设计并部分实现了基于某省电信公司数据仓库的ETL系统。采取XML格式编辑整个ETL过程,实现部分图形化交互界面,并针对电信系统大数据量的特点,提出性能优化及改进的方法,提高了ETL效率。 展开更多
关键词 etl 电信 数据仓库 大数据量
下载PDF
一种可靠的数据仓库中ETL策略与架构设计 被引量:45
18
作者 尤玉林 张宪民 《计算机工程与应用》 CSCD 北大核心 2005年第10期172-174,229,共4页
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地... 作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。 展开更多
关键词 数据仓库 etl 数据抽取 数据转换 数据清洗 数据装载
下载PDF
一种元数据驱动的ETL方法的研究 被引量:15
19
作者 宋杰 王大玲 +1 位作者 鲍玉斌 于戈 《小型微型计算机系统》 CSCD 北大核心 2007年第12期2167-2173,共7页
数据仓库研究中最重要的问题之一是对ETL方法的研究.本研究提出ETL工具是元数据驱动的,以提供更好的柔性机制、扩展能力和可操作性.本文给出了一种基于SQL的元数据驱动的ETL方法的设计和实现细节,并且以国家海洋环境数据仓库为例,证明... 数据仓库研究中最重要的问题之一是对ETL方法的研究.本研究提出ETL工具是元数据驱动的,以提供更好的柔性机制、扩展能力和可操作性.本文给出了一种基于SQL的元数据驱动的ETL方法的设计和实现细节,并且以国家海洋环境数据仓库为例,证明了这种方法的高效性. 展开更多
关键词 etl 数据仓库 元数据
下载PDF
基于MapReduce的分布式ETL体系结构研究 被引量:9
20
作者 宋杰 郝文宁 +2 位作者 陈刚 靳大尉 赵水宁 《计算机科学》 CSCD 北大核心 2013年第6期152-154,共3页
针对传统ETL工具集中式执行方式的不足,提出了一种基于MapReduce的分布式ETL体系结构——MDETL(MapReduce Distributed ETL)。该体系结构采用MapReduce并发处理海量数据的并行编程模型,结合分布式ETL的集群运算方法,实现了集群分布式执... 针对传统ETL工具集中式执行方式的不足,提出了一种基于MapReduce的分布式ETL体系结构——MDETL(MapReduce Distributed ETL)。该体系结构采用MapReduce并发处理海量数据的并行编程模型,结合分布式ETL的集群运算方法,实现了集群分布式执行ETL流程,从而提高了整个ETL系统的灵活性和吞吐率,并具有较好的可扩展性和负载平衡性能,提高了执行效率。 展开更多
关键词 etl MAPREDUCE 分布式
下载PDF
上一页 1 2 47 下一页 到第
使用帮助 返回顶部