期刊文献+
共找到938篇文章
< 1 2 47 >
每页显示 20 50 100
基于ETL的飞行数据复盘软件设计研究
1
作者 王凯 殷华杰 张彦 《航空电子技术》 2024年第2期62-69,共8页
本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组... 本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组成、设计流程和实现原理。该方案降低了系统开发的复杂度,提高了飞行数据管理的效率和数据复盘自动化水平。 展开更多
关键词 飞行数据 etl 数据复盘
下载PDF
基于大数据ETL引擎的批量智能开发平台研究
2
作者 曾国文 梁华生 钟玲 《电信工程技术与标准化》 2024年第3期20-25,共6页
大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表... 大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表和数据质量稽核等XML脚本,转译ETL的XML代码为可执行Java代码,降低操作员使用平台的技术难度。通过实操验证,本文提出的方法能增加平台的开发效率,更快速实现需求。 展开更多
关键词 数据仓库 etl引擎 XML脚本 批量开发
下载PDF
Research on Enhanced Contraband Dataset ACXray Based on ETL
3
作者 Xueping Song Jianming Yang +1 位作者 Shuyu Zhang Jicun Zhang 《Computers, Materials & Continua》 SCIE EI 2024年第6期4551-4572,共22页
To address the shortage of public datasets for customs X-ray images of contraband and the difficulties in deploying trained models in engineering applications,a method has been proposed that employs the Extract-Transf... To address the shortage of public datasets for customs X-ray images of contraband and the difficulties in deploying trained models in engineering applications,a method has been proposed that employs the Extract-Transform-Load(ETL)approach to create an X-ray dataset of contraband items.Initially,X-ray scatter image data is collected and cleaned.Using Kafka message queues and the Elasticsearch(ES)distributed search engine,the data is transmitted in real-time to cloud servers.Subsequently,contraband data is annotated using a combination of neural networks and manual methods to improve annotation efficiency and implemented mean hash algorithm for quick image retrieval.The method of integrating targets with backgrounds has enhanced the X-ray contraband image data,increasing the number of positive samples.Finally,an Airport Customs X-ray dataset(ACXray)compatible with customs business scenarios has been constructed,featuring an increased number of positive contraband samples.Experimental tests using three datasets to train the Mask Region-based Convolutional Neural Network(Mask R-CNN)algorithm and tested on 400 real customs images revealed that the recognition accuracy of algorithms trained with Security Inspection X-ray(SIXray)and Occluded Prohibited Items X-ray(OPIXray)decreased by 16.3%and 15.1%,respectively,while the ACXray dataset trained algorithm’s accuracy was almost unaffected.This indicates that the ACXray dataset-trained algorithm possesses strong generalization capabilities and is more suitable for customs detection scenarios. 展开更多
关键词 X-ray contraband etl data enhancement DATASET
下载PDF
基于ETL工具开发的气象数据共享平台
4
作者 张蛟娇 《科技传播》 2024年第8期128-131,共4页
为打破行业数据壁垒,解决气象数据跨行业共享安全性较低、共享数据管理滞后等问题,内蒙古自治区气象数据中心基于ETL工具开发气象数据共享平台,平台针对不同数据共享清单定制数据推送策略,实现数据自动抽取、清洗、推送、全流程日志记录... 为打破行业数据壁垒,解决气象数据跨行业共享安全性较低、共享数据管理滞后等问题,内蒙古自治区气象数据中心基于ETL工具开发气象数据共享平台,平台针对不同数据共享清单定制数据推送策略,实现数据自动抽取、清洗、推送、全流程日志记录,开发可视化数据共享管理平台对交换数据进行统一管理,并将异常状态告警推送至“天镜”系统Alert平台实现告警信息可视化展示。该平台的建设为跨行业数据共享和产品融合提供安全可靠平台,为提高气象部门公共服务能力提供数据支持。 展开更多
关键词 etl工具 气象 管理平台 数据共享
下载PDF
数字化钻井ETL增量数据抽取与同步机制
5
作者 康芳玲 王建胜 《信息系统工程》 2024年第10期84-87,共4页
随着石油钻井行业数字化转型的深入推进,数据的实时性、准确性和完整性对提高钻井效率和决策质量至关重要。针对数字化钻井环境下数据抽取、转换和加载(ETL)过程中的增量数据抽取与同步问题,提出了一种基于时间戳和变更数据捕获(CDC)的... 随着石油钻井行业数字化转型的深入推进,数据的实时性、准确性和完整性对提高钻井效率和决策质量至关重要。针对数字化钻井环境下数据抽取、转换和加载(ETL)过程中的增量数据抽取与同步问题,提出了一种基于时间戳和变更数据捕获(CDC)的混合机制。该机制通过对源数据系统的日志分析和数据比对,实现了高效、准确的增量数据识别和抽取。同时,采用分布式消息队列和实时流处理技术,构建了一个低延迟、高吞吐量的数据同步管道。 展开更多
关键词 数字化钻井 etl 增量数据抽取 数据同步 变更数据捕获
下载PDF
Arc GIS Spatial ETL工具在国土空间规划数据处理中的应用
6
作者 沈建国 《数字技术与应用》 2024年第4期169-171,共3页
在国土空间规划编制中,基础数据整合处理工作十分重要,也很繁重。本文在分析国土空间规划收集的基础数据特点和整合难点的前提下,从Spatial ETL Tool的功能、工作空间的创建、模型参数定义、模型的保存与调用以及规划基础信息数据库组... 在国土空间规划编制中,基础数据整合处理工作十分重要,也很繁重。本文在分析国土空间规划收集的基础数据特点和整合难点的前提下,从Spatial ETL Tool的功能、工作空间的创建、模型参数定义、模型的保存与调用以及规划基础信息数据库组织结构进行全方位的分析,阐明Spatial ETL Tool的使用方法和技术优势,有利于提高国土空间规划数据整合与数据处理效率,减少规划从业人员的工作量,同时对测绘及地理信息行业技术从业人员具有一定的参考价值。 展开更多
关键词 数据整合 数据处理效率 参数定义 etl 基础信息数据库 Tool 国土空间规划 数据特点
下载PDF
基于ETL和触发器的数据采集整编复演方法研究
7
作者 潘阳 朱江 +3 位作者 钱诗君 韦涛 石进 高瀚远 《信息化研究》 2023年第1期32-37,共6页
数据整编复演对指挥信息系统优化决策、提升效能具有重要意义,逐渐成为研究热点。文章针对传统数据集中整编效率低、定制研发适应性差等问题提出一种基于ETL(Extraction,Transformation,Loading)和触发器的指挥信息系统过程数据自动采... 数据整编复演对指挥信息系统优化决策、提升效能具有重要意义,逐渐成为研究热点。文章针对传统数据集中整编效率低、定制研发适应性差等问题提出一种基于ETL(Extraction,Transformation,Loading)和触发器的指挥信息系统过程数据自动采集和整编复演方法。首先通过配置全量和增量数据抽取任务实现信息系统全过程数据自动采集引接;同时提出基于数据库触发器的数据整编模式,实现对ETL抽取到的增量数据进行伴随计算处理,平滑分散了集中整编的巨大工作量;然后构建回放复演引擎提供指挥信息系统复盘可视化呈现能力;最后通过仿真验证了该方法的整编处理效率和灵活扩展性,并且对自主可控环境有较好的兼容性。 展开更多
关键词 指挥信息系统 数据整编 复演 etl 触发器 自主可控环境
下载PDF
增量式ETL工具的研究与实现 被引量:20
8
作者 章水鑫 徐宏炳 于立 《现代计算机》 2005年第3期6-10,共5页
利用数据源的增量数据对数据仓库进行维护,可以有效提高ETL效率。现有通用ETL工具在增量抽取方面存在一些问题,如不能抽取多个异构数据源的增量数据以及在处理增量数据时造成数据丢失的异常问题。本文从实践角度设计的增量式ETL工具采... 利用数据源的增量数据对数据仓库进行维护,可以有效提高ETL效率。现有通用ETL工具在增量抽取方面存在一些问题,如不能抽取多个异构数据源的增量数据以及在处理增量数据时造成数据丢失的异常问题。本文从实践角度设计的增量式ETL工具采用集成多种增量数据捕获方式,解决异构数据源在捕获增量数据上的差异;在数据处理过程中,通过辅助表的手段解决了数据丢失的问题。在文章的最后,还介绍了ETL过程中数据转换和转换调度的实现。 展开更多
关键词 增量式etl工具 数据源 数据仓库 etl效率 SEUetl工具 增量数据
下载PDF
基于数据仓库ETL技术的电力技改大修项目数据清洗方法 被引量:1
9
作者 沈海天 嵇惠方 +2 位作者 游睿 唐梁 谢晓锋 《电工技术》 2023年第14期177-179,共3页
由于重复数据和空缺数据数量多,电力技改大修项目数据清洗方法不能实现脏数据的有效清洗,为此研究基于数据仓库ETL技术的电力技改大修项目数据清洗方法。通过对多数据源的电力技改大修项目脏数据质量的评估,判断符合预期标准后进行数据... 由于重复数据和空缺数据数量多,电力技改大修项目数据清洗方法不能实现脏数据的有效清洗,为此研究基于数据仓库ETL技术的电力技改大修项目数据清洗方法。通过对多数据源的电力技改大修项目脏数据质量的评估,判断符合预期标准后进行数据挖掘;结合数据仓库ETL技术对重复数据记录进行清洗;运用切比雪夫定理处理电力技改大修项目数据空缺值来完成对电力技改大修项目数据的有效清洗。实验结果表明,运用该方法清洗数据有效率最高,有效提高了数据的质量,实现了对数据的高质量清洗。 展开更多
关键词 数据仓库 etl技术 数据清洗
下载PDF
ETL Maturity Model for Data Warehouse Systems:A CMMI Compliant Framework
10
作者 Musawwer Khan Islam Ali +6 位作者 Shahzada Khurram Salman Naseer Shafiq Ahmad Ahmed T.Soliman Akber Abid Gardezi Muhammad Shafiq Jin-Ghoo Choi 《Computers, Materials & Continua》 SCIE EI 2023年第2期3849-3863,共15页
The effectiveness of the Business Intelligence(BI)system mainly depends on the quality of knowledge it produces.The decision-making process is hindered,and the user’s trust is lost,if the knowledge offered is undesir... The effectiveness of the Business Intelligence(BI)system mainly depends on the quality of knowledge it produces.The decision-making process is hindered,and the user’s trust is lost,if the knowledge offered is undesired or of poor quality.A Data Warehouse(DW)is a huge collection of data gathered from many sources and an important part of any BI solution to assist management in making better decisions.The Extract,Transform,and Load(ETL)process is the backbone of a DW system,and it is responsible for moving data from source systems into the DW system.The more mature the ETL process the more reliable the DW system.In this paper,we propose the ETL Maturity Model(EMM)that assists organizations in achieving a high-quality ETL system and thereby enhancing the quality of knowledge produced.The EMM is made up of five levels of maturity i.e.,Chaotic,Acceptable,Stable,Efficient and Reliable.Each level of maturity contains Key Process Areas(KPAs)that have been endorsed by industry experts and include all critical features of a good ETL system.Quality Objectives(QOs)are defined procedures that,when implemented,resulted in a high-quality ETL process.Each KPA has its own set of QOs,the execution of which meets the requirements of that KPA.Multiple brainstorming sessions with relevant industry experts helped to enhance the model.EMMwas deployed in two key projects utilizing multiple case studies to supplement the validation process and support our claim.This model can assist organizations in improving their current ETL process and transforming it into a more mature ETL system.This model can also provide high-quality information to assist users inmaking better decisions and gaining their trust. 展开更多
关键词 etl maturity model CMMI data warehouse maturity model
下载PDF
基于MapReduce的分布式ETL多维数据模型研究 被引量:2
11
作者 宋杰 郝文宁 +2 位作者 陈刚 靳大尉 赵成 《计算机科学》 CSCD 北大核心 2013年第11A期263-266,共4页
针对MapReduce缺少对ETL上层数据模型的具体描述,提出了一种集成的基于MapReduce的分布式ETL(MapReduce Distributed ETL,简称MDETL)多维数据模型处理方法其,把对数据的处理分解成对数据属性(维和事实)的处理,解决了ETL上层具体数据模... 针对MapReduce缺少对ETL上层数据模型的具体描述,提出了一种集成的基于MapReduce的分布式ETL(MapReduce Distributed ETL,简称MDETL)多维数据模型处理方法其,把对数据的处理分解成对数据属性(维和事实)的处理,解决了ETL上层具体数据模型的构建问题。用真实的数据集评估了它的性能,实验结果表明MDETL具有很好的可扩展性。 展开更多
关键词 etl MAPREDUCE MDetl 事实
下载PDF
基于FME-ETL自动绘制盾构区间管片平面图的技术和应用
12
作者 肖云 孙有恒 李良 《价值工程》 2023年第21期75-77,共3页
在地铁区间盾构施工过程中,基于无人机航拍正射影像图叠加盾构施工设计管片图,并通过盾构实时监控系统获取当前施工对应的环号,可在无人机航拍正射影像图上清晰表达地下设备设施对应的地表环境,从而使管理者更全面、更精准掌控盾构施工... 在地铁区间盾构施工过程中,基于无人机航拍正射影像图叠加盾构施工设计管片图,并通过盾构实时监控系统获取当前施工对应的环号,可在无人机航拍正射影像图上清晰表达地下设备设施对应的地表环境,从而使管理者更全面、更精准掌控盾构施工面临的各类穿越风险。基于FME-ETL自动绘制盾构区间管片平面图的技术(以下简称“管片平面图自动生成技术”),是基于设计院提供的盾构施工设计中心线、盾构区间设计环数、管片外径设计参数,按依次对盾构施工中心线进行分段、计算分段端点的法线、绘制管环外径边线图形的技术路线。使用FME-TEL工具,自动绘制盾构区间管片平面图,并保持与盾构施工设计图相同的坐标系。该管片平面图自动生成技术,支持数据的批量处理,相比CAD人工绘图,既大幅提高了工作效率,也降低了人工绘图的错误率。 展开更多
关键词 FME etl 盾构施工 自动绘制 管片平面图
下载PDF
基于CWM的商场数据仓库ETL系统架构研究 被引量:4
13
作者 雷启明 《商场现代化》 北大核心 2008年第26期39-40,共2页
在完成商场数据仓库数据模型的设计与构建后,数据的抽取、转换、加载成为建立数据仓库最重要的工作。针对商场数据仓库对ETL技术的要求,在研究CWM工作机制的基础上,提出了基于CWM的商场数据仓库ETL系统架构的设计。通过分析CWM对ETL提... 在完成商场数据仓库数据模型的设计与构建后,数据的抽取、转换、加载成为建立数据仓库最重要的工作。针对商场数据仓库对ETL技术的要求,在研究CWM工作机制的基础上,提出了基于CWM的商场数据仓库ETL系统架构的设计。通过分析CWM对ETL提供的技术支持,论证了系统架构的可行性和科学性。 展开更多
关键词 商场数据仓库 etl 元数据 CWM etl系统架构
下载PDF
数据ETL问题研究 被引量:4
14
作者 王新英 《湖南工程学院学报(自然科学版)》 2004年第3期63-65,共3页
数据ETL(DataExtraction,TransformationandLoading)是数据仓库、数据挖掘以及商业智能等技术的基石,其主要用来实现异构多数据源的数据集成.首先简单介绍了ETL概念、背景、应用领域,然后着重讨论了ETL在异构数据源集成和脏数据检测中... 数据ETL(DataExtraction,TransformationandLoading)是数据仓库、数据挖掘以及商业智能等技术的基石,其主要用来实现异构多数据源的数据集成.首先简单介绍了ETL概念、背景、应用领域,然后着重讨论了ETL在异构数据源集成和脏数据检测中的应用、所面临的挑战等问题.最后总结介绍了ETL的三大发展趋势. 展开更多
关键词 etl 数据集成 etl展望
下载PDF
数据仓库中ETL技术的研究 被引量:118
15
作者 张宁 贾自艳 史忠植 《计算机工程与应用》 CSCD 北大核心 2002年第24期213-216,共4页
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL... 作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。 展开更多
关键词 数据仓库 etl 数据库 数据模型 数据抽取 数据转换 数据清洗 数据装载
下载PDF
面向数据集成的ETL系统设计与实现 被引量:21
16
作者 钟华 冯文澜 +1 位作者 谭红星 黄涛 《计算机科学》 CSCD 北大核心 2004年第9期87-89,F004,共4页
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了... ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。 展开更多
关键词 etl 数据集成 过程模型 数据抽取 企业应用集成 数据仓库 转换 系统总体结构 业务数据 信息系统
下载PDF
增量ETL过程自动化产生方法的研究 被引量:19
17
作者 张旭峰 孙未未 +2 位作者 汪卫 冯雅慧 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1097-1103,共7页
ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自... ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自动化产生方法进行了研究,根据已有的全量ETL过程,可以自动产生增量ETL过程,从而降低设计增量ETL过程的代价·利用已有的物化视图增量维护的方法,给出了根据全量ETL过程自动产生增量ETL过程的方法·但是已有的研究集中在包含选择、投影、联接和聚合运算情况下物化视图的增量维护,未见对包括差运算情况下的讨论·作为研究工作的基础,还详细讨论了包含差运算情况下物化视图的增量维护问题· 展开更多
关键词 etl 数据仓库 增量维护 物化视图 自维护
下载PDF
面向数据质量的ETL过程建模与实现 被引量:23
18
作者 贾自艳 黄友平 +3 位作者 罗平 李嘉佑 秦亮曦 史忠植 《系统仿真学报》 CAS CSCD 2004年第5期907-911,914,共6页
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程... 为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。 展开更多
关键词 数据仓库 数据质量 抽取-转换-装载(etl) 数据挖掘 数据清洗
下载PDF
数据仓库中ETL技术的探讨与实践 被引量:31
19
作者 王克龙 王玲 +1 位作者 王平立 宋斌 《计算机应用与软件》 CSCD 北大核心 2005年第11期30-31,78,共3页
支持数据抽取、转换、清洗和装载的工具集对任何数据仓库工程都是一个必不可少的关键部件。本文重点探讨了ETL技术以及ETL工具的选择原则,并结合具体实例详细介绍了ETL过程的设计和实现方法。
关键词 数据仓库 etl技术 数据抽取 数据挖掘 联机分析 可靠性
下载PDF
数据ETL工具通用框架设计 被引量:26
20
作者 周宏广 周继承 +1 位作者 彭银桥 龙思锐 《计算机应用》 CSCD 北大核心 2003年第12期96-98,共3页
异构多数据源集成和数据清洗是将操作数据导入数据仓库过程中面临的两大挑战。从实践角度设计了数据ETL工具的整体框架,使用通用数据访问接口来屏蔽各种数据源之间的差异,并以数据清洗为主要目的,为消除多数据源的模式冲突和数据冲突提... 异构多数据源集成和数据清洗是将操作数据导入数据仓库过程中面临的两大挑战。从实践角度设计了数据ETL工具的整体框架,使用通用数据访问接口来屏蔽各种数据源之间的差异,并以数据清洗为主要目的,为消除多数据源的模式冲突和数据冲突提供了通用而有效的解决方案。 展开更多
关键词 数据etl 数据集成 数据清洗
下载PDF
上一页 1 2 47 下一页 到第
使用帮助 返回顶部