期刊文献+

分布式数据集成管理工具的研究与实践

Research and Practice of Distributed Data Integration Management Tools
原文传递
导出
摘要 随着大数据时代的到来,企业管理着规模庞大的数据资产,为满足企业日常批量数据集成、数据批量共享交换、数据分析的需求,本研究针对企业日常批量数据集成、数据批量共享交换、数据分析的工作的现状和难点,以及传统集中式数据集成管理工具存在的不足,提出了分布式数据集成管理工具解决方案,通过多节点、多线程的作业模式和智能化作业调度关键技术研究,完成了分布式数据集成管理工具搭建,并进行了试点应用,完成50亿条数据的抽取转换工作从82小时缩短至16小时,12亿条数据的抽取转换工作从19小时的抽取工作缩短至4小时,有效提升了数据集成效率。 With the arrival of large data age, enterprises manage large-scale data assets. In order to meet the needs of daily batch data integration, data batch sharing and data analysis, this study aims at the daily batch data integration, data batch sharing exchange,The status quo and difficulties of data analysis, and the shortcomings of traditional centralized data integration management tools, and proposed a distributed data integration management tool solution, through multi-node, multi-threaded mode of operation and intelligent operation scheduling key technology research, Completed the distributed data integration management tools to build, and conducted a pilot application to complete the extraction of 5 billion data conversion work from 82 hours to 16 hours, 1.2 billion data extraction conversion work from 19 hours of extraction work shortened to 4 hours, effectively improving the data integration efficiency.
出处 《自动化与仪器仪表》 2017年第5期33-36,共4页 Automation & Instrumentation
关键词 分布式 数据集成 多线程 distributed data integration multitbreading
  • 相关文献

参考文献11

二级参考文献100

共引文献310

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部