期刊文献+

数据湖研究综述

Overview of Data Lake Research
下载PDF
导出
摘要 数据湖作为一种新兴的数据处理和分析技术,在处理大规模数据集方面表现出了显著的性能优势。国内外相关文献对数据湖的架构、关键技术和应用进行了全面而深入的研究,为相关研究人员提供了有价值的参考。文章首先对数据湖与数据仓库的概念进行了辨析,明确了两者的区别;其次概述了当前流行的数据湖框架和架构,并详细阐述了数据湖的核心功能,包括多源数据的集成、高效的数据存储和计算能力,以及有效的数据治理等;最后探讨了数据湖研究未来的发展方向,如存算分离技术和云原生应用等。 As an emerging data processing and analysis technology,data lakes have shown significant efficiency in processing large-scale datasets.In recent years,relevant literature at home and abroad has conducted comprehensive and in-depth research on the architecture,key technologies,and applications of data lakes,providing valuable references for relevant researchers.Firstly,the concepts of data lake and data warehouse are analyzed and the differences between the two are clarified in this paper.Secondly,framework and architecture of the current popular data lake are summarized,and the core functions of the data lake are elaborated,including the integration of multi-source data,efficient data storage and calculation,and effective data governance.Finally,the future development directions of data lake research are explored,such as storage and computing separation technology,and cloud native applications.
作者 郭利荣 童坤坤 GUO Lirong;TONG Kunkun(Big Data Studio,China DataCom Corporation Limited,Guangzhou 510650,China)
出处 《软件工程》 2023年第12期6-11,共6页 Software Engineering
关键词 数据湖 数据存储 数据仓库 数据分析 data lake data storage data warehouses data analysis
  • 相关文献

参考文献4

二级参考文献32

共引文献164

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部