期刊文献+

基于数据半衰期的数据仓库分级存储研究

Data Warehouse Optimization Based on Data Half Life and Big Data Technology
下载PDF
导出
摘要 在大数据时代,数据高速增长,对数据仓库管理方法和技术提出了全新挑战,为实现仓储资源优化配置,提高资源使用效率,首次把数据半衰期运用于数据仓库分级存储。传统固定阈值转存策略存在存储资源配置不合理的问题,利用半衰期分级存储策略,对每个数据对象进行计算分析后转存,采用MPP数据仓库和Ha?doop构建混合数据仓库存储架构,解决了大数据背景下的数据存储与分析,实现了数据仓库管理方法和数据存储架构的创新。实际验证发现,数据半衰期转存策略优于固定阈值转存策略,证明数据半衰期在数据仓库的管理中有显著应用价值。 In the era of big data,the rapid growth of data has brought new challenges to data warehouse management methods and technologies.This paper applies data half-life to hierarchical storage of data warehouses for the first time.The purpose is to optimize the configuration of storage resources and improve the efficiency of resource use.The traditional fixed-threshold save strategy has the shortcoming of unreasonable allocation of storage resources.A half-life storage strategy is used to calculate,analyze and transfer each data object.In terms of technology,MPP data warehouse and Hadoop are used to build hybrid data warehouse storage.The method solves the problem of data storage and facilitates analysis under the background of big data,and realizes the data warehouse management and data storage architecture innovation.The method of verifying the half-life of data by empirical method is better than that of the fixed threshold,which proves that the data half-life has significant application value in the data warehouse management.
作者 曾广移 卢勇 李德华 李俊超 ZENG Guang-wei;LU Yong;LI De-hua;LI Jun-chao(Southern Power Grid Peak Modulation FM Power Generation Co.,Ltd;Southern Power Grid Science Research Institute,Guangzhou 510623,China)
出处 《软件导刊》 2019年第2期123-127,131,共6页 Software Guide
关键词 数据半衰期 分级存储 HADOOP 数据仓库 data half life hierarchical storage Hadoop data warehouse
  • 相关文献

参考文献3

二级参考文献24

  • 1刘海伟,萧德洪,黄国凡.数字图书馆存储系统构建策略[J].大学图书馆学报,2004,22(3):41-43. 被引量:9
  • 2王芳,张顺达,冯丹,曾令仿.对象存储系统中的柔性对象分布策略[J].华中科技大学学报(自然科学版),2007,35(3):46-48. 被引量:5
  • 3http:∥www. legato.com/im/ilm/[EB]. Sep. 10, 2004
  • 4http:∥www.legato.com/storage/idm/[EB]. Sep. 2, 2004
  • 5http: ∥www. storagetek. com/products/disk_ storage. html[EB]. Oct. 2, 2004.
  • 6http: ∥ industry. ccidnet. com/pub/article/c786_ a9920_ p2.html [EB]. Oct. 2, 2004.
  • 7http: ∥ news. ccidnet. com/pub/article/c29_a9920_ p1. html[EB]. Nov. 13, 2004.
  • 8http: ∥ www. e800. com. cn/articles/42/1101208808462. html[EB]. Nov. 15, 2004.
  • 9国土资源部信息中心.《多源影像数据集成管理与应用关键技术研究》国土资源公益性项目实施方案[R],2012年7月.
  • 10唐竞.基于信息生命周期管理的数据迁移技术研究[D].湖南大学,2009.

共引文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部