期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
配用电大数据多源集成及存储优化方法 被引量:22
1
作者 王林童 赵腾 +2 位作者 张焰 苏运 田世明 《高电压技术》 EI CAS CSCD 北大核心 2018年第4期1131-1139,共9页
面对体量大、类型多、增长快的配用电大数据,如何利用大数据技术提升配用电相关业务的广度、深度和精度成为电力行业新的机遇和挑战。为解决配用电大数据多源集成和高效存储两方面核心问题,根据配用电大数据的组成及特征,通过生成标准... 面对体量大、类型多、增长快的配用电大数据,如何利用大数据技术提升配用电相关业务的广度、深度和精度成为电力行业新的机遇和挑战。为解决配用电大数据多源集成和高效存储两方面核心问题,根据配用电大数据的组成及特征,通过生成标准化元数据并构建相应数据字典的方法,实现了多源配用电数据规范化集成;在数据集成的基础上,基于Hadoop平台进行大数据存储优化方法研究,提出考虑配用电数据关联性的哈希分桶存储算法,实现了相关联数据的集中存储,从而提升后期数据查询及处理的效率并在数据存储优化的基础上,实现基于Map Reduce的多源配用电大数据并行关联查询。通过在Hadoop集群平台上进行测试表明,经过哈希分桶存储优化后的多源数据并行关联查询相比传统Hadoop方法查询时间显著缩短。 展开更多
关键词 配用电大数据 数据集成 HADOOP 哈希分桶存储 并行关联查询
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部