期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法 被引量:3
1
作者 郑灵逸 李擎 《现代计算机》 2021年第36期55-59,共5页
针对大数据时代数据量级随时间不断累积、在大数据环境中查询数据困难且缓慢的问题,提出一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法。本文应用的是Hadoop生态系统中Hive数据库,从Hive数据库里数据量级为Pb的数据当... 针对大数据时代数据量级随时间不断累积、在大数据环境中查询数据困难且缓慢的问题,提出一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法。本文应用的是Hadoop生态系统中Hive数据库,从Hive数据库里数据量级为Pb的数据当中,通过编写SQL语句查询出实验所需要的数据。当在查询数据量级过大、查询指标较多并且SQL查询语句冗长的情况下,都会造成查询时间过长和查询效率低的问题,提出增加SQL任务并行度与建立中间表组合的优化查询方法来解决这一问题。实验结果证明,本文提出的方法将大数据查询时间缩短为原来的25%,并且提高了集群的利用效率。 展开更多
关键词 大数据查询优化 Hive sql任务并行 建立中间表
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部