摘要
为了解决大数据的深度挖掘和即时查询的需求,建立了一个分布式、可伸缩、低成本和大容量的并行计算集群,实现了半结构化数据的SQL查询分析,并提供了标准对外接口。
To satisfy the requirement of in-depth mining and online query for big data, we construct a distributed, scalable, low-cost, and high-capacity parallel computing cluster. It implements SQL query for semi-structured data, and provides standard external interfaces.
出处
《山东科学》
CAS
2015年第5期115-119,共5页
Shandong Science
关键词
大数据
并行计算
半结构化
即时查询
big data
parallel computing
semi-structured
Hadoop
online query