-
题名SDD-1改进算法在Hive中应用
被引量:7
- 1
-
-
作者
王宝进
吴淑跃
薛娟
-
机构
江苏大学计算机科学与通讯工程学院
江苏省交通技师学院电气与信息工程系
-
出处
《湘潭大学自然科学学报》
CAS
北大核心
2014年第4期77-82,共6页
-
基金
国家自然科学基金项目(61072002)
-
文摘
针对Hive在处理连接查询时所存在的执行时间长和带宽资源消耗大等问题,提出了一种基于数据预处理和双半连接的SDD-1改进算法.首先,引入预处理技术,在各分布节点对原始数据进行归并排序,以减少汇聚节点的数据映射次数,加快数据处理执行速度;其次,采用基于行和列的双半连接技术,进一步缩减在不同节点间的数据传输量,减少带宽资源消耗.仿真实验表明,相比原始的Hive连接算法,改进算法在元组数达到5 000和8 000时,可使查询速度提升10%,有效缩短查询的处理和响应时间,该改进算法可方便地应用到其他云计算平台上.
-
关键词
数据预处理
双半连接
SDD-1改进算法
-
Keywords
data pre-processing
double half connected
SDD-1 improved algorithm
-
分类号
TP323
[自动化与计算机技术—计算机系统结构]
-