-
题名向量分组聚集计算技术研究
- 1
-
-
作者
张宇
张延松
-
机构
国家卫星气象中心
中国人民大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第11期84-94,共11页
-
基金
国家自然科学基金(61772533)
北京市自然科学基金(4192066)。
-
文摘
分组聚集计算是OLAP重要的操作符之一,分组聚集操作是一种数据密集型负载。在内存数据库和GPU数据库应用场景下不仅需要研究其性能优化技术,还需要研究如何优化分配分组聚集计算执行场地以最小化CPU与GPU之间的数据传输代价。针对异构计算平台的硬件特征提出了向量聚集计算技术,将位于传统流水线末端的分组聚集计算按照"早分组,晚聚集"策略进行分解与下推,实现将数据密集型的分组聚集计算从流水线中分离,将操作与处理器计算特性优化匹配,实现异构计算平台上最优的负载分配。通过将传统基于哈希分组的聚集计算转换为向量分组聚集计算,显著提升了分组聚集计算性能。实验结果表明,向量分组聚集技术相对于具有代表性的高性能内存数据库Hyper、GPU数据库MapD最大达到5~8倍的性能提升。向量聚集计算不仅提高了OLAP聚集计算性能,而且实现了将数据密集型负载从查询计划中分离的目标,使异构计算平台能够根据处理器的硬件特性优化配置计算资源,提高异构计算平台OLAP的整体性能。
-
关键词
CPU-GPU异构计算平台
向量分组聚集
分组向量索引
数据密集型负载
-
Keywords
CPU-GPU heterogeneous computing platform
vector grouping&aggregation
group vector index
computingintensive workload
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-