一种适应GPU的混合OLAP查询处理模型被引量：9

GPU Adaptive Hybrid OLAP Query Processing Model

下载PDF

导出

摘要通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上的算法实现和性能优化技术,以哈希连接的GPU并行算法研究为中心.GPU拥有数千个并行计算单元,但其逻辑控制单元较少,相对于CPU具有更强的并行计算能力,但逻辑控制和复杂内存管理能力较弱,因此并不适合需要复杂数据结构和复杂内存管理机制的内存数据库查询处理算法直接移植到GPU平台.提出了面向GPU向量计算特性的混合OLAP多维分析模型semi-MOLAP,将MOLAP(multidimensional OLAP)模型的直接数组访问和计算特性与ROLAP模型的存储效率结合在一起,实现了一个基于完全数组结构的GPU semi-MOLAP多维分析模型,简化了GPU数据管理,降低了GPU semi-MOLAP算法复杂度,提高了GPU semiMOLAP算法的代码执行率.同时,基于GPU和CPU计算的特点,将semi-MOLAP操作符拆分为CPU和GPU平台的协同计算,提高了CPU和GPU的利用率以及OLAP的查询整体性能. The general purpose graphic computing units（GPGPUs） have become the new platform for high performance computing due to their massive parallel computing power, and in recent years more and more high performance database research has placed focus on GPU database development. However, today＇s GPU database researches commonly inherit ROLAP（relational OLAP） model, and mainly address how to realize relational operators in GPU platform and performance tuning, especially on GPU oriented parallel hash join algorithm. GPUs have higher parallel computing power than CPUs but less logical control and management capacity for complex data structure, therefore they are not adaptive for directly migrating the in-memory database query processing algorithms based on complex data structure and memory management. This paper proposes a GPU vectorized processing oriented hybrid OLAP model, semi-MOLAP, which combines direct array access and array computing of MOLAP with storage efficiency of ROLAP. The pure array oriented GPU semi-MOLAP model simplifies GPU data management, reduces complexity of GPU semi-MOLAP algorithms and improves their code efficiency. Meanwhile, the semi-MOLAP operators are divided into co-computing operators on CPU and GPU platforms to improve utilization of both CPUs and GPUs for higher query processing performance.

作者张宇张延松陈红王珊

机构地区数据工程与知识工程教育部重点实验室(中国人民大学) 中国人民大学信息学院中国人民大学中国调查与数据中心

出处《软件学报》 EI CSCD 北大核心 2016年第5期1246-1265,共20页 Journal of Software

基金中央高校基本科研业务费专项资金(16XNLQ0,13XNLF01) 华为创新研究计划(HIRP 20140507,HIRP 20140510)~~

关键词 GPU 联机分析处理内存数据库协同计算数组计算 GPU OLAP in-memory database co-computing array computing

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1甄真,陈虎,张林亚.列数据库的SQL查询语句编译与优化[J].计算机工程,2013,39(6):60-65. 被引量：2

二级参考文献1

1李静,孙莉,王梅东.列存储数据查询中的连接策略选择方法[J].计算机科学与探索,2010,4(9):850-858. 被引量：4

共引文献1

1张忠文,朱臣武,周海坤,姜佳媛.煤矿安全监控联网大数据存储技术[J].煤矿安全,2016,47(7):95-98. 被引量：16

同被引文献61

1李星敏,卓静,李登科,张树誉,景毅刚.MODIS植被指数及其分县统计分析的实现[J].气象科技,2006,34(2):175-179. 被引量：6
2SEBASTIAN ANTHONYIntel unveils new Xeon chip with integrated FPGA, touts 20x performance boost [EB/OL]. (2014-01-19)[2.015-12-25]. http://www.extremetech.com/extreme/184828-intel-unveils-new-xeon-chip- wit h-integrated-fpga-t out s-20x-per formance-boost.
3JIM H. IBM launches flashDIMMs [EB/OL]. (2014-01-20)[2015-12-25]. http://thessdguy.com/ibm-launches- flash-dimms/.
4ANTON S. Inteh First 3D XPoint SSDs will feature up to 6GB/s of bandwidth [EB/OL]. (2015-08-28)[2016- 03-16]. http : / / www.kitguru.net / cmpnents / memry / antn-shiv / inte-rst-3d- xpint-ssds-wi-feature-up-t- 6gbs-of-bandwidt h/.
5BLANAS S, LI Y, PATEL J M. Design and evaluation of main memory hash join algorithms for multi-core CPUs [C]//SIGMOD. 2011: 37-48.
6BALKESEN C, TEUBNER J, ALONSO Get al Main-memory hash joins on multi-core cpus: Tuning to the underlying hardware [C]//ICDE. 2013: 362-373.
7ALBUTIU M-C, KEMPER A, NEUMANN T Massively parallel sort-merge joins in main memory multi-core data-base systems [J]. VLDB Endowment, 2012, 5(10): 1064-1075.
8HE B, YANG K, FANG Ret al. Relational joins on graphics processors [C]//SIGMOD. 2008: 511-524.
9YUAN Y, LEE R, ZHANG XThe yin and yang of processing data warehousing queries on GPU devices [J]. PVLDB, 2013, 6(10): 817-828.
10PIRK I-I, MANEGOLD S, KERSTEN M L. Accelerating foreign-key joins using asymmetric memory channels [C]//ADMSQVLDB. 2011: 27-35.

引证文献9

1张延松,张宇,周烜,王珊.不对称内存计算平台OLAP查询处理技术研究[J].华东师范大学学报（自然科学版）,2016(5):89-102. 被引量：2
2张培培,王若楠.基于多维数据集的医院收入构成智能监测系统设计[J].电脑编程技巧与维护,2018(3):97-99.
3沈夏炯,侯柏成,韩道军,马瑞.基于流水线的增强型植被指数快速提取算法[J].计算机应用研究,2018,35(9):2827-2830. 被引量：1
4刘凯铭,王洪亮,石兵波,钱育蓉.基于Hadoop的油气水井生产大数据分析与应用[J].科学技术与工程,2020,20(11):4464-4471. 被引量：8
5张龙翔,曹云鹏,王海峰.面向大数据复杂应用的GPU协同计算模型[J].计算机应用研究,2020,37(7):2049-2053. 被引量：3
6裴威,李战怀,潘巍.GPU数据库核心技术综述[J].软件学报,2021,32(3):859-885. 被引量：9
7屠要峰,陈河堆,王涵毅,闫宗帅,秦小麟,陈兵.面向GoldenX软硬协同优化的异构加速列式存储引擎研究[J].计算机学报,2022,45(1):207-223. 被引量：3
8张延松,刘专,韩瑞琛,张宇,王珊.GPU数据库OLAP优化技术研究[J].软件学报,2023,34(11):5205-5229.
9刘鹏,陈红,张延松,李翠平.GPU数据库实现技术发展演进[J].计算机学报,2024,47(11):2691-2724.

二级引证文献26

1陈昉,杜战朝,倪翊龙,邵高峰,李丹丹,徐高.民用建筑“四节一环保”数据建模与存储方法研究[J].建筑科学,2020,36(S02):382-389. 被引量：2
2王洪亮,穆龙新,时付更,刘凯铭,钱育蓉.分散存储油气生产动态大数据的优化管理与快速查询[J].石油勘探与开发,2019,46(5):959-965. 被引量：9
3刘凯铭,王洪亮,石兵波,钱育蓉.基于Hadoop的油气水井生产大数据分析与应用[J].科学技术与工程,2020,20(11):4464-4471. 被引量：8
4吴鹏,周宁宁.PipeCNN:一种基于软件流水线的并行化卷积神经网络方法[J].计算机应用研究,2021,38(4):1079-1083. 被引量：1
5黄坤.基于GPU并行计算的石油数据管理系统研究[J].电子技术与软件工程,2021(3):175-176.
6李攀,刘庆杰,周兆军,刘颖,李寒莉.大数据技术的震后救援信息处理平台研制与应用[J].科学技术与工程,2021,21(15):6154-6164. 被引量：2
7杨琳,徐慧英,马文龙.基于边界条件GAN的不平衡大数据模糊分类[J].西南师范大学学报（自然科学版）,2021,46(7):97-102. 被引量：4
8周若男.基于大数据的油气生产数据智能化分析与预警[J].信息系统工程,2021,34(5):33-35.
9谯英,李代先,周少丹.油田勘探开发云平台数据存储模型研究与实践[J].西安石油大学学报（自然科学版）,2021,36(6):128-133. 被引量：9
10李晓东.基于移动物联网技术的青贮饲料可追溯系统设计[J].饲料研究,2022,45(8):123-126. 被引量：7

1袁涛,马艳,刘定生.GPU在遥感图像处理中的应用综述[J].遥感信息,2012,34(6):110-117. 被引量：14
2姜久华,涂玲.关于优化地质调查国拨项目执行率的几点思考——以地质类高校为例[J].中国管理信息化,2015,18(22):28-29.
3伍行素,熊艰.OLAP在连锁超市中的应用研究[J].信息技术,2011,35(3):76-79.
4陈龙,万定生,顾昕辰.基于Hive的水利普查数据仓库[J].计算机与现代化,2014(5):127-130. 被引量：9
5胡永泉,李建,梁美红,荣磊.OLAP在固井复杂情况分析中的应用[J].信息技术,2010(1):118-120.
6潘东静,任传成,刘建军.基于数据仓库的学生选课分析[J].教育信息化,2005(11S):36-37.
7徐庆岳,何清法,蒋志勇,赵殿奎.Hashjoin算子矢量化优化[J].计算机与数字工程,2014,42(11):2041-2044.
8潘东静.基于OLAP的多维分析模型设计及应用[J].德州学院学报,2004,20(6):55-58. 被引量：6
9桑国珍,陈永锋.基于矿业的数据仓库多维分析模型设计[J].矿业工程,2005,3(2):59-60. 被引量：2
10刘璋.GPU加速高清视频解码技术的应用[J].云梦学刊,2007,28(S1):183-184.

软件学报

2016年第5期

浏览历史

内容加载中请稍等...

一种适应GPU的混合OLAP查询处理模型被引量：9

参考文献1

二级参考文献1

共引文献1

同被引文献61

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

一种适应GPU的混合OLAP查询处理模型 被引量：9

参考文献1

二级参考文献1

共引文献1

同被引文献61

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

一种适应GPU的混合OLAP查询处理模型被引量：9