基于协处理器的HBase内存索引机制的研究被引量：11

Research and Implementation of HBase Memory Indexing Scheme Based on Coprocessor

下载PDF

导出

摘要为了实现对海量数据的高效存储和查询,众多NoSQL数据库被开发出来,HBase是其中之一。但原生的HBase数据库在进行数据查询时只支持主键索引,对非主键数据只能通过全表扫描的方式进行查询,极大降低了HBase的多条件查询速度。为此,提出了基于协处理器的HBase内存索引构建方案,通过协处理器实现对二级索引的快速构建并可根据HBase表的变化自动更新索引。同时,将建立的索引进行持久化操作,在使用时通过内存计算,极大地提高了索引数据检索速度,保证了索引的可用性和容错性。实验结果表明,该方案相比原生数据库的条件检索速度有了极大提升,相比于基于Solr和HiBase的二级索引方案检索速度也有所提升。 In order to achieve efficient storage and query of massive data,many NoSQL databases have been developed,and HBase is one of them.However,the native HBase database only supports the primary key index when performing data query,and the non-primary key data can only be queried by means of full table scan,which greatly reduces the multi-condition query speed of HBase.To this end,a HBase memory index construction scheme based on coprocessor is proposed.The coprocessor is used to quickly construct the secondary index and the index can be automatically updated according to the change of the HBase table.At the same time,the established index is persisted,and the memory calculation is used in use,which greatly improves the retrieval speed of the index data,and ensures the availability and fault tolerance of the index.Experiments show that the condition retrieval speed of the scheme is greatly improved compared with the original database,and the retrieval speed of the secondary index scheme based on Solr and HiBase is also improved.

作者朱松杰娄渊胜叶枫李凌陈勇 ZHU Songjie;LOU Yuansheng;YE Feng;LI Ling;CHEN Yong(Department of Computer and Information,Hohai University,Nanjing 211100,China;Postdoctoral Centre,Nanjing Longyuan Micro-Electronic Company,Nanjing 211106,China)

机构地区河海大学计算机与信息学院南京龙渊微电子科技有限公司博后工作站

出处《计算机工程与应用》 CSCD 北大核心 2020年第1期98-105,共8页 Computer Engineering and Applications

基金 2017江苏省博士后科研资助计划（No.1701020C) 2017江苏省“六大人才高峰”资助项目（No.XYDXX-078）中央高校基本业务费（No.2013B01814）

关键词 HBASE 内存索引 HT树持久化 HBase memory index HT tree durability

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1白红军,夏俭,林晨.大数据时代数据存储技术的发展[J].电子技术与软件工程,2017,0(4):174-174. 被引量：4
2申德荣,于戈,王习特,聂铁铮,寇月.支持大数据管理的NoSQL系统研究综述[J].软件学报,2013,24(8):1786-1803. 被引量：195
3葛微,罗圣美,周文辉,赵頔,唐云,周娟,曲文武,袁春风,黄宜华.HiBase:一种基于分层式索引的高效HBase查询技术与系统[J].计算机学报,2016,39(1):140-153. 被引量：56
4丁飞,陈长松,张涛,杨涛,张岩峰.基于协处理器的HBase区域级第二索引研究与实现[J].计算机应用,2014,34(A01):181-185. 被引量：16
5崔晨,郑林江,韩凤萍,何牧君.基于内存的HBase二级索引设计[J].计算机应用,2018,38(6):1584-1590. 被引量：8
6王文贤,陈兴蜀,王海舟,吴小松.一种基于Solr的HBase海量数据二级索引方案[J].信息网络安全,2017(8):39-44. 被引量：15
7周伟,刘希,陈浩.HBase分布式二级索引通用方案研究[J].软件导刊,2018,17(3):187-190. 被引量：1
8杨朝辉,王立松.pT-树:高速缓存优化的主存数据库索引结构[J].计算机科学,2011,38(10):161-165. 被引量：4
9宋华珠,段文军,刘翔.基于HBase的本体存储模型[J].计算机科学,2016,43(6):39-43. 被引量：2

二级参考文献59

1吴广君,王树鹏,陈明,李超.海量结构化数据存储检索系统[J].计算机研究与发展,2012,49(S1):1-5. 被引量：31
2Chen S,Gibbons P B,Mowry T C. Improving index performance through prefetching[C]//Proc. ACM SIGMOD. Santa Barbara, USA,May 2001:235-246.
3Luan H, Du X Y, Wang S. Prefetching J+tree.. A cache-optimized main memory database index structure[J]. Journal of Computer Science and Technolgoy, 2009,24(4) : 687-707.
4Lehman T J, Carey M J. A study of index structures for main memory database management systems[C] // Proc. VLDB Conferenee. Kyoto, Japan, Aug. 1986: 294-303.
5Comer D. The ubiquitous B-Tree[J]. ACM Computing Surveys, 1979,11(2) : 121-137.
6Rao J, Ross K A. Cache conscious indexing for decision-support in main memory[C]//Proc. VLDB Conference. Edinburgh, UK, Sept. 1999:78-89.
7Rao J, Ross K A. Making B+trees cache conscious in main memory[C]//Proc. ACM SIGMOD. Dallas, USA, May 2000.. 475-486.
8Lee I-H, Shim J, Lee S-G, et al. CST-Trees: Cache Sensitive T- Trees[C]//Proc. of the 12th International Conference on Database Systems for Advanced Applications (DASFAA 2007 ). 2007 : 398-409.
9Hennessy J L,Patterson D A. Computer Architecture: A Quantitative Approach[M]. Morgan KaufmannPublishers Inc. , 2002.
10Cvetanovic Z, Kessler R E. Performance Analysis of the Alpha 21264-based Compaq ES40 System[C]//Proceedings of the 27th International Symposium on Computer Architecture (ISCA). June 2000:192-202.

共引文献274

1叶思斯,林志达,郭献彬,曹小明.基于MongoDB的配置管理平台应用研究[J].系统仿真技术,2021,17(4):253-258. 被引量：5
2刘一流.一种面向智能交通场景的HBase时空索引设计[J].电脑知识与技术,2020,0(4):163-165. 被引量：1
3郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.
4胡廷波,钟俊.基于分簇的B^+树数据库索引优化算法[J].计算机应用,2013,33(9):2474-2476. 被引量：5
5陈智,梁娟.基于知识点的试题库随机组卷抽卷系统的设计[J].考试周刊,2013(82):1-2.
6罗军锋,徐菲.大数据时代的高校信息化框架[J].中国教育信息化（高教职教）,2014(2):11-13. 被引量：24
7田熙清,陈泳,胡颖茂.IT支撑系统技术架构的去电信化思考[J].移动通信,2014,38(5):68-74. 被引量：5
8张艳霞,丰继林,郝伟,单维锋,沈焱萍.基于NoSQL的文件型大数据存储技术研究[J].制造业自动化,2014,36(6):27-30. 被引量：19
9万川梅.基于大数据下的NOSQL和Mysql融合的数据存储模型研究[J].数字技术与应用,2014,32(2):96-96. 被引量：2
10周文琼,王乐球,叶玫.云环境下Hadoop平台的作业调度算法[J].计算机系统应用,2014,23(5):177-181. 被引量：1

同被引文献74

1吴立新,余接情.基于球体退化八叉树的全球三维网格与变形特征[J].地理与地理信息科学,2009,25(1):1-4. 被引量：37
2宋宇波,杨慧文,武威,胡爱群,高尚.软件定义网络DDoS联合检测系统[J].清华大学学报（自然科学版）,2019,59(1):28-35. 被引量：9
3张东霞,苗新,刘丽平,张焰,刘科研.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1):2-12. 被引量：622
4钟佳,邹自明.地磁偶极子场磁力线疏密可视化算法[J].地球物理学进展,2014,29(6):2614-2619. 被引量：5
5李志强,程承旗,李爽.基于GeoSOT-3D的空间对象快速可视化与实验分析[J].地球信息科学学报,2015,17(7):810-815. 被引量：4
6胡雅斯,宋君君,时蓬,段然.基于日心坐标系的三维立体剖分模型及编码[J].空间科学学报,2016,36(1):106-116. 被引量：2
7黄璨,方旭昇,张朝泉.分片计数布隆过滤器及其在Hbase二级索引的应用[J].计算机系统应用,2016,25(3):119-123. 被引量：4
8罗乐,刘轶,钱德沛.内存计算技术研究综述[J].软件学报,2016,27(8):2147-2167. 被引量：32
9石磊,黄高攀,乔雄.基于内存数据库的索引算法研究[J].信息技术,2016,40(11):139-142. 被引量：3
10董长青,任女尔,张庆余,田玉靖.基于HBase+ ElasticSearch的海量交通数据实时存取方案设计[J].大数据,2017,3(1):80-89. 被引量：7

引证文献11

1李传冰.基于Elasticsearch的HBase大数据二级索引方案[J].电脑知识与技术,2020,0(4):1-2. 被引量：2
2任文军,张进,张庆龙,解国爱.鄂尔多斯盆地中的断层相关褶皱及其分布[J].江苏地质,2000,24(1):18-22. 被引量：5
3李传志.基于HBase技术的QAR数据储存设计与实现[J].科学技术创新,2020(36):117-118.
4苏荣聪,董玉霞.基于双向参考索引的Java内存数据库快速检索方法[J].蚌埠学院学报,2021,10(2):52-55. 被引量：2
5黄静,别要祥,谢宣.一种分布式存储索引中间件的设计与实现[J].软件工程,2021,24(8):16-19. 被引量：1
6陈自力.一种基于K-means聚类的软件测试数据异常检测方法[J].太原师范学院学报（自然科学版）,2021,20(3):38-42. 被引量：2
7康志文,房鹏,郑明钊,李瑶,高宗宝,周波.大规模人群行为分析数据的二级索引方案设计[J].信息技术与信息化,2021(11):16-18.
8秦慧娟.基于SQL的教育资源数据库索引自动推荐模型[J].自动化技术与应用,2022,41(10):117-120.
9王慈枫,邹自明,胡晓彦,李云龙,白曦.一种面向动态地球磁层的数据组织模型和高效检索[J].地球物理学进展,2022,37(4):1492-1499. 被引量：2
10李勇,唐国琴,罗琅腾,张天财,杨涛.云环境下海量GPS、视频监控数据存储检索研究[J].电力大数据,2022,25(5):85-92. 被引量：1

二级引证文献15

1张进,马宗晋,任文军.鄂尔多斯西缘逆冲褶皱带构造特征及其南北差异的形成机制[J].地质学报,2004,78(5):600-611. 被引量：84
2孙晔,李子颖,肖新建,侯高文.油气圈闭与鄂尔多斯盆地北部铀成矿关系探讨[J].铀矿地质,2004,20(6):337-343. 被引量：24
3解国爱,张庆龙,潘明宝,赵世龙,任文军,郭令智.鄂尔多斯盆地两种不同成因古隆起的特征及其在油气勘探中的意义[J].地质通报,2005,24(4):373-377. 被引量：26
4李相博,姚泾利,刘化清,刘显阳,魏立花,冯明,王菁,李智勇.鄂尔多斯盆地中生界低幅度隆起构造成因类型及其对油气分布的控制作用[J].现代地质,2013,27(4):755-764. 被引量：28
5解国爱,肖文霞,张庆龙,任文军,郭令智.鄂尔多斯盆地西南缘断层相关褶皱与油气圈闭构造[J].高校地质学报,2001,7(3):272-277. 被引量：13
6郭恩浩,司啸辰,张禹,卢东生.智能化辅助决策系统在医疗设备维修中的设计与实现[J].中国医学装备,2021,18(6):120-124. 被引量：17
7李红卫.基于改进遗传算法的嵌入式软件时序测试数据自动生成方法[J].自动化与仪器仪表,2022(9):75-78. 被引量：7
8纪芩.基于云平台的软件性能测试技术分析[J].电子技术与软件工程,2022(23):74-77. 被引量：1
9张积存,宋雪萍,费继友,王凯.基于车辆信息的大数据分析系统设计与实现[J].计算机应用与软件,2023,40(1):11-16. 被引量：4
10赵黎冬,王德利,王永志,代涛,王安建,孟祥卉,曹亚琴,徐可,霍雨佳.基于时空大数据的石油安全智能分析方法研究[J].地球物理学进展,2023,38(2):958-966. 被引量：1

1刘易.新媒体背景下中职语文情景化教学策略研究[J].现代经济信息,2019,0(23):414-414. 被引量：2
2腾讯云新一代数据库CynosDB[J].网络安全和信息化,2018,0(12):15-15.
3王丹阳,郝福珍.基于HBase的后勤保障监控数据实时检索方案设计[J].信息技术,2019,43(11):136-140. 被引量：5
4董敏,陈铁桩,杨浩.基于改进RRT算法的无人车路径规划仿真研究[J].计算机仿真,2019,36(11):96-100. 被引量：16
5赵彬宇,周慧玲,李江涛,严晓平,韩康榕.储粮害虫智能图鉴及图像识别APP软件设计[J].粮食储藏,2019,48(3):42-46. 被引量：4
6艾国生,孟波,夏晓红,王坤,吴超.油气田地面工程标准规范信息管理平台建设与应用[J].自动化与仪器仪表,2019,0(10):214-217. 被引量：6
7蔡长征.数据库设计在网站开发中的应用研究[J].科技风,2019,0(35):80-80. 被引量：2
8王苗苗.基于分布式架构的光伏电站远程监测系统设计[J].西安航空学院学报,2019,37(5):60-65. 被引量：3
9俞志宏,栗国保,李少白.基于Elasticsearch的时空大数据存储与分析方法[J].电子技术与软件工程,2019,0(22):152-154. 被引量：4
10肖清泉,李云清.MOOC统一检索平台的自动构建与应用[J].江西师范大学学报（自然科学版）,2019,43(6):655-660. 被引量：1

计算机工程与应用

2020年第1期

浏览历史

内容加载中请稍等...

基于协处理器的HBase内存索引机制的研究被引量：11

参考文献9

二级参考文献59

共引文献274

同被引文献74

引证文献11

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于协处理器的HBase内存索引机制的研究 被引量：11

参考文献9

二级参考文献59

共引文献274

同被引文献74

引证文献11

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于协处理器的HBase内存索引机制的研究被引量：11