-
题名基于HBase的数据高效读技术研究
- 1
-
-
作者
闵继勇
史爱武
武俊
田贞才
-
机构
武汉纺织大学计算机与人工智能学院
-
出处
《计算机科学与应用》
2023年第3期358-368,共11页
-
文摘
在大数据时代,关系型数据库面临着海量数据存储的挑战。HBase是一种基于列存储的NoSQL数据库,广泛应用于大数据存储。HBase在数据的检索方面仍然存在着不足之处,本文对HBase的数据检索技术进行分析和研究,针对目前存在的问题提出了相应的改进和优化。针对HBase在查询数据时需要访问磁盘,查询速度慢的问题,本文提出使用Redis索引HBase的热点数据,并综合考虑数据的查询频率、更新频率和历史积热对缓存的影响,设计了一种基于数据查询频率和更新频率的热值缓存驱逐策略,提高了Redis的缓存命中率。针对HBase在检索非行键字段时需要全表扫描,检索效率低的问题,本文提出了为非行键字段建立二级索引的策略,设计了一种基于协处理器和Redis的二级索引方案。实验结果表明改进后的缓存驱逐策略的命中率高于LRU策略,在查询模块引入Redis缓存热点数据并且为非行键字段建立二级索引后,改进后的查询模块的数据检索性能提升显著,极大地提高了查询速度。
-
关键词
HBASE
REDIS
缓存
二级索引
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-