期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于LSM-Tree的分布式数据库异步融合机制研究与实现
1
作者 杜轶德 刘文洁 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第2期303-309,共7页
信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将... 信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将数据分为基线数据与增量数据,通过合并操作将不同分区的增量数据与基线数据不断融合,并存储在磁盘,从而减少内存压力。但合并会占用大量系统资源,严重影响系统可用性。因此提出了一种基于LSM-Tree架构的异步融合机制,通过细分合并流程,将数据融合异步化,有效地缩短了单次数据合并的时间。实验表明,提出的异步融合机制可显著缩短数据合并时间,提高系统在高频写入场景下的鲁棒性和可用性。 展开更多
关键词 分布式数据库 lsm-tree 数据合并 异步融合 数据分区
下载PDF
基于LSM-Tree的键值存储系统的读写性能优化
2
作者 程浩津 胡乃平 《计算机测量与控制》 2024年第6期262-268,275,共8页
在写密集型工作环境中,日志结构合并树(LSM-Tree)已逐渐成为主流存储系统,LSM-Tree存在读操作速度慢、写操作成本高、范围查询操作效率低等问题;针对这些问题,为提升LSM-Tree的性能进行了研究,提出了一种基于LSM-Tree的键值存储系统的... 在写密集型工作环境中,日志结构合并树(LSM-Tree)已逐渐成为主流存储系统,LSM-Tree存在读操作速度慢、写操作成本高、范围查询操作效率低等问题;针对这些问题,为提升LSM-Tree的性能进行了研究,提出了一种基于LSM-Tree的键值存储系统的读写性能优化策略,通过键值分离策略设计vTree结构,并提出层内归并与消极的层间合并相结合的方法,以及范围查询优化合并的策略,从而优化系统的范围查询性能,在LSM-Tree和vTree采用不同的压缩结构,以实现系统读写性能的提升;实验结果表明,与RocksDB相比读性能提升30%,与RocksDB-vTree相比范围查询性能提升10%。 展开更多
关键词 读性能 lsm-tree 消极的层间合并 范围查询优化合并 范围查询
下载PDF
基于LSM Tree的分布式索引实现 被引量:3
3
作者 隆飞 翁海星 +1 位作者 高明 张召 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期36-44,66,共10页
近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受... 近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受到影响.LSM Tree和B Tree之间的本质区别使得NoSQL系统不适宜直接引用B Tree作为辅助索引结构.本文实现了LSM Tree下的一种分布式辅助索引结构,提出针对这种读写分离架构的索引批量加载策略,并对LSM Tree的查询计划树进行了缓冲优化,避免了重复的查询解析,使得索引读的性能得到了相应的提升. 展开更多
关键词 辅助索引 日志结构合并树 NOSQL
下载PDF
基于非易失性内存的LSM-tree存储系统优化 被引量:2
4
作者 余阳 胡卉芪 周煊 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期37-47,共11页
随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友... 随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友好等缺点,提出了一种基于非易失性内存和机器学习的L0层的设计方法,能够减缓甚至解决上述问题.实验结果表明,该设计能够实现较好的读写性能. 展开更多
关键词 非易失性内存 机器学习 lsm-tree架构
下载PDF
基于LSM树的在线监测数据安全存储系统设计
5
作者 李林 左天才 +1 位作者 杜泽新 谢志奇 《电子设计工程》 2024年第7期63-67,共5页
水电厂在线监测数据对于水电厂设备维护方案的制定和实施具有重要的参考作用,一旦泄露或者丢失,造成的损失将是巨大的。为了保证监测数据的安全性,设计基于日志结构合并树(Log-Structured Merge-Tree,LSM树)的水电厂在线监测数据安全存... 水电厂在线监测数据对于水电厂设备维护方案的制定和实施具有重要的参考作用,一旦泄露或者丢失,造成的损失将是巨大的。为了保证监测数据的安全性,设计基于日志结构合并树(Log-Structured Merge-Tree,LSM树)的水电厂在线监测数据安全存储系统。该系统由硬件接口层、数据传输层以、数据存储层以及安全功能模块层四部分组成。以LSM树为基础设计数据存储模型,当RAM中的存储量达到限值后,将水电厂在线监测数据从微处理器中的内部存储器RAM转移到后者外部磁盘当中,完成数据存储。为存储模型设置三个安全防护模块,在实现数据存储的同时,保证数据的安全性。结果表明,四个磁盘的写入数据大小始终维持在100 kB以上,磁盘存储空间利用率高于90%,由此说明该系统的存储性能较为优越;检测灵敏度系数在1.0以上,密文的敏感度在10以下,说明水电厂在线监测数据安全性较高,实现了安全存储。 展开更多
关键词 lsm 水电厂在线监测数据 硬件电路 安全防护模块 安全存储系统
下载PDF
一种基于LSM树的键值存储系统性能优化方法 被引量:6
6
作者 王海涛 李战怀 +1 位作者 张晓 赵晓南 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1792-1802,共11页
目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原... 目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原因是基于LSM树的KV存储系统能够将随机写操作转化为顺序写操作,从而提升数据写性能.然而,这些存储系统也存在一些严重的性能问题.一方面,KV存储系统利用预写日志机制来保证写入数据的原子性和安全性,以便在系统发生故障时进行恢复,造成了数据的写放大.同时,日志的频繁更新也引入了严重的元数据负载,导致了额外的性能开销.另一方面,KV存储系统通常利用通用文件系统存储数据,而通用文件系统中许多KV存储系统不需要的功能和属性也会造成一定的性能开销.为了减小这些开销、提升KV存储系统写入性能,提出了RocksFS,一个针对基于LSM树的KV存储系统优化的文件系统.针对KV存储系统的负载模式简化文件系统结构,去除通用文件系统引入的负载,同时优化预写日志的存储结构和更新流程以减小其更新负载,提升写入性能.最后在普通硬盘和固态硬盘上,基于流行的KV存储系统RocksDB验证了该方法的有效性,结果显示相对于通用文件系统,RocksFS能够将小块KV数据写入和更新性能提高约8倍. 展开更多
关键词 lsm 键值存储 文件系统 预写日志 写性能
下载PDF
基于SSD-SMR混合存储的LSM树键值存储系统的性能优化 被引量:5
7
作者 王洋洋 韦皓诚 柴云鹏 《计算机科学》 CSCD 北大核心 2018年第7期61-65,89,共6页
大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬... 大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬盘(Solid State Drive,SSD)一起构成混合存储时可以显著提升性能。同时,基于写优化的日志结构合并(Log-Structured Merge,LSM)树的键值存储已被广泛应用于许多NoSQL系统,如BigTable,Cassandra和HBase等。因此,如何基于新型的SSD-SMR混合存储构建出高性能的LSM树键值存储系统是一个具有很大研究价值的问题。首先建立基于SSD-SMR混合存储的LSM树键值系统的性能模型,然后针对SSD和SMR的硬件特征以及LSM树键值存储的软件特点,设计了一套面向SSD-SMR混合存储进行性能优化的LSM树键值存储系统,并基于LevelDB实现了该系统。在仅仅使用0.4%~2%空间的SSD的情况下,所提方法可以使SSD-SMR混合存储方案比普通磁盘方案的随机写性能提高20%,随机读性能提高5倍。 展开更多
关键词 大数据 日志合并树 瓦记录磁盘 闪存 混合存储
下载PDF
基于LSM树的云存储数据差异性存储节能优化算法 被引量:2
8
作者 梁少林 《吉林大学学报(信息科学版)》 CAS 2022年第2期282-287,共6页
为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算... 为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算数据在发送和接收时的时间延迟,对比既定参数判定是否需要分片储存。对需要分片储存的数据,通过时间延迟阈值明确在各个节点下所需的服务器功耗、静态功耗以及动态功耗,对平均功耗较大的数据实施分类传输,完成存储节能优化。仿真实验证明,采取所提方法后的云储存环境中冗余数据量明显减少,且处理稳定性较强,平均耗用低于设定阈值,整体算法性能较为优异。 展开更多
关键词 lsm 网络带宽 链路长度 静态功耗 冗余数据
下载PDF
基于LSM树的键值存储系统技术研究综述
9
作者 吕萌 华文镝 谢平 《计算机科学》 CSCD 北大核心 2023年第8期1-15,共15页
键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Mer... 键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Merge Tree, LSM树)。因具有卓越的写性能,LSM树被广泛应用于写密集型的场景和现代NoSQL系统的存储层。与传统的B树相比,LSM树采用顺序写入的访问模式,并使用内存缓冲区来批处理新的写入线程,因此LSM树具有更大的写优势。然而,数据的重复读写和不必要的压缩操作导致了LSM树的读写放大问题,从而严重影响了系统的性能,尤其在数据密集型的应用场景。如今,研究人员做了大量工作来缓解这些问题,文中研究了影响LSM树性能的各个因素,搜集了大量提升基于LSM树的键值系统性能的文献,并对其加以整理和分类,讨论它们的优势和权衡,使读者可以了解基于LSM树的存储技术及其优化策略,最后调查了几个具有代表性的基于LSM树的键值存储技术并讨论了潜在的未来研究方向。 展开更多
关键词 lsm NOSQL 存储管理 键值系统 数据检索
下载PDF
面向空间数据的LSM树索引研究综述 被引量:1
10
作者 何军军 《无线通信技术》 2022年第1期42-47,共6页
空间数据在城市规划、天气预报、资产管理以及路线导航上有着广泛的应用。传统的关系型数据库不能满足空间数据高频存取的需求,面向空间数据的LSM树索引能够提高空间数据的写入和查询性能。但在索引设计中,需要面临索引结构设计、提升... 空间数据在城市规划、天气预报、资产管理以及路线导航上有着广泛的应用。传统的关系型数据库不能满足空间数据高频存取的需求,面向空间数据的LSM树索引能够提高空间数据的写入和查询性能。但在索引设计中,需要面临索引结构设计、提升查询性能和降低更新开销三方面问题。对此,本文分别对基于空间填充曲线的LSM树索引结构和基于树状结构的LSM树索引结构两方面的现有工作进行分析,比较其优缺点,并展望了该方向的机遇和挑战。 展开更多
关键词 空间数据 lsm树索引 空间填充曲线 树状结构 查询性能
下载PDF
OceanBase分布式关系数据库架构与技术 被引量:1
11
作者 阳振坤 杨传辉 +3 位作者 韩富晟 王国平 杨志丰 成肖君 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期540-554,共15页
关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障... 关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障自动无损容灾以及高倍率数据压缩等,已经应用于金融、政务、通信和互联网等行业.介绍了OceanBase分布式关系数据库的系统架构和关键技术,包括分布式事务处理、基于LSM-tree的存储系统以及分布式SQL优化器.详细阐述了OceanBase数据库的高可用和数据一致性,包括RPO为0和RTO小于8 s.也介绍了OceanBase数据库多租户机制,即采用了集群内原生多租户设计,在集群内实现多个互相独立的数据库服务.基于Sysbench和TPC-H评测基准,对比实验结果表明:1)在单机模式下,OceanBase的性能是MySQL的1.27倍至2倍多;2)在单主模式下,OceanBase的性能是MySQL的1.25倍至近2倍;3)在多主模式下,OceanBase的性能是MySQL的1.09倍至3.1倍,对于OLAP的复杂查询,OceanBase的性能是MySQL的6倍到327倍. 展开更多
关键词 关系数据库 分布式事务 基于lsm-tree存储 分布式SQL优化器 多租户
下载PDF
高效Key-Value持久化缓存系统的实现 被引量:6
12
作者 罗军 陈席林 李文生 《计算机工程》 CAS CSCD 2014年第3期33-38,共6页
传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论... 传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论以及Merge-Dump存储引擎进行改进,并参考Google的单机持久化存储系统LevelDB,实现一个分布式的Key-Value持久化缓存系统SSDB,结合传统缓存系统的优点并利用一致性哈希、布隆过滤器等思想对SSDB进行一系列优化。对SSDB性能测试的结果表明,优化后的持久化缓存系统SSDB是纯内存存储的,能有效降低数据的存储成本,且在读写性能上只比Redis下降约600 QPS。 展开更多
关键词 lsm tree理论 Merge—Dump存储引擎 缓存系统 持久化存储 一致性哈希 布隆过滤器
下载PDF
MUSE:一种面向云存储系统的高性能元数据存储引擎 被引量:3
13
作者 段翰聪 向小可 吕鹏程 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第2期221-226,共6页
该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并... 该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并行能力;其次,提出了基于多I/O通道的元数据存取调度机制。通道之间读写操作隔离,聚合多个通道为上层提供高并发随机I/O读写能力;此外,针对上层目录命名空间管理,提出路径分割映射和全路径映射策略两种策略,可基于不同的应用场景在性能与可用性间进行折中选择。系统测试结果表明,MUSE能够很好地适应海量小文件存储场景,相对于其他元数据存储系统在性能上有显著的提升。 展开更多
关键词 I/O lsm-tree 海量 元数据 性能 小文件 存储引擎
下载PDF
基于日志结构合并树的轻量级分布式索引实现方法 被引量:2
14
作者 崔双双 王宏志 《计算机应用》 CSCD 北大核心 2021年第3期630-635,共6页
针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查... 针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查询效率;然后,提出了分布式索引构建算法以及基于等距取样的索引区间划分算法,从而保证了索引在系统中的均匀分布,并且优化了传统索引的查询算法,将索引文件看作特殊的数据文件分布式地存储在系统中,从而保证了系统的负载均衡和可扩展性;最后,将该方法与华为二级索引方案HIndex在HBase数据库上进行实验来比较二者的索引构建的时间和空间开销、索引的查询性能和系统的负载均衡等性能,验证得出所提出的方法使查询性能提升了50~200倍。 展开更多
关键词 日志结构合并树 分布式索引 HBASE 查询优化
下载PDF
基于LSM树的视频数据扩容存储系统设计
15
作者 李斌 刘思尧 《电子设计工程》 2025年第1期31-35,共5页
针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数... 针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数据节点的分割存储数量,由此完成系统扩容。利用LSM树组织视频数据,应用概率描述存储期望值,实现视频数据扩容存储。由实验结果可知,该系统能够将所有视频数据存储在系统中,且数据存储最大耗时为179 ms,能够达到在短时间内实现全部视频数据有效存储的目的。 展开更多
关键词 lsm 视频数据 扩容存储 数据重叠 系统扩容
下载PDF
近数据计算下键值存储中Compaction并行优化方法 被引量:1
16
作者 孙辉 娄本冬 +2 位作者 黄建忠 赵雨虹 符松 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期597-616,共20页
大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写... 大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写,从而提升性能.然而,LSM-tree键值存储也存在一些性能问题.一方面,键值存储利用compaction操作更新数据,保持系统平衡,但造成严重的写放大问题.另一方面,以传统计算为中心的架构下,compaction操作带来大量的数据传输,影响了系统性能.以数据为中心的近数据计算模型(near-data processing,NDP)为基础,利用该模型下主机端与近数据计算使能设备端的并行资源,提出基于系统并行与流水线并行的compaction优化方法(collaborative parallel compaction optimization for LSM-tree key-value stores,CoPro).当处理compaction操作时,CoPro主机端与NDP设备端协同执行compaction卸载任务.此外,进一步提出基于决策组件的CoPro+,根据系统资源变化以及负载键值对中值大小的变化来动态调整并行度,使NDP架构中计算资源的使用更加高效.在搭建的硬件平台上验证了CoPro的有效性. 展开更多
关键词 日志归并树 键值存储 近数据计算 任务卸载 数据-流水线并行
下载PDF
海量数据本地化索引方案的研究
17
作者 陈熙 《福建电脑》 2013年第2期72-73,共2页
信息爆炸时代的来临为人们获取海量信息提供了便利,同时也给传统数据库系统带来了巨大的挑战。大量基于B树的传统数据库因B树固有缺陷纷纷失效。本文从其原理出发,分析这个现象产生的原因,并进一步介绍两大主流的解决方案。
关键词 lsm—tree COLA Fractal—tree B树 存储器层次结构
下载PDF
用于联盟链的布隆过滤器优化 被引量:2
18
作者 吴亦涵 黄建华 +1 位作者 邵兴辉 王诚 《应用科学学报》 CAS CSCD 北大核心 2022年第4期611-622,共12页
布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloo... 布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloom filter,PCBF)构造方案,设计可并行计算的元素插入与查询机制并结合双重哈希及非加密哈希来实现快速插入与查询;基于开启过滤器单元与访问次数构建排序字符串表优先级,使用时间片轮询算法对过滤器单元进行自适应调整,实现了资源的合理分配。实验结果表明:PCBF具有较高的插入效率,并能减少20%左右的误报数量,适用于联盟链的高并发场景。 展开更多
关键词 区块链 Hyperledger Fabric LevelDB 布隆过滤器 日志结构合并树
下载PDF
面向键值存储的日志结构合并树优化技术 被引量:4
19
作者 吴尚宇 谢婧雯 王毅 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2432-2441,共10页
日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效... 日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题. 展开更多
关键词 计算机体系结构 键值存储 日志结构合并树 访问频率 数据上浮
下载PDF
dCompaction: Speeding up Compaction of the LSM-Tree via Delayed Compaction 被引量:3
20
作者 Feng-Feng Pan Yin-Liang Yue Jin Xiong 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期41-54,共14页
Key-value (KV) stores have become a backbone of large-scale applications in today's data centers. Write- optimized data structures like the Log-Structured Merge-tree (LSM-tree) and their variants are widely used ... Key-value (KV) stores have become a backbone of large-scale applications in today's data centers. Write- optimized data structures like the Log-Structured Merge-tree (LSM-tree) and their variants are widely used in KV storage systems like BigTable and RocksDB. Conventional LSM-tree organizes KV items into multiple, successively larger components, and uses compaction to push KV items from one smaller component to another adjacent larger component until the KV items reach the largest component. Unfortunately, current compaction scheme incurs significant write amplification due to repeated KV item reads and writes, and then results in poor throughput. We propose a new compaction scheme, delayed compaction (dCompaction) that decreases write amplification, dCompaction postpones some compactions and gathers them into the following compaction. In this way, it avoids KV item reads and writes during compaction, and consequently improves the throughput of LSM-tree based KV stores. We implement dCompaction on RocksDB, and conduct extensive experiments. Validation using YCSB framework shows that compared with RocksDB, dCompaction has about 40% write performance improvements and also comparable read performance. 展开更多
关键词 key-value store Log-Structured Merge-tree lsm-tree write amplification delayed compaction
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部