期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于更新热点感知的LSM-Tree查询优化
1
作者 林清音 陈志广 《大数据》 2023年第1期126-140,共15页
基于LSM-Tree的键值存储已经得到广泛使用。LSM-Tree通过将更新的数据缓存在内存中、随后批量写入磁盘的优化措施取得极高的写性能。然而,在基于LSM-Tree的键值存储中,被更新键值对的旧数据不会立即从存储系统中清除,导致整个存储系统... 基于LSM-Tree的键值存储已经得到广泛使用。LSM-Tree通过将更新的数据缓存在内存中、随后批量写入磁盘的优化措施取得极高的写性能。然而,在基于LSM-Tree的键值存储中,被更新键值对的旧数据不会立即从存储系统中清除,导致整个存储系统中积累大量的无效数据,最终会显著降低键值存储的读性能。针对以上问题,提出一种更积极的压缩(compaction)方法,通过记录键值对更新的历史信息,识别出更新热点,在整个LSM-Tree存储系统中寻找无效数据大量聚集的SSTable,尽早实施压缩,清除无效数据,缓解写放大效应,从而提升读性能。实验表明,该方法能够降低LevelDB 65.2%的平均读时延、69.4%的99%读尾时延以及71.4%的写放大。 展开更多
关键词 键值存储 日志结构合并树 读性能优化 写放大
下载PDF
云存储多卷负载均衡的LSM键值存储系统
2
作者 徐鹏 周元辉 +3 位作者 陈书宁 刘玮 李大平 万继光 《小型微型计算机系统》 CSCD 北大核心 2023年第10期2157-2165,共9页
单个云存储卷的IOPS和带宽性能受到限制,通过组合使用多个云存储卷的方式能以较低的费用获得更高的性能.但是,现有工作缺乏针对多云存储卷优化的LSM键值存储系统的探究.首先将现有多路径或哈希负载均衡的方案应用于使用多云存储卷的LSM... 单个云存储卷的IOPS和带宽性能受到限制,通过组合使用多个云存储卷的方式能以较低的费用获得更高的性能.但是,现有工作缺乏针对多云存储卷优化的LSM键值存储系统的探究.首先将现有多路径或哈希负载均衡的方案应用于使用多云存储卷的LSM键值存储系统,相对单个大容量卷的性能有显著提升;但是,现有多卷负载均衡方案的写数据策略,无法感知LSM键值存储系统的数据布局特点,导致各成员卷之间仍然存在负载不均衡的问题,不能充分发挥出多卷的最大性能.为此,提出一种云存储多卷负载均衡的LSM键值存储系统TANGO.在LSM键值存储系统由compaction新生成的sstable落盘之前,先根据统计的各个成员卷的关键信息,判断sstable与各成员卷的键范围重叠情况,然后选择键范围重叠最小的成员卷进行写入;针对读为主的负载,无法通过compaction达到负载均衡,TANGO采用后台数据迁移方式进一步达到负载均衡.在亚马逊云存储卷上的评估表明,相比相同存储容量的单卷,采用了TANGO方案的同等容量的多卷可提高7倍左右的性能;相比其它多卷方案,TANGO能提升20%以上的性能,且各成员卷间负载更加均衡. 展开更多
关键词 云存储 多卷 键值存储 日志结构归并树 负载均衡
下载PDF
基于LSM树的电网远程监控数据混合存储方法 被引量:1
3
作者 袁敬中 苏东禹 +3 位作者 姜宇 郭嘉 孙密 卢诗华 《微型电脑应用》 2023年第4期76-78,83,共4页
受到数据合并方法的影响,电网远程监控数据混合存储过程的内存占用较大,为此,提出基于LSM树的电网远程监控数据混合存储方法。批量获取、处理电网远程监控数据,并构建LSM存储模型,设计数据合并方法,综合LSM树与SMR磁盘的特性,将多个监... 受到数据合并方法的影响,电网远程监控数据混合存储过程的内存占用较大,为此,提出基于LSM树的电网远程监控数据混合存储方法。批量获取、处理电网远程监控数据,并构建LSM存储模型,设计数据合并方法,综合LSM树与SMR磁盘的特性,将多个监控数据合并为大文件;分析监控数据中包含的冗余数据,并将其清除,完成电网远程监控数据混合存储。实验结果表明:选取5000个监控数据小文件,使用3种方法进行监控数据混合存储测试,提出的设计方法使内存占用量降低了16.79 MB、29.17 MB,电网远程监控数据混合存储效果得到保证。 展开更多
关键词 lsm 监控数据 混合存储 数据合并
下载PDF
LSM树中基于热度预测的异构布隆过滤器方案 被引量:4
4
作者 俞加平 陈华辉 +1 位作者 钱江波 董一鸿 《电子学报》 EI CAS CSCD 北大核心 2021年第11期2090-2095,共6页
日志结构合并(Log-Structured-Merge,LSM)树中常使用布隆过滤器减少无效磁盘I/O.但是用户无法无限制地细化布隆过滤器的粒度,原因是在一些数据量庞大而数据项较小的工作流中,这些元数据需要占用大量存储空间.其次在一些内存受限的环境下... 日志结构合并(Log-Structured-Merge,LSM)树中常使用布隆过滤器减少无效磁盘I/O.但是用户无法无限制地细化布隆过滤器的粒度,原因是在一些数据量庞大而数据项较小的工作流中,这些元数据需要占用大量存储空间.其次在一些内存受限的环境下,内存缓冲区无法容纳更多的过滤器数据,造成缓冲区与磁盘的频繁数据交换.针对上述问题本文提出LSM树中的异构布隆过滤器方案,在LSM树的每一层维护热度预测模型,新生成的SSTable通过预测的热度来分配不同粒度的布隆过滤器,然后使用特定缓存管理方案来维护缓存中的过滤器数据并处理工作流热度发生改变的情况.实验证明,本文的方案在保持相同外存占用与内存消耗的情况下,读取吞吐量比采用原始LSM树结构的LevelDB提升22%~53%. 展开更多
关键词 日志结构合并树 键值存储 读取性能 布隆过滤器 存储管理 热度预测
下载PDF
基于LSM树的云存储数据差异性存储节能优化算法 被引量:2
5
作者 梁少林 《吉林大学学报(信息科学版)》 CAS 2022年第2期282-287,共6页
为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算... 为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算数据在发送和接收时的时间延迟,对比既定参数判定是否需要分片储存。对需要分片储存的数据,通过时间延迟阈值明确在各个节点下所需的服务器功耗、静态功耗以及动态功耗,对平均功耗较大的数据实施分类传输,完成存储节能优化。仿真实验证明,采取所提方法后的云储存环境中冗余数据量明显减少,且处理稳定性较强,平均耗用低于设定阈值,整体算法性能较为优异。 展开更多
关键词 lsm 网络带宽 链路长度 静态功耗 冗余数据
下载PDF
基于birch聚类的可更新机器学习索引模型
6
作者 曹卫东 金超 《计算机工程与设计》 北大核心 2023年第11期3328-3334,共7页
为满足大数据时代下数据库系统高吞吐、低内存占用的索引设计需求,提出一种面向海量数据的基于birch聚类可更新机器学习索引模型。将数据集使用birch聚类进行划分,对分段数据分别使用前馈神经网络进行训练拟合,采用基于日志结构合并树... 为满足大数据时代下数据库系统高吞吐、低内存占用的索引设计需求,提出一种面向海量数据的基于birch聚类可更新机器学习索引模型。将数据集使用birch聚类进行划分,对分段数据分别使用前馈神经网络进行训练拟合,采用基于日志结构合并树延迟更新思路的异地插入策略,实现索引更新操作。使用真实数据集进行实验,其结果表明,相比传统索引和当前先进机器学习索引结构,该模型在检索速度上有一定提升,在插入性能、内存占用和训练时间上有较大优化。 展开更多
关键词 海量数据 机器学习 索引设计 聚类 日志结构合并树 数据访问热度 动态更新
下载PDF
面向内存表的可动态配置预写日志框架
7
作者 朱海铭 黄向东 +1 位作者 乔嘉林 王建民 《计算机科学与探索》 CSCD 北大核心 2023年第11期2777-2783,共7页
通常情况下,NoSQL数据库管理系统启动后,其多个数据库或数据分区的预写日志(WAL)会固定地写入一个或多个日志文件,因而形成强耦合的对应关系。由于数据库逻辑模型与分区配置是由应用业务和计算环境所决定的,在预写日志被强耦合的情况下... 通常情况下,NoSQL数据库管理系统启动后,其多个数据库或数据分区的预写日志(WAL)会固定地写入一个或多个日志文件,因而形成强耦合的对应关系。由于数据库逻辑模型与分区配置是由应用业务和计算环境所决定的,在预写日志被强耦合的情况下,数据库管理系统无法对预写日志的个数、大小等进行配置以实现性能调优。针对该问题,提出了一种面向内存表的可动态配置预写日志框架,该框架记录了重写日志,内存表可以动态地被分配给不同的预写日志队列,支持可变的对应关系,实现了预写日志与具体应用之间的解耦。在物联网时序数据库Apache IoTDB上实现了该框架,并进行了相关实验,结果表明使用可动态配置预写日志框架后可以找到比强耦合的预写日志更优的配置方案,写入性能可提高8%~19%,说明该框架能针对不同计算环境和应用负载实现动态性能调优。 展开更多
关键词 预写日志(WAL) 重写日志 日志结构合并树(lsm) 时序数据库
下载PDF
基于日志结构合并树的轻量级分布式索引实现方法 被引量:2
8
作者 崔双双 王宏志 《计算机应用》 CSCD 北大核心 2021年第3期630-635,共6页
针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查... 针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查询效率;然后,提出了分布式索引构建算法以及基于等距取样的索引区间划分算法,从而保证了索引在系统中的均匀分布,并且优化了传统索引的查询算法,将索引文件看作特殊的数据文件分布式地存储在系统中,从而保证了系统的负载均衡和可扩展性;最后,将该方法与华为二级索引方案HIndex在HBase数据库上进行实验来比较二者的索引构建的时间和空间开销、索引的查询性能和系统的负载均衡等性能,验证得出所提出的方法使查询性能提升了50~200倍。 展开更多
关键词 日志结构合并树 分布式索引 HBASE 查询优化
下载PDF
近数据计算下键值存储中Compaction并行优化方法 被引量:1
9
作者 孙辉 娄本冬 +2 位作者 黄建忠 赵雨虹 符松 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期597-616,共20页
大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写... 大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写,从而提升性能.然而,LSM-tree键值存储也存在一些性能问题.一方面,键值存储利用compaction操作更新数据,保持系统平衡,但造成严重的写放大问题.另一方面,以传统计算为中心的架构下,compaction操作带来大量的数据传输,影响了系统性能.以数据为中心的近数据计算模型(near-data processing,NDP)为基础,利用该模型下主机端与近数据计算使能设备端的并行资源,提出基于系统并行与流水线并行的compaction优化方法(collaborative parallel compaction optimization for LSM-tree key-value stores,CoPro).当处理compaction操作时,CoPro主机端与NDP设备端协同执行compaction卸载任务.此外,进一步提出基于决策组件的CoPro+,根据系统资源变化以及负载键值对中值大小的变化来动态调整并行度,使NDP架构中计算资源的使用更加高效.在搭建的硬件平台上验证了CoPro的有效性. 展开更多
关键词 日志归并树 键值存储 近数据计算 任务卸载 数据-流水线并行
下载PDF
用于联盟链的布隆过滤器优化 被引量:2
10
作者 吴亦涵 黄建华 +1 位作者 邵兴辉 王诚 《应用科学学报》 CAS CSCD 北大核心 2022年第4期611-622,共12页
布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloo... 布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloom filter,PCBF)构造方案,设计可并行计算的元素插入与查询机制并结合双重哈希及非加密哈希来实现快速插入与查询;基于开启过滤器单元与访问次数构建排序字符串表优先级,使用时间片轮询算法对过滤器单元进行自适应调整,实现了资源的合理分配。实验结果表明:PCBF具有较高的插入效率,并能减少20%左右的误报数量,适用于联盟链的高并发场景。 展开更多
关键词 区块链 Hyperledger Fabric LevelDB 布隆过滤器 日志结构合并树
下载PDF
一种读写均衡的高性能键值存储系统 被引量:2
11
作者 吴加禹 李永坤 许胤龙 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第6期825-831,838,共8页
日志结构合并树(LSM-tree)因能利用外存设备的顺序访问性能,被广泛应用于键值存储系统的核心数据结构.由于LSM-tree层次化的、有序的数据组织结构需要通过大量的数据合并操作维护,故引起了严重的写放大效应.最近的研究工作提出了若干优... 日志结构合并树(LSM-tree)因能利用外存设备的顺序访问性能,被广泛应用于键值存储系统的核心数据结构.由于LSM-tree层次化的、有序的数据组织结构需要通过大量的数据合并操作维护,故引起了严重的写放大效应.最近的研究工作提出了若干优化方案缓解LSM-tree的写放大,但是牺牲了查询性能和空间利用率.为此基于LSM-tree的键值存储系统提出一种新的架构,其核心设计是采用键值分离的方案降低数据合并开销,并以一种新型的树状结构vTree为值维护一定程度有序性,保障高效的范围查询;同时为vTree设计了相应的数据合并和空间回收方法.实验结果表明,基于该架构实现的键值存储系统在写入、点查询、范围查询各方面有均衡的高性能表现,且空间开销较低. 展开更多
关键词 日志结构合并树 写放大 键值分离 范围查询
下载PDF
面向键值存储的日志结构合并树优化技术 被引量:4
12
作者 吴尚宇 谢婧雯 王毅 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2432-2441,共10页
日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效... 日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题. 展开更多
关键词 计算机体系结构 键值存储 日志结构合并树 访问频率 数据上浮
下载PDF
dCompaction: Speeding up Compaction of the LSM-Tree via Delayed Compaction 被引量:3
13
作者 Feng-Feng Pan Yin-Liang Yue Jin Xiong 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期41-54,共14页
Key-value (KV) stores have become a backbone of large-scale applications in today's data centers. Write- optimized data structures like the Log-Structured Merge-tree (LSM-tree) and their variants are widely used ... Key-value (KV) stores have become a backbone of large-scale applications in today's data centers. Write- optimized data structures like the Log-Structured Merge-tree (LSM-tree) and their variants are widely used in KV storage systems like BigTable and RocksDB. Conventional LSM-tree organizes KV items into multiple, successively larger components, and uses compaction to push KV items from one smaller component to another adjacent larger component until the KV items reach the largest component. Unfortunately, current compaction scheme incurs significant write amplification due to repeated KV item reads and writes, and then results in poor throughput. We propose a new compaction scheme, delayed compaction (dCompaction) that decreases write amplification, dCompaction postpones some compactions and gathers them into the following compaction. In this way, it avoids KV item reads and writes during compaction, and consequently improves the throughput of LSM-tree based KV stores. We implement dCompaction on RocksDB, and conduct extensive experiments. Validation using YCSB framework shows that compared with RocksDB, dCompaction has about 40% write performance improvements and also comparable read performance. 展开更多
关键词 key-value store log-structured merge-tree lsm-tree write amplification delayed compaction
原文传递
基于增量学习的RocksDB键值系统主动缓存机制
14
作者 骆克云 叶保留 +2 位作者 唐斌 梅峰 卢文达 《计算机应用》 CSCD 北大核心 2020年第2期321-327,共7页
由于分层结构的约束,基于日志结构合并(LSM)树的RocksDB键值存储系统面临着读取性能低下的问题。一种有效的解决方法是对热点数据进行主动缓存,但其面临两个挑战:一是如何在数据分布持续动态变化时对热点数据进行预测,二是如何将主动缓... 由于分层结构的约束,基于日志结构合并(LSM)树的RocksDB键值存储系统面临着读取性能低下的问题。一种有效的解决方法是对热点数据进行主动缓存,但其面临两个挑战:一是如何在数据分布持续动态变化时对热点数据进行预测,二是如何将主动缓存机制与RocksDB存储结构衔接起来。针对这些挑战,基于预测分析技术,构建了由数据采集、系统交互、系统测试等部分组成的面向RocksDB键值系统的主动缓存框架,能够将热点数据缓存在LSM树的较低层级中;并对数据访问模式进行建模,设计并实现了基于增量学习的热点数据预测分析方法,能够有效减少存储介质的I/O访问次数。实验结果表明该机制能有效提升RocksDB在不同动态工作负载下的数据读取性能。 展开更多
关键词 RocksDB 主动缓存 增量学习 日志结构合并树
下载PDF
基于SCM与SSD的混合高效键值存储系统研究 被引量:1
15
作者 詹玲 张艺文 《计算机工程与应用》 CSCD 北大核心 2021年第19期97-103,共7页
具有高性能以及非易失特性的SCM(Storage Class Memory,存储级内存)技术逐渐成熟并开始运用到存储系统设计中,而传统的SSD仍然在存储容量上具有优势,为键值存储系统提供大容量存储的支持。现有键值存储系统不能充分发挥SCM与SSD混合存... 具有高性能以及非易失特性的SCM(Storage Class Memory,存储级内存)技术逐渐成熟并开始运用到存储系统设计中,而传统的SSD仍然在存储容量上具有优势,为键值存储系统提供大容量存储的支持。现有键值存储系统不能充分发挥SCM与SSD混合存储架构的优势,需要对数据布局以及系统结构进行重新设计。针对SCM和SSD的特点,设计了基于SCM与SSD的混合式高效键值存储系统(SCM and SSD Hybrid Key-Valuestore,SSHKV)。SSHKV通过将键值存储中元数据信息存储到SCM中,将数据部分以日志方式存储到SSD中,实现性能与容量的兼顾。在SSD空间管理上,SSHKV采用逻辑空间放大策略,通过重映射TRIM指令释放的无效空间,减小了垃圾回收带来的数据迁移开销。SSHKV基于半异步半同步式IO模型实现,经过对比测试,SSHKV的随机写入性能相较于传统基于LSM-Tree的LevelDB提升了约20倍。 展开更多
关键词 键值存储 存储级内存 固态存储 日志结构合并树
下载PDF
MyWAL:performance optimization by removing redundant input/output stack in key-value store
16
作者 Xiao ZHANG Mengyu LI +2 位作者 Michael NGULUBE Yonghao CHEN Yiping ZHAO 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第7期980-993,共14页
Based on a log-structured merge(LSM)tree,the key-value(KV)storage system can provide high reading performance and optimize random writing performance.It is widely used in modern data storage systems like e-commerce,on... Based on a log-structured merge(LSM)tree,the key-value(KV)storage system can provide high reading performance and optimize random writing performance.It is widely used in modern data storage systems like e-commerce,online analytics,and real-time communication.An LSM tree stores new KV data in the memory and flushes to disk in batches.To prevent data loss in memory if there is an unexpected crash,RocksDB appends updating data in the write-ahead log(WAL)before updating the memory.However,synchronous WAL significantly reduces writing performance.In this paper,we present a new WAL mechanism named MyWAL.It directly manages raw devices(or partitions)instead of saving data on a traditional file system.These can avoid useless metadata updating and write data sequentially on disks.Experimental results show that MyWAL can significantly improve the data writing performance of RocksDB compared to the traditional WAL for small KV data on solid-state disks(SSDs),as much as five to eight times faster.On non-volatile memory express soild-state drives(NVMe SSDs)and non-volatile memory(NVM),MyWAL can improve data writing performance by 10%–30%.Furthermore,the results of YCSB(Yahoo!Cloud Serving Benchmark)show that the latency decreased by 50%compared with SpanDB. 展开更多
关键词 Key-value(KV)store log-structured merge(lsm)tree Non-volatile memory(NVM) Non-volatile memory express soild-state drive(NVMe SSD) Write-ahead log(WAL)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部