期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
数据管理系统发展趋势与挑战
1
作者 韩银俊 牛家浩 屠要峰 《中兴通讯技术》 2023年第4期64-71,共8页
数据是数字经济时代重要的生产要素。数据管理成为释放数据价值的重要引擎。回顾了数据管理技术的迭代变迁历程,分析了构建新一代数据管理基础设施的关键技术及挑战。结合中兴通讯在数据管理领域进行的创新和研发实践,展示了应对这些挑... 数据是数字经济时代重要的生产要素。数据管理成为释放数据价值的重要引擎。回顾了数据管理技术的迭代变迁历程,分析了构建新一代数据管理基础设施的关键技术及挑战。结合中兴通讯在数据管理领域进行的创新和研发实践,展示了应对这些挑战的思路、方案及取得的成效。最后,对数据管理技术发展进行了总结和展望。指出数据域技术栈应当走低碳高效、可持续发展路线,而高能效数据管理技术是可持续发展的关键。 展开更多
关键词 数据管理 数据分析 数据库 大数据 人工智能
下载PDF
UStore:面向新型硬件的统一存储系统 被引量:1
2
作者 屠要峰 韩银俊 +2 位作者 金浩 陈正华 陈兵 《计算机研究与发展》 EI CSCD 北大核心 2023年第3期525-538,共14页
数据规模的爆发式增长使得分布式存储广泛应用,长期以来分布式存储直接使用本地文件系统访问本地存储资源,随着高性能NVMe SSD、持久内存(persistent memory,PMEM)、异构加速设备的出现,本地文件系统难以发挥新型器件的特性和性能优势.... 数据规模的爆发式增长使得分布式存储广泛应用,长期以来分布式存储直接使用本地文件系统访问本地存储资源,随着高性能NVMe SSD、持久内存(persistent memory,PMEM)、异构加速设备的出现,本地文件系统难以发挥新型器件的特性和性能优势.现有很多研究针对SSD或者PMEM的硬件特性在软件层面进行优化和改进.然而,这些工作兼容性和扩展性差,不能灵活适配硬件环境变化,缺乏面向新型硬件的统一解决方案.提出了一种兼容多种存储介质的统一存储系统UStore,可根据业务场景灵活选择存储介质,并针对PMEM、KVS加速卡、NVMe SSD等典型硬件进行组合设计优化,充分利用其硬件特性,满足多层次的业务需求;通过一种与物理存储介质形态解耦的元数据设计,使其适应不同硬件的性能和原子更新能力差异,实现灵活的元数据存储策略;通过高效的数据管理机制和更新策略,实现无日志的数据原子写保证,消除了现有系统的写放大以及性能抖动等问题.实验结果表明,相比于BlueStore,UStore的4KB随机读性能提升了3.2倍,4KB随机写提高了8.2倍,3种典型硬件组合下UStore表现出与之相匹配的数据访问特征,充分发挥了存储硬件的特性和性能. 展开更多
关键词 持久性内存 NVMe SSD 分布式存储 元数据 原子写
下载PDF
RCache: A Read-Intensive Workload-Aware Page Cache for NVM Filesystem
3
作者 TU Yaofeng ZHU Bohong +2 位作者 YANG Hongzhang han yinjun SHU Jiwu 《ZTE Communications》 2023年第1期89-94,共6页
Byte-addressable non-volatile memory(NVM),as a new participant in the storage hierarchy,gives extremely high performance in storage,which forces changes to be made on current filesystem designs.Page cache,once a signi... Byte-addressable non-volatile memory(NVM),as a new participant in the storage hierarchy,gives extremely high performance in storage,which forces changes to be made on current filesystem designs.Page cache,once a significant mechanism filling the performance gap between Dynamic Random Access Memory(DRAM)and block devices,is now a liability that heavily hinders the writing performance of NVM filesystems.Therefore state-of-the-art NVM filesystems leverage the direct access(DAX)technology to bypass the page cache entirely.However,the DRAM still provides higher bandwidth than NVM,which prevents skewed read workloads from benefiting from a higher bandwidth of the DRAM and leads to sub-optimal performance for the system.In this paper,we propose RCache,a readintensive workload-aware page cache for NVM filesystems.Different from traditional caching mechanisms where all reads go through DRAM,RCache uses a tiered page cache design,including assigning DRAM and NVM to hot and cold data separately,and reading data from both sides.To avoid copying data to DRAM in a critical path,RCache migrates data from NVM to DRAM in a background thread.Additionally,RCache manages data in DRAM in a lock-free manner for better latency and scalability.Evaluations on Intel Optane Data Center(DC)Persistent Memory Modules show that,compared with NOVA,RCache achieves 3 times higher bandwidth for read-intensive workloads and introduces little performance loss for write operations. 展开更多
关键词 storage system file system persistent memory
下载PDF
基于分布式块存储系统的服务质量研究与优化 被引量:3
4
作者 屠要峰 杨洪章 +1 位作者 韩银俊 陈正华 《电信科学》 2018年第4期118-128,共11页
在云存储技术中,资源复用和共享是一把双刃剑,在为用户降低开销的同时,也导致了应用之间的相互干扰和竞争,特别是在资源需求量超出存储系统能力时,无法提供令人满意的服务质量。提出一种自适应的任务调度技术,解决了前后端任务的资源平... 在云存储技术中,资源复用和共享是一把双刃剑,在为用户降低开销的同时,也导致了应用之间的相互干扰和竞争,特别是在资源需求量超出存储系统能力时,无法提供令人满意的服务质量。提出一种自适应的任务调度技术,解决了前后端任务的资源平衡问题。还提出一种多级热度的缓存替换技术,解决了前端任务间的资源平衡问题。在中兴分布式块存储系统中将上述两项技术进行了工程实现和商用测试,上述优化方案满足了用户对分布式块存储服务质量的期望。 展开更多
关键词 分布式存储系统 缓存分级 任务调度 服务质量
下载PDF
基于持久性内存和SSD的后端存储MixStore 被引量:4
5
作者 屠要峰 陈正华 +2 位作者 韩银俊 陈兵 关东海 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期406-417,共12页
持久性内存(persistent memory,PMEM)同时具备内存的低时延字节寻址和磁盘的持久化特性,将对现有软件架构体系产生革命性的变化和深远的影响.分布式存储在云计算和数据中心得到了广泛的应用,然而现有的以Ceph BlueStore为代表的后端存... 持久性内存(persistent memory,PMEM)同时具备内存的低时延字节寻址和磁盘的持久化特性,将对现有软件架构体系产生革命性的变化和深远的影响.分布式存储在云计算和数据中心得到了广泛的应用,然而现有的以Ceph BlueStore为代表的后端存储引擎是面向传统机械盘和固态硬盘(solid state disk,SSD)设计的,其原有的优化设计机制不适合PMEM特性优势的发挥.提出了一种基于持久性内存和SSD的后端存储MixStore,通过易失区段标记和待删除列表技术实现了适用于持久性内存的并发跳表,用于替代RocksDB实现元数据管理机制,在保证事务一致性的同时,消除了BlueStore的compaction所引发的性能抖动等问题,同时提升元数据的并发访问性能;通过结合元数据管理机制的数据对象存储优化设计,把非对齐的小数据对象存放在PMEM中,把对齐的大块数据对象存储在SSD上,充分发挥了PMEM的字节寻址、持久性特性和SSD的大容量低成本优势,并结合延迟写入和CoW(copy-on-write)技术实现数据更新策略优化,消除了BlueStore的WAL日志引起的写放大,提升小数据写入性能.测试结果表明,在同样的硬件环境下,相比BlueStore,MixStore的写吞吐提升59%,写时延降低了37%,有效地提升了系统的性能. 展开更多
关键词 持久性内存 并发跳表 后端存储 混合存储 BlueStore存储引擎
下载PDF
一种基于RDMA多播机制的分布式持久性内存文件系统 被引量:4
6
作者 陈茂棠 郑圣安 +5 位作者 游理通 王晶钰 闫田 屠要峰 韩银俊 黄林鹏 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期384-396,共13页
持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问... 持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDMA多播机制的分布式持久性内存文件系统(RDMA multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10.2~219倍.在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性. 展开更多
关键词 持久性内存 远程直接内存访问 多播 分布式文件系统 远程过程调用
下载PDF
一种持久性内存文件系统数据页的混合管理机制
7
作者 陈游旻 朱博弘 +2 位作者 韩银俊 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期281-290,共10页
英特尔于2019年4月正式发布基于3D-Xpoint技术的傲腾持久性内存(Optane DC persistent memory),这为构建高效的持久性内存存储系统提供了新的机遇.然而,现有的存储系统软件并不能很好地利用其字节寻址特性,持久性内存性能很难充分发挥.... 英特尔于2019年4月正式发布基于3D-Xpoint技术的傲腾持久性内存(Optane DC persistent memory),这为构建高效的持久性内存存储系统提供了新的机遇.然而,现有的存储系统软件并不能很好地利用其字节寻址特性,持久性内存性能很难充分发挥.提出一种文件系统数据页的混合管理机制HDPM,通过选择性使用写时复制机制和日志结构管理文件数据,充分发挥持久性内存字节可寻址特性,从而避免了传统单一模式在非对齐写或者小写造成的写放大问题.为避免影响读性能,HDPM引入逆向扫描机制,实现日志结构重构数据页时不引入额外数据拷贝.HDPM还提出一种多重垃圾回收机制进行日志清理.当单个日志结构过大时,通过读写流程主动回收日志结构;当持久性内存空间受限时,则通过后台线程使用免锁机制异步释放日志空间.实验显示,HDPM相比于NOVA文件系统,单线程写延迟降低达58%,且读延迟不受影响;Filebench多线程测试显示,HDPM相比于NOVA提升吞吐率33%. 展开更多
关键词 持久性内存 文件系统 写时复制 日志结构 垃圾回收
下载PDF
Learned Distributed Query Optimizer:Architecture and Challenges
8
作者 GAO Jun han yinjun +2 位作者 LIN Yang MIAO Hao XU Mo 《ZTE Communications》 2024年第2期49-54,共6页
The query processing in distributed database management systems(DBMS)faces more challenges,such as more operators,and more factors in cost models and meta-data,than that in a single-node DMBS,in which query optimizati... The query processing in distributed database management systems(DBMS)faces more challenges,such as more operators,and more factors in cost models and meta-data,than that in a single-node DMBS,in which query optimization is already an NP-hard problem.Learned query optimizers(mainly in the single-node DBMS)receive attention due to its capability to capture data distributions and flexible ways to avoid hard-craft rules in refinement and adaptation to new hardware.In this paper,we focus on extensions of learned query optimizers to distributed DBMSs.Specifically,we propose one possible but general architecture of the learned query optimizer in the distributed context and highlight differences from the learned optimizer in the single-node ones.In addition,we discuss the challenges and possible solutions. 展开更多
关键词 distributed query processing query optimization learned query optimizer
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部