期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
UStore:面向新型硬件的统一存储系统 被引量:1
1
作者 屠要峰 韩银俊 +2 位作者 金浩 陈正华 陈兵 《计算机研究与发展》 EI CSCD 北大核心 2023年第3期525-538,共14页
数据规模的爆发式增长使得分布式存储广泛应用,长期以来分布式存储直接使用本地文件系统访问本地存储资源,随着高性能NVMe SSD、持久内存(persistent memory,PMEM)、异构加速设备的出现,本地文件系统难以发挥新型器件的特性和性能优势.... 数据规模的爆发式增长使得分布式存储广泛应用,长期以来分布式存储直接使用本地文件系统访问本地存储资源,随着高性能NVMe SSD、持久内存(persistent memory,PMEM)、异构加速设备的出现,本地文件系统难以发挥新型器件的特性和性能优势.现有很多研究针对SSD或者PMEM的硬件特性在软件层面进行优化和改进.然而,这些工作兼容性和扩展性差,不能灵活适配硬件环境变化,缺乏面向新型硬件的统一解决方案.提出了一种兼容多种存储介质的统一存储系统UStore,可根据业务场景灵活选择存储介质,并针对PMEM、KVS加速卡、NVMe SSD等典型硬件进行组合设计优化,充分利用其硬件特性,满足多层次的业务需求;通过一种与物理存储介质形态解耦的元数据设计,使其适应不同硬件的性能和原子更新能力差异,实现灵活的元数据存储策略;通过高效的数据管理机制和更新策略,实现无日志的数据原子写保证,消除了现有系统的写放大以及性能抖动等问题.实验结果表明,相比于BlueStore,UStore的4KB随机读性能提升了3.2倍,4KB随机写提高了8.2倍,3种典型硬件组合下UStore表现出与之相匹配的数据访问特征,充分发挥了存储硬件的特性和性能. 展开更多
关键词 持久性内存 NVMe SSD 分布式存储 元数据 原子写
下载PDF
RCache: A Read-Intensive Workload-Aware Page Cache for NVM Filesystem
2
作者 tu yaofeng ZHU Bohong +2 位作者 YANG Hongzhang HAN Yinjun SHU Jiwu 《ZTE Communications》 2023年第1期89-94,共6页
Byte-addressable non-volatile memory(NVM),as a new participant in the storage hierarchy,gives extremely high performance in storage,which forces changes to be made on current filesystem designs.Page cache,once a signi... Byte-addressable non-volatile memory(NVM),as a new participant in the storage hierarchy,gives extremely high performance in storage,which forces changes to be made on current filesystem designs.Page cache,once a significant mechanism filling the performance gap between Dynamic Random Access Memory(DRAM)and block devices,is now a liability that heavily hinders the writing performance of NVM filesystems.Therefore state-of-the-art NVM filesystems leverage the direct access(DAX)technology to bypass the page cache entirely.However,the DRAM still provides higher bandwidth than NVM,which prevents skewed read workloads from benefiting from a higher bandwidth of the DRAM and leads to sub-optimal performance for the system.In this paper,we propose RCache,a readintensive workload-aware page cache for NVM filesystems.Different from traditional caching mechanisms where all reads go through DRAM,RCache uses a tiered page cache design,including assigning DRAM and NVM to hot and cold data separately,and reading data from both sides.To avoid copying data to DRAM in a critical path,RCache migrates data from NVM to DRAM in a background thread.Additionally,RCache manages data in DRAM in a lock-free manner for better latency and scalability.Evaluations on Intel Optane Data Center(DC)Persistent Memory Modules show that,compared with NOVA,RCache achieves 3 times higher bandwidth for read-intensive workloads and introduces little performance loss for write operations. 展开更多
关键词 storage system file system persistent memory
下载PDF
机器学习在大视频运维中的应用 被引量:10
3
作者 屠要峰 吉锋 文韬 《中兴通讯技术》 2017年第4期2-8,共7页
通过对中兴通讯大视频运维系统整体架构和关键模块的介绍,以及机器学习技术在大视频运维系统中端到端异常检测、根因分析与故障预测等场景的具体应用的分析,并结合硬盘故障预测的实例,认为随着人工智能在运维领域的应用发展,从基于规则... 通过对中兴通讯大视频运维系统整体架构和关键模块的介绍,以及机器学习技术在大视频运维系统中端到端异常检测、根因分析与故障预测等场景的具体应用的分析,并结合硬盘故障预测的实例,认为随着人工智能在运维领域的应用发展,从基于规则的自动化运维转向基于机器学习的智能运维必然成为趋势。中兴通讯适时采用了机器学习方法来提取历史巡检数据中蕴含的故障特征,并构建集成预测模型来提升大视频运维的精度和效率,目前取得了较好的效果。 展开更多
关键词 大视频 大数据 机器学习 人工智能
下载PDF
基于分布式块存储系统的服务质量研究与优化 被引量:3
4
作者 屠要峰 杨洪章 +1 位作者 韩银俊 陈正华 《电信科学》 2018年第4期118-128,共11页
在云存储技术中,资源复用和共享是一把双刃剑,在为用户降低开销的同时,也导致了应用之间的相互干扰和竞争,特别是在资源需求量超出存储系统能力时,无法提供令人满意的服务质量。提出一种自适应的任务调度技术,解决了前后端任务的资源平... 在云存储技术中,资源复用和共享是一把双刃剑,在为用户降低开销的同时,也导致了应用之间的相互干扰和竞争,特别是在资源需求量超出存储系统能力时,无法提供令人满意的服务质量。提出一种自适应的任务调度技术,解决了前后端任务的资源平衡问题。还提出一种多级热度的缓存替换技术,解决了前端任务间的资源平衡问题。在中兴分布式块存储系统中将上述两项技术进行了工程实现和商用测试,上述优化方案满足了用户对分布式块存储服务质量的期望。 展开更多
关键词 分布式存储系统 缓存分级 任务调度 服务质量
下载PDF
基于持久性内存和SSD的后端存储MixStore 被引量:4
5
作者 屠要峰 陈正华 +2 位作者 韩银俊 陈兵 关东海 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期406-417,共12页
持久性内存(persistent memory,PMEM)同时具备内存的低时延字节寻址和磁盘的持久化特性,将对现有软件架构体系产生革命性的变化和深远的影响.分布式存储在云计算和数据中心得到了广泛的应用,然而现有的以Ceph BlueStore为代表的后端存... 持久性内存(persistent memory,PMEM)同时具备内存的低时延字节寻址和磁盘的持久化特性,将对现有软件架构体系产生革命性的变化和深远的影响.分布式存储在云计算和数据中心得到了广泛的应用,然而现有的以Ceph BlueStore为代表的后端存储引擎是面向传统机械盘和固态硬盘(solid state disk,SSD)设计的,其原有的优化设计机制不适合PMEM特性优势的发挥.提出了一种基于持久性内存和SSD的后端存储MixStore,通过易失区段标记和待删除列表技术实现了适用于持久性内存的并发跳表,用于替代RocksDB实现元数据管理机制,在保证事务一致性的同时,消除了BlueStore的compaction所引发的性能抖动等问题,同时提升元数据的并发访问性能;通过结合元数据管理机制的数据对象存储优化设计,把非对齐的小数据对象存放在PMEM中,把对齐的大块数据对象存储在SSD上,充分发挥了PMEM的字节寻址、持久性特性和SSD的大容量低成本优势,并结合延迟写入和CoW(copy-on-write)技术实现数据更新策略优化,消除了BlueStore的WAL日志引起的写放大,提升小数据写入性能.测试结果表明,在同样的硬件环境下,相比BlueStore,MixStore的写吞吐提升59%,写时延降低了37%,有效地提升了系统的性能. 展开更多
关键词 持久性内存 并发跳表 后端存储 混合存储 BlueStore存储引擎
下载PDF
一种基于RDMA多播机制的分布式持久性内存文件系统 被引量:4
6
作者 陈茂棠 郑圣安 +5 位作者 游理通 王晶钰 闫田 屠要峰 韩银俊 黄林鹏 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期384-396,共13页
持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问... 持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDMA多播机制的分布式持久性内存文件系统(RDMA multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10.2~219倍.在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性. 展开更多
关键词 持久性内存 远程直接内存访问 多播 分布式文件系统 远程过程调用
下载PDF
一种分布式持久性内存文件系统的一致性机制 被引量:2
7
作者 陈波 陆游游 +3 位作者 蔡涛 陈游旻 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期660-667,共8页
持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:... 持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:一方面,持久性内存数据一致性依赖于CPU主动执行硬件指令刷写缓存实现,而这类指令开销极高,严重影响CPU处理性能;另一方面,RDMA在服务器端CPU不参与的情况下直接读写服务器端内存,因此服务器端CPU无法主动感知数据写入事件以执行数据刷写操作,一旦系统崩溃会造成数据不一致的问题.针对以上2个问题,提出一种分布式持久性内存文件系统的一致性机制(crash consistency mechanism,CCM):首先设计实现了基于操作日志的一致性保障策略,通过将每次操作的元信息记录至日志,并持久化,以保障系统的一致性状态;其次,设计了一种客户端对服务器端的远程写一致性策略,在完成数据传输的同时使服务器端CPU主动执行数据刷写;最后实现了一种服务器端的数据异步持久化,以提高系统的处理能力.测试结果表明,基于CCM的文件系统写吞吐可达到网络裸带宽的88%.相比于现有系统Octopus,CCM性能下降控制在1%以内. 展开更多
关键词 持久性内存 远程直接内存访问 一致性 操作日志 分布式文件系统
下载PDF
基于“采集—预测—迁移—反馈”机制的主动容错技术 被引量:2
8
作者 杨洪章 杨雅辉 +2 位作者 屠要峰 孙广宇 吴中海 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期306-317,共12页
硬盘故障是数据中心最主要的故障,严重影响了可靠性.传统的数据容错技术一般都是通过增加数据冗余来实现的,存在缺陷.主动容错技术通过预测硬盘故障提前将数据迁移,成为研究热点.现有技术大多研究硬盘故障预测,缺乏采集、迁移、反馈的研... 硬盘故障是数据中心最主要的故障,严重影响了可靠性.传统的数据容错技术一般都是通过增加数据冗余来实现的,存在缺陷.主动容错技术通过预测硬盘故障提前将数据迁移,成为研究热点.现有技术大多研究硬盘故障预测,缺乏采集、迁移、反馈的研究,难以商用.提出“采集—预测—迁移—反馈”全流程主动容错机制,包括:分时硬盘信息采集方法、滑动窗口记录合并及样本构建方法、多类型硬盘故障预测方法、多盘联合数据迁移方法、预测结果二级验证及快速反馈方法.测试表明:采集硬盘信息对业务影响仅0.96%,硬盘故障预测召回率达94.66%,数据修复时间较传统方法减少55.10%.该工作已在中兴通讯的数据中心稳定商用,满足了主动容错技术在高可靠、高智能、低干扰、低成本、广适用等核心目标. 展开更多
关键词 硬盘故障 存储可靠性 容错 人工智能 运维
下载PDF
一种优化的Key-Value型NoSQL系统 被引量:4
9
作者 屠雪真 屠要峰 陈小强 《计算机工程》 CAS CSCD 北大核心 2019年第6期52-59,共8页
Key-Value(KV)是NoSQL系统中使用较为广泛的一种存储模型。针对当前主流NoSQL系统存在检索功能有限、内存容量小和宕机等问题,提出一种KV型NoSQL系统设计方法。使用可持久化的混合主索引结构解决范围查询和快速重启,采用数据分布算法和... Key-Value(KV)是NoSQL系统中使用较为广泛的一种存储模型。针对当前主流NoSQL系统存在检索功能有限、内存容量小和宕机等问题,提出一种KV型NoSQL系统设计方法。使用可持久化的混合主索引结构解决范围查询和快速重启,采用数据分布算法和内外存混合存储技术,通过数据在内存和固态硬盘之间的智能调度,实现了大规模数据的高效存取和低成本存储。实验结果表明,与Redis相比,对于典型大小Value,该系统在单节点读写性能上提升约8倍,配置成本降低约3/4,在海量数据的低成本高效存储上有明显优势。 展开更多
关键词 NoSQL系统 多核架构 固态硬盘 持久化存储 数据分布 混合存储
下载PDF
低CPU开销的低延迟存储引擎 被引量:1
10
作者 廖晓坚 杨者 +2 位作者 杨洪章 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期489-498,共10页
近些年来,固态存储的硬件处理速率得到了极大改善.一块超低延迟的固态存储盘能在10μs内处理4 KB大小的数据.加速I/O收割过程以构建低延迟的存储引擎是存储系统研究中的一个重要研究课题.传统存储系统通过硬件中断机制收割I/O,却引入了... 近些年来,固态存储的硬件处理速率得到了极大改善.一块超低延迟的固态存储盘能在10μs内处理4 KB大小的数据.加速I/O收割过程以构建低延迟的存储引擎是存储系统研究中的一个重要研究课题.传统存储系统通过硬件中断机制收割I/O,却引入了额外的上下文切换开销,延长了整体I/O处理时间.现有工作使用轮询机制以消除上下文切换,却要付出高昂的CPU开销.提出了一种低CPU开销的低延迟存储引擎NIO(nimble I/O),以充分发挥高性能固态存储盘的低延迟优势.NIO的核心思想是将大小I/O处理路径分离;大I/O使用硬件中断机制;小I/O引入惰性轮询机制,先睡眠一个变长时间间隔再持续轮询.NIO进一步提出了事务感知的I/O收割机制以降低事务的延迟,以及动态调整机制以应对上层应用负载以及设备内部活动的动态变化.实验显示在动态负载下,NIO与基于轮询的存储引擎性能相当,并能减少至少59%的CPU占用率. 展开更多
关键词 存储系统 非易失性存储I/O栈 固态硬盘 轮询 中断
下载PDF
一种持久性内存文件系统数据页的混合管理机制
11
作者 陈游旻 朱博弘 +2 位作者 韩银俊 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期281-290,共10页
英特尔于2019年4月正式发布基于3D-Xpoint技术的傲腾持久性内存(Optane DC persistent memory),这为构建高效的持久性内存存储系统提供了新的机遇.然而,现有的存储系统软件并不能很好地利用其字节寻址特性,持久性内存性能很难充分发挥.... 英特尔于2019年4月正式发布基于3D-Xpoint技术的傲腾持久性内存(Optane DC persistent memory),这为构建高效的持久性内存存储系统提供了新的机遇.然而,现有的存储系统软件并不能很好地利用其字节寻址特性,持久性内存性能很难充分发挥.提出一种文件系统数据页的混合管理机制HDPM,通过选择性使用写时复制机制和日志结构管理文件数据,充分发挥持久性内存字节可寻址特性,从而避免了传统单一模式在非对齐写或者小写造成的写放大问题.为避免影响读性能,HDPM引入逆向扫描机制,实现日志结构重构数据页时不引入额外数据拷贝.HDPM还提出一种多重垃圾回收机制进行日志清理.当单个日志结构过大时,通过读写流程主动回收日志结构;当持久性内存空间受限时,则通过后台线程使用免锁机制异步释放日志空间.实验显示,HDPM相比于NOVA文件系统,单线程写延迟降低达58%,且读延迟不受影响;Filebench多线程测试显示,HDPM相比于NOVA提升吞吐率33%. 展开更多
关键词 持久性内存 文件系统 写时复制 日志结构 垃圾回收
下载PDF
Key Technologies and Application of Edge Computing 被引量:3
12
作者 tu yaofeng DONG Zhenjiang YANG Hongzhang 《ZTE Communications》 2017年第2期26-34,共9页
Cloud computing faces a series of challenges,such as insufficient bandwidth,unsatisfactory real-time,privacy protection,and energy consumption.To overcome the challenges,edge computing emerges.Edge computing refers to... Cloud computing faces a series of challenges,such as insufficient bandwidth,unsatisfactory real-time,privacy protection,and energy consumption.To overcome the challenges,edge computing emerges.Edge computing refers to a process where the open platform that converges the core capabilities of networks,computing,storage,and applications provides intelligent services at the network edge near the source of the objects or data to meet the critical requirements for agile connection,real-time services,data optimization,application intelligence,security and privacy protection of industry digitization.Edge computing consists of three elements:edge,computing,and intelligence.Edge computing and the Internet of Things(IoT)mutually create,and edge computing and cloud computing complement each other.In the architecture of edge computing,resources are distributed to the edge nodes,and therefore the storage system is near users while the computation function is near data.In this way,the stress on the backbone network can be lessened.With this architecture,the existing key technologies for computation,networks,and storage will change significantly.ZTE’s edge computing solutions can ensure the service quality of operators and greatly enhance the experience of mobile users. 展开更多
关键词 EDGE COMPUTING CLOUD COMPUTING IOT
下载PDF
End End-to to-End Chinese Entity Recognition Based on BERT BERT-BiLSTM BiLSTM-ATT ATT-CRF 被引量:1
13
作者 LI Daiyi tu yaofeng +2 位作者 ZHOU Xiangsheng ZHANG Yangming MA Zongmin 《ZTE Communications》 2022年第S01期27-35,共9页
Traditional named entity recognition methods need professional domain knowl-edge and a large amount of human participation to extract features,as well as the Chinese named entity recognition method based on a neural n... Traditional named entity recognition methods need professional domain knowl-edge and a large amount of human participation to extract features,as well as the Chinese named entity recognition method based on a neural network model,which brings the prob-lem that vector representation is too singular in the process of character vector representa-tion.To solve the above problem,we propose a Chinese named entity recognition method based on the BERT-BiLSTM-ATT-CRF model.Firstly,we use the bidirectional encoder representations from transformers(BERT)pre-training language model to obtain the se-mantic vector of the word according to the context information of the word;Secondly,the word vectors trained by BERT are input into the bidirectional long-term and short-term memory network embedded with attention mechanism(BiLSTM-ATT)to capture the most important semantic information in the sentence;Finally,the conditional random field(CRF)is used to learn the dependence between adjacent tags to obtain the global optimal sentence level tag sequence.The experimental results show that the proposed model achieves state-of-the-art performance on both Microsoft Research Asia(MSRA)corpus and people’s daily corpus,with F1 values of 94.77% and 95.97% respectively. 展开更多
关键词 named entity recognition(NER) feature extraction BERT model BiLSTM at-tention mechanism CRF
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部