期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
多核下基于远程直接内存访问的高效远程过程调用研究
1
作者 李波 孟丹 霍志刚 《高技术通讯》 CAS CSCD 北大核心 2011年第7期681-686,共6页
针对目前基于远程直接内存访问(RDMA)的远程过程调用(RPC)设计在多核背景下存在的性能和扩展性问题,提出了一种新的基于RDMAWrite的高效RPC设计方法并对网络文件系统(NFS)提供了支持。重点就设计中的安全性问题和内存管理机制进... 针对目前基于远程直接内存访问(RDMA)的远程过程调用(RPC)设计在多核背景下存在的性能和扩展性问题,提出了一种新的基于RDMAWrite的高效RPC设计方法并对网络文件系统(NFS)提供了支持。重点就设计中的安全性问题和内存管理机制进行了分析,并针对内存有效利用提出了被动和主动两种回收机制。测试结果表明,这种新的RPC设计方法能降低RPC延迟13%~20%。对内存文件系统及真实磁盘文件系统的测试表明,此设计能有效提高多核系统中RPC的性能和扩展性。 展开更多
关键词 远程直接内存访问(RDMA) 远程过程调用(RPC) 多核 网络文件系统(NFS)
下载PDF
基于远程直接内存访问的高性能键值存储系统 被引量:2
2
作者 王成 叶保留 +1 位作者 梅峰 卢文达 《计算机应用》 CSCD 北大核心 2020年第2期316-320,共5页
随着数据与系统规模的不断扩大,网络传输成为了键值存储系统的性能瓶颈。同时,远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为键值存储系统设计提供了新的思路。结合高性能网络中的RDMA技术,设计并实现了高性能、低CP... 随着数据与系统规模的不断扩大,网络传输成为了键值存储系统的性能瓶颈。同时,远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为键值存储系统设计提供了新的思路。结合高性能网络中的RDMA技术,设计并实现了高性能、低CPU负载的键值存储系统Chequer;结合RDMA原语的特性,重新设计了键值存储系统的基本操作工作流程;并设计了基于线性探测的共享hash表,解决客户端缓存失效的问题以及提高hash命中率来减少客户端的读取轮数,进一步提高了系统的性能。在小规模集群上实现了Chequer系统,并通过实验验证了其性能。 展开更多
关键词 远程直接内存访问 哈希表 键值存储 高性能网络
下载PDF
内存事务中并发控制协议研究综述 被引量:1
3
作者 姜天洋 张广艳 李之悦 《计算机研究与发展》 EI CSCD 北大核心 2022年第4期721-736,共16页
事务为数据库等系统的上层应用提供了强大的保证.NoSQL数据库通过弱化对事务的支持来获得更高的扩展性,却难以满足OLTP等应用的事务性需求.之后提出的NewSQL数据库架构回归了高一致性的事务支持,并兼顾了海量数据的高效管理.因此,NewSQ... 事务为数据库等系统的上层应用提供了强大的保证.NoSQL数据库通过弱化对事务的支持来获得更高的扩展性,却难以满足OLTP等应用的事务性需求.之后提出的NewSQL数据库架构回归了高一致性的事务支持,并兼顾了海量数据的高效管理.因此,NewSQL数据库逐步将事务执行所需的数据从硬盘迁移到内存中以提升事务执行的效率.但是,已有内存事务的并发控制协议与新兴的存储、网络设备并不适配.从处理策略、版本控制、冲突解决3个维度对近10年来的内存事务中并发控制协议进行了分类阐述,进而从性能、扩展性、持久性3个方面比较了有代表性的并发控制协议.之后总结了4个改进内存事务并发控制协议的技术思路:消除事务扩展瓶颈,利用新硬件加速事务处理,降低事务中止概率,高效保证事务持久性.最后指出了内存事务并发控制协议的未来研究方向. 展开更多
关键词 内存事务 并发控制 分布式系统 远程直接内存访问 持久性内存
下载PDF
远程持久性和写合并的混合部署R树
4
作者 吴瑶 张瑞 吴杰 《小型微型计算机系统》 CSCD 北大核心 2023年第12期2858-2864,共7页
新兴的持久性内存技术的出现和RDMA网络为构建新型的远程空间数据索引提供了新的可能,有望为R树这样的空间数据结构带来性能提升.由于持久性内存相比DRAM具有更慢的访问时延、额外的持久化开销以及缺少远程持久化原语等因素导致完全持... 新兴的持久性内存技术的出现和RDMA网络为构建新型的远程空间数据索引提供了新的可能,有望为R树这样的空间数据结构带来性能提升.由于持久性内存相比DRAM具有更慢的访问时延、额外的持久化开销以及缺少远程持久化原语等因素导致完全持久化的远程R树性能下降.在此基础上,本文设计并实现了RRtree,一种基于混合部署架构的远程持久性R树,在保证数据持久性的前提下实现尽可能高的性能.同时,通过选择性元数据持久化、写合并和对双边RDMA原语结合持久性内存使用进行优化.最后,在真实的傲腾持久性内存上实现并验证了RRtree的高性能和高可扩展性.实验结果表明,RRtree和对比对象FBR-tree相比其时延和吞吐分别有显著的降低和提升. 展开更多
关键词 R树 持久性内存 远程直接内存访问 空间数据 索引
下载PDF
USPS:面向算力资源高效协同的用户态跨协议代理系统
5
作者 夏景旋 申国伟 +1 位作者 郭春 崔允贺 《计算机科学》 CSCD 北大核心 2023年第11期348-355,共8页
随着算力网络的快速发展,通用算力、人工智能算力、超算等算力资源分布广泛。算力资源协同服务是算力网络研究的关键问题。在算力资源协同过程中,一方面,算力网络面临海量终端算力服务的高并发请求和低时延响应需求;另一方面,其难以充... 随着算力网络的快速发展,通用算力、人工智能算力、超算等算力资源分布广泛。算力资源协同服务是算力网络研究的关键问题。在算力资源协同过程中,一方面,算力网络面临海量终端算力服务的高并发请求和低时延响应需求;另一方面,其难以充分发挥数据中心算力资源的高吞吐和低时延优势,进而难以为用户提供高效的算力服务。针对上述挑战,提出一种基于用户态协议栈和远程直接内存访问(Remote Direct Memory Access,RDMA)的用户态代理系统(User-Space Proxy System,USPS),通过用户态协议栈响应客户高并发算力请求,在动态批处理策略协调下实现基于RDMA的数据中心算力高吞吐、低时延服务。在通信方面,USPS实现了一个高效的远程过程调用(Remote Procedure Call,RPC)通信机制,能够充分利用RDMA网卡带宽提供高速消息通信;在请求处理方面,提出了一个动态批处理调度方法,能够在满足用户时延要求的前提下最大化批处理效率。实验结果表明,USPS的服务响应时延仅是传统内核态Nginx代理系统的7.8%~23.1%,是其他用户态代理系统的17.3%~24.7%;吞吐量比传统内核态的Nginx代理系统提升了3.4~8.9倍,比其他用户态代理系统提升了3.2~4.2倍。 展开更多
关键词 算力资源高效协同 用户态代理 远程直接内存访问 数据中心 批处理调度
下载PDF
国产SW26010-Pro处理器上3级BLAS函数众核并行优化 被引量:1
6
作者 胡怡 陈道琨 +5 位作者 杨超 马文静 刘芳芳 宋超博 孙强 史俊达 《软件学报》 EI CSCD 北大核心 2024年第3期1569-1584,共16页
BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发... BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发挥处理器的计算性能有至关重要的作用.针对国产SW26010-Pro处理器研究BLAS 3级函数的众核并行优化技术.具体而言,根据SW26010-Pro的存储层次结构,设计多级分块算法,挖掘矩阵运算的并行性.在此基础上,基于远程内存访问(remote memory access,RMA)机制设计数据共享策略,提高从核间的数据传输效率.进一步地,采用三缓冲、参数调优等方法对算法进行全面优化,隐藏直接内存访问(direct memory access,DMA)访存开销和RMA通信开销.此外,利用SW26010-Pro的两条硬件流水线和若干向量化计算/访存指令,还对BLAS 3级函数的矩阵-矩阵乘法、矩阵方程组求解、矩阵转置操作等若干运算进行手工汇编优化,提高了函数的浮点计算效率.实验结果显示,所提出的并行优化技术在SW26010-Pro处理器上为BLAS 3级函数带来了明显的性能提升,单核组BLAS 3级函数的浮点计算性能最高可达峰值性能的92%,多核组BLAS 3级函数的浮点计算性能最高可达峰值性能的88%. 展开更多
关键词 BLAS 3级 SW26010-Pro众核处理器 直接内存访问 远程内存访问 浮点计算效率
下载PDF
基于RDMA和NVM的大数据系统一致性协议研究 被引量:8
7
作者 吴昊 陈康 +1 位作者 武永卫 郑纬民 《大数据》 2019年第4期89-99,共11页
分布式的存储系统以及计算系统是构造大数据处理系统的基础。系统的高可用性是任何一个分布式系统的基石,高可用技术一般依赖于一致性协议。讨论了经典的非拜占庭的分布式一致性协议以及新技术发展下的RDMA通信协议与NVM存储介质,通过R... 分布式的存储系统以及计算系统是构造大数据处理系统的基础。系统的高可用性是任何一个分布式系统的基石,高可用技术一般依赖于一致性协议。讨论了经典的非拜占庭的分布式一致性协议以及新技术发展下的RDMA通信协议与NVM存储介质,通过RDMA和NVM的结合获得了更高性能的高可用系统。改进了一致性协议,使其能够更好地利用RDMA与NVM的特性。实现的系统在保证系统数据一致和可用的同时,有效地提高了协议实现的性能。实验表明,相比于现有的系统,实现的系统能够得到40%的性能提高。 展开更多
关键词 大数据 分布式系统 一致性协议 远程内存直接访问 非易失存储器
下载PDF
面向大模型预训练的智算网络技术研究 被引量:1
8
作者 王学聪 冀思伟 李聪 《电信科学》 北大核心 2024年第6期160-172,共13页
随着人工智能的发展,大规模预训练模型在自然语言处理和计算机视觉等领域都取得了显著成果,促进了智算中心的建设。针对面向大模型预训练的智算网络关键技术展开研究,系统梳理了智算网络国内外最新的标准化进展,提出了一种面向智算网络... 随着人工智能的发展,大规模预训练模型在自然语言处理和计算机视觉等领域都取得了显著成果,促进了智算中心的建设。针对面向大模型预训练的智算网络关键技术展开研究,系统梳理了智算网络国内外最新的标准化进展,提出了一种面向智算网络的目标架构,探讨了智算网络关键技术的原理,包括远程直接内存访问(RDMA)、IB(InfiniBand)、基于以太网的RDMA(RoCE)、集合通信等,同时也分析了智算网络目前存在的问题以及未来的发展趋势,在推动智算网络技术发展、指导智算中心建设等方面具有重要意义。 展开更多
关键词 智算网络 远程直接内存访问 大模型
下载PDF
基于实时微内核的零拷贝通信协议 被引量:1
9
作者 李胜利 徐力 张明虎 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第1期35-38,共4页
在分析现有零拷贝通信协议实现的基础上,提出了基于实时微内核的零拷贝通信协议RTZCP.针对不同的应用场景,RTZCP协议对单个数据包采用了传统的内存重映射方式来消除用户空间与内核空间之间的数据拷贝,而对于需要分片的大数据包,则采用R... 在分析现有零拷贝通信协议实现的基础上,提出了基于实时微内核的零拷贝通信协议RTZCP.针对不同的应用场景,RTZCP协议对单个数据包采用了传统的内存重映射方式来消除用户空间与内核空间之间的数据拷贝,而对于需要分片的大数据包,则采用RMA(远程内存访问)方式来实现零拷贝通信的目的.设立了专门静态网络通信资源的分配管理机制,以及具有缓冲机制的通信接口技术来优化处理IP数据包的分片机制.测试结果表明,RTZCP协议能够在提供比传统网络通信协议更低的通信延时的情况下,充分地保证实时数据包的实时通信性能. 展开更多
关键词 实时微内核 零拷贝通信协议 远程内存访问
下载PDF
基于Soft-RoCE的KV客户端网络传输性能提升
10
作者 常锐 古国强 +1 位作者 童贤慧 徐怡倩 《工业控制计算机》 2024年第10期62-64,共3页
RDMA网络因高带宽、低延迟、低CPU负载特点,广泛应用于数据密集业务。应用场景模型是数据中心集群内部Server-Server架构,两端都需搭载RDMA硬件网卡卸载加速网络传输,但是对于更典型的Client-Server架构应用场景,C/S架构由于客户端数量... RDMA网络因高带宽、低延迟、低CPU负载特点,广泛应用于数据密集业务。应用场景模型是数据中心集群内部Server-Server架构,两端都需搭载RDMA硬件网卡卸载加速网络传输,但是对于更典型的Client-Server架构应用场景,C/S架构由于客户端数量多,从成本因素考虑,客户端选择软件RDMA实现,这样基于RDMA内存语义的客户端的设计成为影响性能的关键因素。提出一种新型基于Soft-RoCE的KV软件客户端和FPGA硬件服务端的架构设计,仅需要支持一种RDMA WRITE单边原语,简化了服务端硬件的复杂度和成本,同时保持RDMA高带宽特性。增加本地事件通知机制有效减少RDMA消息,利用SRIOV和虚拟化资源隔离以及绑核技术手段,使KV客户端可并发、可扩展,并在Key-Value数据库取得吞吐量达2M+IOPS的高性能效果。 展开更多
关键词 Soft-RoCE 远程内存直接访问 键值存储
下载PDF
一种基于RDMA多播机制的分布式持久性内存文件系统 被引量:4
11
作者 陈茂棠 郑圣安 +5 位作者 游理通 王晶钰 闫田 屠要峰 韩银俊 黄林鹏 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期384-396,共13页
持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问... 持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDMA多播机制的分布式持久性内存文件系统(RDMA multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10.2~219倍.在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性. 展开更多
关键词 持久性内存 远程直接内存访问 多播 分布式文件系统 远程过程调用
下载PDF
一种分布式持久性内存文件系统的一致性机制 被引量:2
12
作者 陈波 陆游游 +3 位作者 蔡涛 陈游旻 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期660-667,共8页
持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:... 持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:一方面,持久性内存数据一致性依赖于CPU主动执行硬件指令刷写缓存实现,而这类指令开销极高,严重影响CPU处理性能;另一方面,RDMA在服务器端CPU不参与的情况下直接读写服务器端内存,因此服务器端CPU无法主动感知数据写入事件以执行数据刷写操作,一旦系统崩溃会造成数据不一致的问题.针对以上2个问题,提出一种分布式持久性内存文件系统的一致性机制(crash consistency mechanism,CCM):首先设计实现了基于操作日志的一致性保障策略,通过将每次操作的元信息记录至日志,并持久化,以保障系统的一致性状态;其次,设计了一种客户端对服务器端的远程写一致性策略,在完成数据传输的同时使服务器端CPU主动执行数据刷写;最后实现了一种服务器端的数据异步持久化,以提高系统的处理能力.测试结果表明,基于CCM的文件系统写吞吐可达到网络裸带宽的88%.相比于现有系统Octopus,CCM性能下降控制在1%以内. 展开更多
关键词 持久性内存 远程直接内存访问 一致性 操作日志 分布式文件系统
下载PDF
数据中心网络传输协议综述 被引量:21
13
作者 曾高雄 胡水海 +1 位作者 张骏雪 陈凯 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期74-84,共11页
近10年来,在盛行的网络应用(如搜索、在线零售和云计算等)的需求驱动下,数据中心在全球范围内以前所未有的速度和规模发展建立起来.特别地,数据中心网络引起了学术界和工业界的广泛关注.在这样的背景下,调研了数据中心网络的一个核心方... 近10年来,在盛行的网络应用(如搜索、在线零售和云计算等)的需求驱动下,数据中心在全球范围内以前所未有的速度和规模发展建立起来.特别地,数据中心网络引起了学术界和工业界的广泛关注.在这样的背景下,调研了数据中心网络的一个核心方面——传输层协议.虽然传输协议在因特网上已经有很长的历史,它却直到2010年才在数据中心网络环境下被系统性地探索.数据中心网络有着和因特网不一样的特点(如单一控制域和同构网络架构),这给数据中心网络上的传输协议设计同时带来了机遇和挑战.在这驱使下,一系列的传输协议被设计提出.将早期(2010—2015年)数据中心网络传输设计方面的工作分成3类——基于端主机的拥塞控制、网络仲裁机制和交换机优先级调度,对这3类工作的优缺点作深入讨论.最后,分析近年来数据中心网络传输设计的研究趋势——接收端驱动的主动拥塞控制和RDMA传输协议设计. 展开更多
关键词 数据中心网络 传输层协议 拥塞控制 显式拥塞通告 远程直接内存访问
下载PDF
vsocket:一种基于RDMA的兼容标准套接字加速方法
14
作者 陈云芳 茆昊天 张伟 《计算机科学》 CSCD 北大核心 2023年第10期239-247,共9页
为了兼容Linux标准套接字,同时利用RDMA提高使用套接字的程序的性能,提出在上层应用与底层RDMA之间搭建一个中间件——Viscore Socket adaptor(简称vsocket);通过拦截socket API,将上层应用通过套接字收发的数据流无缝转接到RDMA承载上... 为了兼容Linux标准套接字,同时利用RDMA提高使用套接字的程序的性能,提出在上层应用与底层RDMA之间搭建一个中间件——Viscore Socket adaptor(简称vsocket);通过拦截socket API,将上层应用通过套接字收发的数据流无缝转接到RDMA承载上。vsocket绕过管理收发缓冲区的内核,针对TCP和UDP分别实现了用户空间的内存管理机制,使用RC类型的RDMA网络支持TCP加速,使用UD类型的RDMA网络支持UDP加速,并重用Linux UDP来辅助其路由。实验结果表明vsocket能够保证Linux标准套接字接口的兼容性,提升网络性能,摆脱Linux内核网络协议栈的限制,改善收发数据的延迟与带宽。 展开更多
关键词 套接字 远程内存直接访问 协议加速
下载PDF
基于RDMA的区块传输机制设计与实现 被引量:2
15
作者 孙栋 王彪 徐云 《计算机应用》 CSCD 北大核心 2023年第2期484-489,共6页
随着区块链技术的不断发展,区块的传输延迟成为区块链系统可扩展性的性能瓶颈。远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为低延迟区块传输提供了新的思路。因此,结合RDMA原语的特性,设计了用于区块信息共享的区块... 随着区块链技术的不断发展,区块的传输延迟成为区块链系统可扩展性的性能瓶颈。远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为低延迟区块传输提供了新的思路。因此,结合RDMA原语的特性,设计了用于区块信息共享的区块目录结构,并在此基础上设计并实现了区块传输的基本工作过程。实验结果表明,相较于基于TCP的方案,在1 MB大小的区块上基于RDMA的区块传输机制将节点间的区块传输延迟降低了44%,全网络的区块传输延迟降低了24.4%,在10000节点规模的区块链上,区块链发生临时分叉的数量降低了22.6%。可见,基于RDMA的区块传输机制充分发挥了高速网络的性能优势,降低了区块传输延迟及临时分叉的数量,提高了现有区块链系统的可扩展性。 展开更多
关键词 区块链 远程直接内存访问 可扩展性 区块传输 低延迟
下载PDF
基于RDMA的高性能单向数据采集技术研究 被引量:2
16
作者 梁嘉诚 余江 +2 位作者 王洪波 刘渊 王晓锋 《计算机工程》 CAS CSCD 北大核心 2023年第10期31-40,共10页
高性能数据采集技术是提高数据分析效率的重要前提。为解决当前数据采集技术中安全性低、传输时延高、CPU开销大的问题,设计一种基于远程直接内存访问的高性能单向数据采集(ODAR)架构,提高数据采集过程中的安全性和传输性能。针对传输... 高性能数据采集技术是提高数据分析效率的重要前提。为解决当前数据采集技术中安全性低、传输时延高、CPU开销大的问题,设计一种基于远程直接内存访问的高性能单向数据采集(ODAR)架构,提高数据采集过程中的安全性和传输性能。针对传输时数据正确性问题,基于可靠性的数据封装策略,设计动态内存优化策略解决内存分配时存在的时延问题,并提出基于优先级的数据传输调度算法解决高吞吐量数据传输中存在的带宽利用率低的问题。实验结果表明,相对于基于UDP协议实现的单向数据采集技术,ODAR架构的吞吐量平均提高了57.01%,传输时延与CPU开销平均降低了61.27%与68.01%,并且大幅提高了数据传输的准确率,内存分配时的时延平均降低了80.15%,网卡带宽利用率平均提高了33.03%。 展开更多
关键词 单向数据采集 远程直接内存访问 消息中间件 动态内存优化 数据传输调度
下载PDF
基于RDMA的分布式键值存储系统性能优化
17
作者 王哲 王玉玫 +1 位作者 吴亚非 臧义华 《计算机与现代化》 2023年第2期24-27,共4页
如今分布式键值存储系统在工业界得到了广泛的应用,如何提升其性能成为分布式系统和并行计算领域的研究热点。远程直接数据存取是高性能计算中常用的通信技术,利用其低延迟高带宽的特性,可以有效提升分布式键值存储系统的性能表现。MPI... 如今分布式键值存储系统在工业界得到了广泛的应用,如何提升其性能成为分布式系统和并行计算领域的研究热点。远程直接数据存取是高性能计算中常用的通信技术,利用其低延迟高带宽的特性,可以有效提升分布式键值存储系统的性能表现。MPI单边通信是一种支持RDMA的通信方法,本文使用MPI单边通信实现分布式键值操作,并根据其特点重新设计通信模型。为了解决RMA带来的数据一致性问题,本文改变键值对的存储结构并制定存取操作的通信策略。通过将单边通信与TCP/IP进行对比,对不同长度的数据测试通信延迟,验证了RDMA给系统带来的性能提升。 展开更多
关键词 分布式键值存储系统 远程内存直接访问 单边通信
下载PDF
BOOM-KV:基于RDMA的高性能NVM键值数据库
18
作者 李文捷 蒋德钧 +1 位作者 熊劲 包云岗 《高技术通讯》 CAS 2023年第1期29-41,共13页
随着英特尔傲腾数据中心持久化内存模块(DCPMM)开始进入市场以及远程直接内存访问(RDMA)硬件成本的降低,设计融合非易失性内存(NVM)和RDMA的键值(KV)数据库面临新的机遇和挑战。构建基于NVM和RDMA的KV数据库的关键在于设计一个高效的通... 随着英特尔傲腾数据中心持久化内存模块(DCPMM)开始进入市场以及远程直接内存访问(RDMA)硬件成本的降低,设计融合非易失性内存(NVM)和RDMA的键值(KV)数据库面临新的机遇和挑战。构建基于NVM和RDMA的KV数据库的关键在于设计一个高效的通信协议。遗憾的是,现有工作或采用NVM不感知的RDMA协议,或采用低效的NVM感知的RDMA协议,这导致它们无法最大化KV数据库的性能。本文提出了BOOM协议——一种新型的NVM感知的RDMA协议。相较于NVM不感知的协议,BOOM协议允许直接对远端NVM进行RDMA操作,消除了冗余的数据拷贝;相较于现有的NVM感知的协议,它可以显著减少元数据请求,降低KV请求的端对端延迟。在BOOM协议的基础上构建了BOOM-KV,并针对服务端中央处理器(CPU)利用率和宕机持久化等问题进一步进行优化。将BOOM-KV与最新的研究成果进行对比,结果表明,BOOM-KV能显著降低请求延迟,其中PUT延迟最大降低了42%,GET延迟最大降低了41%,并且展现出良好的扩展性。 展开更多
关键词 非易失性内存(NVM) 远程直接内存访问(RDMA) 键值(KV)数据库
下载PDF
基于InfiniBand的RAID存储系统设计 被引量:4
19
作者 阙清贤 谭怀亮 《计算机工程与设计》 CSCD 北大核心 2009年第11期2730-2733,F0003,共5页
以Infiniband(IB)体系结构和SCSI远程直接内存访问协议(SRP)为基础,结合RAID技术,设计了一种RAID存储系统,系统与主机接口的前端采用IB,为主机的I/O访问提供无限带宽,与物理存储设备接口的后端设计了多个RAID5控制卡的RAID0分条技术,以... 以Infiniband(IB)体系结构和SCSI远程直接内存访问协议(SRP)为基础,结合RAID技术,设计了一种RAID存储系统,系统与主机接口的前端采用IB,为主机的I/O访问提供无限带宽,与物理存储设备接口的后端设计了多个RAID5控制卡的RAID0分条技术,以提高磁盘访问的并发性。从而获得了很好的主机存取I/O性能。 展开更多
关键词 无限带宽 scsi远程直接内存访问协议 磁盘阵列 启动器 目标器
下载PDF
一种面向高性能计算机的超节点控制器的研究 被引量:4
20
作者 王凯 陈飞 +3 位作者 李强 李晓民 安学军 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2011年第1期1-8,共8页
传统高性能计算机的节点由一个处理单元和一个节点控制器组成.为了有效地维护高速缓存一致性,处理单元中的处理器个数会非常有限.因此一台具有千万亿次处理能力的高性能计算机将会有上万个节点,这对互连网络的延迟和带宽都提出了非常高... 传统高性能计算机的节点由一个处理单元和一个节点控制器组成.为了有效地维护高速缓存一致性,处理单元中的处理器个数会非常有限.因此一台具有千万亿次处理能力的高性能计算机将会有上万个节点,这对互连网络的延迟和带宽都提出了非常高的要求.超节点控制器能够同时连接多个处理单元构成一个超节点,这能够减小互连网络的规模,从而降低互连网络的设计难度,并保证互连网络的性能.用FPGA实现了超节点控制器的原型系统的测试结果表明,采用超节点设计的高性能计算机拥有非常低的通信延迟,同时其通信带宽也有非常好的扩展性. 展开更多
关键词 高性能计算机 超节点控制器 全局地址空间 直接内存访问 远程读写
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部