期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于GPU直访存储架构的推荐模型预估系统
1
作者 谢旻晖 陆游游 +1 位作者 冯杨洋 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期589-599,共11页
新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在... 新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在着CPU-GPU通信开销大和额外的内存拷贝2个问题,这增加了嵌入层的访存延迟,进而损害模型预估的性能.提出了一种基于GPU直访存储架构的推荐模型预估系统GDRec.GDRec的核心思想是在嵌入参数的访问路径上移除CPU参与,由GPU通过零拷贝的方式高效直访内外存资源.对于内存直访,GDRec利用统一计算设备架构(compute unified device architecture,CUDA)提供的统一虚拟地址特性,实现GPU核心函数(kernel)对主机内存的细粒度访问,并引入访问合并与访问对齐2个机制充分优化访存性能;对于外存直访,GDRec实现了一个轻量的固态硬盘(solid state disk,SSD)驱动程序,允许GPU从SSD中直接读取数据至显存,避免内存上的额外拷贝,GDRec还利用GPU的并行性缩短提交I/O请求的时间.在3个点击率预估数据集上的实验表明,GDRec在性能上优于高度优化后的基于CPU访存架构的系统NVIDIA HugeCTR,可以提升多达1.9倍的吞吐量. 展开更多
关键词 GPU直访存储 参数存储 推荐系统 预估系统 存储系统
下载PDF
一种基于裸闪存的Key-Value数据库优化方法 被引量:6
2
作者 秦雄军 张佳程 +1 位作者 陆游游 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1326-1336,共11页
近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂... 近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂.设计并实现了一种基于裸闪存的keyvalue数据管理架构Flashkv,通过用户态下的管理单元进行空间管理和垃圾回收,充分利用了闪存设备内部的并发特性,并简化了垃圾回收过程,去除了传统文件系统和FTL中的冗余功能,缩短了I/O路径.提出了基于闪存特点的I/O调度技术,优化了闪存的读写延迟,提高了吞吐率;提出了用户态缓存管理技术,降低了数据写入量和频繁系统调用所带来的开销.测试结果表明,Flashkv性能是levelDB的1.9~2.2倍,写入量减少60%~65%. 展开更多
关键词 key-value数据库 闪存 裸设备 数据存储 使用寿命
下载PDF
金属有机框架多面体微颗粒自组装超结构的设计策略
3
作者 陆游游 杨士宽 《材料科学与工程学报》 CAS CSCD 北大核心 2024年第2期179-185,共7页
周期性超结构通常具有优异的光学性能,在光子晶体学、催化、传感等领域具有重要意义。在此,采用了声悬浮法和点滴法来探索多维有序金属有机框架(MOF)超结构的组装策略,并建立了组装参数与超结构维度和有序性之间的关系。结果表明:声悬... 周期性超结构通常具有优异的光学性能,在光子晶体学、催化、传感等领域具有重要意义。在此,采用了声悬浮法和点滴法来探索多维有序金属有机框架(MOF)超结构的组装策略,并建立了组装参数与超结构维度和有序性之间的关系。结果表明:声悬浮法对MOF颗粒分散液浓度和颗粒的单分散性包容性极强,适用于三维超结构的自组装;点滴法对MOF颗粒分散液浓度和颗粒的单分散性有较高的要求,能组装出大面积二维MOF单层膜。该研究为利用各向异性微粒组装多维超结构提供了新的策略。 展开更多
关键词 自组装 金属有机框架 超结构 声悬浮 点滴法
下载PDF
闪存存储的重构与系统构建技术 被引量:2
4
作者 陆游游 杨者 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2019年第1期23-34,共12页
近些年来,闪存存储在嵌入式、桌面机、服务器及数据中心领域中均得到了快速而广泛的应用.如何高效发挥闪存效率是近来存储系统研究中的一个重要的问题.传统存储系统以磁盘为基础的设计维系了60余年,基于现有存储系统的优化对闪存优势的... 近些年来,闪存存储在嵌入式、桌面机、服务器及数据中心领域中均得到了快速而广泛的应用.如何高效发挥闪存效率是近来存储系统研究中的一个重要的问题.传统存储系统以磁盘为基础的设计维系了60余年,基于现有存储系统的优化对闪存优势的发挥效果甚微.因而,重构闪存存储成为近年来的研究热点.对该研究方向的研究现状与进展进行介绍.首先,介绍了闪存与固态盘的特性,并分析了当前闪存存储结构的问题;然后,介绍了闪存存储架构从设备内FTL、主机端FTL、软件直管闪存以及开放可编程闪存的演进;接着,从软件直管闪存的软件定义和硬件卸载2个方面,分别介绍基于开放通道SSD的存储系统和基于近数据处理的闪存存储系统;最后总结了闪存存储重构和系统构建技术的挑战与下一步研究的问题. 展开更多
关键词 开放通道SSD 软件定义闪存 近数据处理 软硬件协同设计 开放可编程闪存
下载PDF
基于RDMA的分布式存储系统研究综述 被引量:14
5
作者 陈游旻 陆游游 +1 位作者 罗圣美 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期227-239,共13页
远程直接内存访问(remote direct memory access, RDMA)技术正在大数据领域被越来越广泛地应用,它支持在对方主机CPU不参与的情况下远程读写异地内存,并提供高带宽、高吞吐和低延迟的数据传输特性,从而大幅提升分布式存储系统的性能,因... 远程直接内存访问(remote direct memory access, RDMA)技术正在大数据领域被越来越广泛地应用,它支持在对方主机CPU不参与的情况下远程读写异地内存,并提供高带宽、高吞吐和低延迟的数据传输特性,从而大幅提升分布式存储系统的性能,因此基于RDMA的分布式存储系统将为满足大数据高时效处理和存储带来新的机遇.首先分析了基于RDMA的分布式存储系统简单替换网络传输模块并不能充分发挥RDMA在语义和性能上的优势的原因,并指出存储系统架构需要变革的因素.然后阐述了高效运用RDMA技术主要取决于2个方面:第1方面是硬件资源的高效管理,包括网卡缓存和CPU缓存的合理利用、多核CPU的并行加速以及内存资源管理等;第2方面是软硬件的紧耦合设计,借助RDMA在语义和性能上的特性,重构新型数据组织和索引方式、优化分布式协议等.同时,以分布式文件系统、分布式键值存储和分布式事务系统为典型应用场景,分别阐述了它们在硬件资源管理和软件重构这2个方面的相关研究.最后,给出了总结和展望. 展开更多
关键词 远程直接内存访问 分布式存储 键值存储 文件系统 分布式事务
下载PDF
一种分布式持久性内存文件系统的一致性机制 被引量:2
6
作者 陈波 陆游游 +3 位作者 蔡涛 陈游旻 屠要峰 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期660-667,共8页
持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:... 持久性内存(persistent memory,PM)和远程直接内存访问(remote direct memory access,RDMA)具有高带宽、低延迟的硬件性能,这为设计高性能的分布式存储系统提供了新的机遇.然而,它们这些新的特性为高效的数据一致性管理引出了诸多问题:一方面,持久性内存数据一致性依赖于CPU主动执行硬件指令刷写缓存实现,而这类指令开销极高,严重影响CPU处理性能;另一方面,RDMA在服务器端CPU不参与的情况下直接读写服务器端内存,因此服务器端CPU无法主动感知数据写入事件以执行数据刷写操作,一旦系统崩溃会造成数据不一致的问题.针对以上2个问题,提出一种分布式持久性内存文件系统的一致性机制(crash consistency mechanism,CCM):首先设计实现了基于操作日志的一致性保障策略,通过将每次操作的元信息记录至日志,并持久化,以保障系统的一致性状态;其次,设计了一种客户端对服务器端的远程写一致性策略,在完成数据传输的同时使服务器端CPU主动执行数据刷写;最后实现了一种服务器端的数据异步持久化,以提高系统的处理能力.测试结果表明,基于CCM的文件系统写吞吐可达到网络裸带宽的88%.相比于现有系统Octopus,CCM性能下降控制在1%以内. 展开更多
关键词 持久性内存 远程直接内存访问 一致性 操作日志 分布式文件系统
下载PDF
一种基于微日志的持久性事务内存系统 被引量:2
7
作者 陈娟 胡庆达 +3 位作者 陈游旻 陆游游 舒继武 杨晓辉 《计算机研究与发展》 EI CSCD 北大核心 2018年第9期2029-2037,共9页
近年来,研究者们针对持久性内存良好的性能,设计了轻量级的持久性事务内存系统,它通过日志机制保证了事务的原子性和一致性.然而,相比于传统内存,持久性内存的存储单元往往具有更高的写延迟,并且存在有限的耐久性.发现现有的持久性事务... 近年来,研究者们针对持久性内存良好的性能,设计了轻量级的持久性事务内存系统,它通过日志机制保证了事务的原子性和一致性.然而,相比于传统内存,持久性内存的存储单元往往具有更高的写延迟,并且存在有限的耐久性.发现现有的持久性事务内存系统存在日志机制带来过多的写操作问题:一方面,现有系统没有区分出事务中不同类型的写操作,即无论是对内存中已有数据的更新操作还是向事务中新分配区域添加数据的写操作,现有系统都采用相同的日志机制保证它们的一致性;另一方面,现有系统将更新操作的地址和数据等字段完整地持久化到日志中,即使其中大部分数据都可以通过压缩算法减少写入量.这2方面导致了冗余的日志操作,带来了额外的写延迟和写磨损.为了解决上述问题,设计并实现了一种基于微日志的持久性事务内存系统TLPTM,主要提出2个优化技术:1)分配操作感知的日志优化策略(allocation-aware log optimization,AALO),AALO有效地避免了向事务中新分配区域添加数据的写操作产生的日志开销;2)基于压缩算法的日志优化策略(compression-based log optimization,CBLO),CBLO将日志数据压缩后再写入到日志中,减少了日志操作的写开销.测试结果表明:相比于Mnemosyne,提出的日志优化策略AALO将事务性能提高了15%~24%,基于提出的2种优化技术实现的TLPTM将日志的写入总量降低了70%~81%. 展开更多
关键词 词持久性内存 事务内存系统 性能 耐久性 日志机制
下载PDF
Persistent Data Layout in File Systems
8
作者 luO Shengmei lu youyou +2 位作者 YANG Hongzhang SHU Jiwu ZHANG Jiacheng 《ZTE Communications》 2018年第3期59-66,共8页
Data layout in a file system is the organization of data stored in external storages. The data layout has a huge impact on performance of storage systems. We survey three main kinds of data layout in traditional file ... Data layout in a file system is the organization of data stored in external storages. The data layout has a huge impact on performance of storage systems. We survey three main kinds of data layout in traditional file systems: in-place update file system, log-structured file system, and copy-on-write file sys- tem. Each file system has its own strengths and weaknesses under different circumstances. We also include a recent us- age of persistent layout in a file system that combines both flash memory and byte- addressable non- volatile memory. With this survey, we conclude that persistent data layout in file systems may evolve dramatically in the era of emerging non-volatile memory. 展开更多
关键词 data layout file system persistent storage solid state drive(SSD)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部