期刊文献+
共找到14,368篇文章
< 1 2 250 >
每页显示 20 50 100
基于自主运算的自管理的IP-SAN存储系统的体系结构与性能策略
1
作者 付长冬 舒继武 +1 位作者 郑纬民 沈美明 《高技术通讯》 EI CAS CSCD 2004年第3期1-5,共5页
性能问题和系统管理问题是IP-SAN存储系统最需要解决的问题。针对IP-SAN存储系统和工作负载的特点设计和实现了一个基于自主运算的自管理的IP-SAN存储系统,使系统能够自我适应外部环境的变化进行自我配置和自我优化,从而有效地改进系... 性能问题和系统管理问题是IP-SAN存储系统最需要解决的问题。针对IP-SAN存储系统和工作负载的特点设计和实现了一个基于自主运算的自管理的IP-SAN存储系统,使系统能够自我适应外部环境的变化进行自我配置和自我优化,从而有效地改进系统性能。重点阐述了自管理的IP-SAN存储系统的体系结构和性能策略,详细地介绍了多个不同性能策略的具体算法。测试结果显示基于自主运算的自管理的IP-SAN存储系统有效地提高了响应时间和吞吐量等性能。 展开更多
关键词 自主运算 ip-san存储系统 自管理 体系结构
下载PDF
基于细粒度缓存与学习型索引的LSM树键值存储系统性能优化
2
作者 许睿达 李永坤 许胤龙 《计算机科学》 北大核心 2025年第2期33-41,共9页
在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索... 在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索多个SSTable引起的读放大问题会产生额外的I/O开销,影响系统性能。针对这一问题,提出了一种新型键值存储系统优化设计方案——FCLI-LSM。FCLI-LSM结合了细粒度键值对缓存和学习型索引的优化方法,旨在提升基于LSM-Tree结构的键值存储系统的查询性能。通过对数据访问热点的分析,FCLI-LSM对数据进行热、温、冷数据的三级分级。FCLI-LSM为热数据设计了基于键值分离的细粒度缓存机制,有效减少了读放大问题带来的额外I/O开销;此外,还设计了一种针对学习型索引的缓存亲和优化,进一步提高了存储系统对温数据的查询效率。实验结果表明,与现有的查询优化方案相比,FCLI-LSM能带来超过40%的平均查询时延下降以及超过1.7倍的系统吞吐率提升。 展开更多
关键词 大数据 键值存储系统 日志结构合并树 学习型索引 缓存
下载PDF
大模型时代下的存储系统挑战与技术发展
3
作者 冯杨洋 汪庆 舒继武 《大数据》 2025年第1期79-91,共13页
大语言模型(简称大模型)在文本和视觉处理等复杂任务中表现出色,受到工业界和学术界的广泛关注。大模型的训练与推理高度依赖于GPU算力,而GPU的显存容量有限且属于易失性存储介质,难以满足大模型在训练和推理过程中的存储需求。深入分... 大语言模型(简称大模型)在文本和视觉处理等复杂任务中表现出色,受到工业界和学术界的广泛关注。大模型的训练与推理高度依赖于GPU算力,而GPU的显存容量有限且属于易失性存储介质,难以满足大模型在训练和推理过程中的存储需求。深入分析了大模型时代下存储系统面临的挑战:一是大模型的数据呈现高度碎片化特征,且大模型数据语义稀疏化显著,这降低了存储系统的利用率;二是大模型训练与推理对数据的读写带宽需求高,但异构存储介质间的数据传输通信开销大,这增加了利用异构存储介质扩展GPU显存的难度;三是大模型训练过程中的容错需求高,但直接使用以CPU为中心的容错技术会带来高昂的开销。针对上述挑战,从数据管理、存储扩容和数据容错3个方面总结了现有的解决方案。最后,展望了未来大模型时代存储系统的发展趋势。 展开更多
关键词 大模型 存储系统 数据管理 存储扩容 数据容错
下载PDF
基于LSM树的视频数据扩容存储系统设计
4
作者 李斌 刘思尧 《电子设计工程》 2025年第1期31-35,共5页
针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数... 针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数据节点的分割存储数量,由此完成系统扩容。利用LSM树组织视频数据,应用概率描述存储期望值,实现视频数据扩容存储。由实验结果可知,该系统能够将所有视频数据存储在系统中,且数据存储最大耗时为179 ms,能够达到在短时间内实现全部视频数据有效存储的目的。 展开更多
关键词 LSM树 视频数据 扩容存储 数据重叠 系统扩容
下载PDF
无人机存储柜智能管理系统的总体设计及实现方法研究
5
作者 潘方圆 陈源鹏鳿 +2 位作者 刘鑫洋 宋瑞莹 蒋仕杰 《中文科技期刊数据库(引文版)工程技术》 2025年第1期134-137,共4页
无人机存储柜智能管理系统旨在提供高效、安全的无人机存取和管理解决方案。系统核心功能包括无人机存取管理、状态监控、维护提醒及数据统计分析,通过多种身份验证方式确保安全性。同时,系统具备快速响应和高并发处理能力,支持至少100... 无人机存储柜智能管理系统旨在提供高效、安全的无人机存取和管理解决方案。系统核心功能包括无人机存取管理、状态监控、维护提醒及数据统计分析,通过多种身份验证方式确保安全性。同时,系统具备快速响应和高并发处理能力,支持至少100个用户在线操作,确保稳定性。硬件设计选用耐用材料,配置先进的生物识别及充电系统。测试结果表明,系统功能实现良好,各项性能指标符合预期,确保了高可用性和用户友好性,为无人机管理提供了可靠支持。 展开更多
关键词 无人机存储 智能管理系统 设计与实现
下载PDF
基于知识图谱的存储系统单元教学设计
6
作者 金海峰 坎香 倪峰 《河北软件职业技术学院学报》 2024年第2期51-55,共5页
针对存储系统教学单元概念复杂、术语众多以及理解难度大等特点,提出一种基于知识图谱的教学设计方法。该方法通过知识图谱将碎片化的知识点体系化、可视化,从教学内容分析、知识图谱构建、重难点分析及对策设计、教学策略设计、教学过... 针对存储系统教学单元概念复杂、术语众多以及理解难度大等特点,提出一种基于知识图谱的教学设计方法。该方法通过知识图谱将碎片化的知识点体系化、可视化,从教学内容分析、知识图谱构建、重难点分析及对策设计、教学策略设计、教学过程设计和过程性考核设计等多个环节进行教学设计,并融入思政元素、职业素养,促进“德法知技”综合育人。 展开更多
关键词 知识图谱 存储系统 教学设计 课程思政
下载PDF
多GPU系统非一致存储访问优化:研究进展与展望
7
作者 李晨 刘畅 +1 位作者 葛一漩 郭阳 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1783-1800,共18页
随着晶体管缩小速度的减缓,单GPU(Graphics Processing Units)的性能提升已经变得越来越具有挑战性,因此,多GPU系统成为了提高GPU系统性能的主要手段.然而,由于片外物理设计的制约,多GPU系统中处理器间的带宽不均衡导致了非一致存储访问... 随着晶体管缩小速度的减缓,单GPU(Graphics Processing Units)的性能提升已经变得越来越具有挑战性,因此,多GPU系统成为了提高GPU系统性能的主要手段.然而,由于片外物理设计的制约,多GPU系统中处理器间的带宽不均衡导致了非一致存储访问(Non-Uniform Memory Access,NUMA)问题,严重影响多GPU系统的性能.为了减少非一致存储访问所导致的性能损失,本文首先分析了非一致存储访问出现的原因,并对现有的非一致存储访问解决方案进行了对比.针对不同维度的非一致存储访问,本文从减少远程访问流量和提升远程访问性能两个方向出发,对非一致存储访问的优化方案进行了总结.最后,结合这些方案的优缺点,提出了未来多GPU系统非一致存储访问优化的发展方向. 展开更多
关键词 多GPU系统 非一致存储访问 GPU访存
下载PDF
用IP-SAN技术构建集中存储备份系统 被引量:2
8
作者 王冉 陶秋红 《中国管理信息化》 2010年第18期68-69,共2页
随着企业信息化建设深入发展,企业对于数据、信息的依赖也越来越大,企业的存储管理也面临新的挑战。本文详细介绍了采用IP-SAN技术基于高速以太网SAN架构,通过iSCSI协议来实现存储数据在服务器和存储设备之间的高速传输,高效地确保调度... 随着企业信息化建设深入发展,企业对于数据、信息的依赖也越来越大,企业的存储管理也面临新的挑战。本文详细介绍了采用IP-SAN技术基于高速以太网SAN架构,通过iSCSI协议来实现存储数据在服务器和存储设备之间的高速传输,高效地确保调度数据的安全性和可用性,以支持企业关键业务持续正常运行。 展开更多
关键词 ip-san 存储 备份 架构
下载PDF
电子商务大数据智能存储管理系统的设计与实现解析 被引量:1
9
作者 段亚楠 《电脑编程技巧与维护》 2024年第1期104-107,共4页
介绍一种电子商务大数据智能存储管理系统,旨在为电子商务从业者提供轻松、舒适的工作环境,并满足消费者日益个性化的需求。系统采用C/S结构,通过客户端与服务器软件和硬件终端完成实时数据传输,提供商城管理、店铺设置、店铺高级设置... 介绍一种电子商务大数据智能存储管理系统,旨在为电子商务从业者提供轻松、舒适的工作环境,并满足消费者日益个性化的需求。系统采用C/S结构,通过客户端与服务器软件和硬件终端完成实时数据传输,提供商城管理、店铺设置、店铺高级设置、活动设置等功能,同时利用网络硬件的安全措施确保数据的安全性。 展开更多
关键词 大数据 智能存储 管理系统 C/S结构 实时数据传输
下载PDF
面向AOSFET增益单元的存储系统功耗分析研究
10
作者 李伟 陈龙 +2 位作者 杨业成 郑凌丰 王少昊 《电子制作》 2024年第14期36-39,10,共5页
近年来,数据密集型应用对存储器的存储密度和功耗等性能提出了更高的要求。传统的嵌入式缓存采用6T-SRAM和1T1C-eDRAM技术难以提升存储密度,且存在较高的背景功率。其中,6T-SRAM的背景功率主要来自晶体管的高泄漏电流,1T1C-eDRAM则主要... 近年来,数据密集型应用对存储器的存储密度和功耗等性能提出了更高的要求。传统的嵌入式缓存采用6T-SRAM和1T1C-eDRAM技术难以提升存储密度,且存在较高的背景功率。其中,6T-SRAM的背景功率主要来自晶体管的高泄漏电流,1T1C-eDRAM则主要来自刷新功耗。非晶氧化物半导体(AOSFET)因其极低的泄漏电流和三维集成潜力备受关注。(AOSFET)2T0C-eDRAM是下一代嵌入式缓存技术的有力竞争者。针对当前缺乏功耗分析方法的现状,本文建立了2T0C-eDRAM的读写功耗、刷新功率和泄漏功率模型,并将其集成到定制化NVSim模块中,实现了对AOSFET 2T0C-eDRAM存储系统的功耗分析。仿真结果表明,在大容量存储阵列中,AOSFET 2T0C-eDRAM的读写功耗会略低于6T-SRAM、1T1C-eDRAM和硅基 2T0C-eDRAM,其背景功率(刷新功率和泄漏功率)仅为6T-SRAM的1/6,1T1C-eDRAM的1/10,硅基 2T0C-eDRAM的1/10。 展开更多
关键词 AOSFET 2T0C GC-eDRAM 存储系统 仿真方法 功耗
下载PDF
基于大数据的分布式文件存储系统架构设计
11
作者 杨明 《信息记录材料》 2024年第4期177-179,共3页
针对目前数据量庞大对文件存储的需求激增,本文研究基于大数据的分布式文件存储系统(Hadoop distributed file system,HDFS)架构设计。通过分析HDFS架构的基本原理,讨论数据分布策略、数据备份与恢复机制以及一致性与性能优化的方法,提... 针对目前数据量庞大对文件存储的需求激增,本文研究基于大数据的分布式文件存储系统(Hadoop distributed file system,HDFS)架构设计。通过分析HDFS架构的基本原理,讨论数据分布策略、数据备份与恢复机制以及一致性与性能优化的方法,提出针对名称节点和数据节点的改进措施,包括在名称节点中引入高速闪存驱动器以管理元数据,并在数据节点中实施元数据缓存机制。研究结果表明:分布式文件存储系统可以优化元数据管理,减少网络成本,并提高系统性能,对改善大数据存储系统的性能具有重要作用。 展开更多
关键词 大数据 分布式文件存储 文件存储系统设计
下载PDF
集装箱堆场高货架存储系统仿真研究
12
作者 唐国磊 李梦欣 +2 位作者 于倩 赵晓艺 颜洪伟 《水运工程》 2024年第12期197-205,共9页
为适应港口吞吐量增加和集装箱船大型化发展趋势,新形式的集装箱港口布局方案、码头生产作业模式应运而生。集装箱堆场高货架存储系统作为一种通过提高储存密度减少港口占地面积的堆场存储方案,为立体式堆场的发展提供新思路。针对节约... 为适应港口吞吐量增加和集装箱船大型化发展趋势,新形式的集装箱港口布局方案、码头生产作业模式应运而生。集装箱堆场高货架存储系统作为一种通过提高储存密度减少港口占地面积的堆场存储方案,为立体式堆场的发展提供新思路。针对节约集约利用土地资源的建设要求,以高货架存储系统为研究对象,通过考虑其系统运行流程的复杂性与不确定性,建立系统生产作业智能体仿真模型,验证其有效性,并分析不同工况下的场桥作业效率,为我国集装箱堆场改建提供决策支持。 展开更多
关键词 高货架存储系统 多智能体 仿真 集装箱堆场
下载PDF
存储系统性能测试技术研究
13
作者 刘建 陈硕 +1 位作者 张淑艳 李冬 《自动化应用》 2024年第14期269-272,共4页
针对国产计算机硬盘I/O性能测试存在主要使用开源测试工具、缺少统一的基准测试工具问题,设计了一套专门适用于国产计算机上的硬盘I/O性能测试系统。与开源测试工具相比,该系统测试对象更明确,其图形界面简化了用户操作,能直观展示测试... 针对国产计算机硬盘I/O性能测试存在主要使用开源测试工具、缺少统一的基准测试工具问题,设计了一套专门适用于国产计算机上的硬盘I/O性能测试系统。与开源测试工具相比,该系统测试对象更明确,其图形界面简化了用户操作,能直观展示测试结果。该系统测试结果与开源测试工具Vdbench无异,证明了其可为评估国产计算机硬盘I/O性能提供可靠性依据,同时,在国产计算机上对其进行了应用测试,证明了其实用性。 展开更多
关键词 存储系统 硬盘I/O性能 图形界面 应用测试
下载PDF
云存储系统性能优化策略与关键技术研究
14
作者 农嘉 吕俊虎 韦宁 《电脑知识与技术》 2024年第11期63-65,共3页
文章深入分析了提升云存储系统性能的关键策略与技术,概述了云存储系统性能的指标,包括传输带宽、读写响应时间和资源利用效率。分析了影响云存储系统性能的因素,如网络带宽限制、服务器性能和数据冗余机制。文章重点讨论了优化性能的策... 文章深入分析了提升云存储系统性能的关键策略与技术,概述了云存储系统性能的指标,包括传输带宽、读写响应时间和资源利用效率。分析了影响云存储系统性能的因素,如网络带宽限制、服务器性能和数据冗余机制。文章重点讨论了优化性能的策略,包括实施可扩展网络结构、负载均衡机制、数据去冗余和压缩等。通过这些策略,可以显著提高云存储系统的效率和可靠性,满足日益增长的数据存储需求。 展开更多
关键词 存储系统 性能优化 网络带宽 服务器性能 数据去冗余
下载PDF
网络安全数据存储系统设计
15
作者 亢娟娜 《设备监理》 2024年第2期25-28,共4页
随着网络安全事件频发,为解决网络安全数据安全问题,研究设计一个安全可靠的网络安全数据存储系统具有重要的现实意义。本文首先对系统需求进行分析,其涉及数据的安全性、数据访问权限控制、数据备份与恢复及性能需求等,在此基础上进行... 随着网络安全事件频发,为解决网络安全数据安全问题,研究设计一个安全可靠的网络安全数据存储系统具有重要的现实意义。本文首先对系统需求进行分析,其涉及数据的安全性、数据访问权限控制、数据备份与恢复及性能需求等,在此基础上进行系统设计,系统包括架构设计、数据存储设计、权限管理设计及系统安全设计,最后成功设计出满足备份与恢复、权限控制及安全性等要求的网络安全数据存储系统,以期为用户提供高效、安全的数据存储与管理功能。 展开更多
关键词 网络安全 数据存储系统 系统设计
下载PDF
存储系统中的局部修复阵列码模型 被引量:3
16
作者 洪铁原 唐聃 +3 位作者 熊攀 蔡红亮 曾琼 许源平 《计算机应用研究》 CSCD 北大核心 2024年第1期193-199,共7页
对于单容错和双容错的存储系统,在磁盘修复过程中发生的任何故障都可能引起数据丢失,导致修复失败,保证数据的修复效率对于存储系统的可靠性至关重要。RDP码在进行单盘故障修复时使用混合恢复算法能减少25%的读取总量,但是在进行双盘故... 对于单容错和双容错的存储系统,在磁盘修复过程中发生的任何故障都可能引起数据丢失,导致修复失败,保证数据的修复效率对于存储系统的可靠性至关重要。RDP码在进行单盘故障修复时使用混合恢复算法能减少25%的读取总量,但是在进行双盘故障修复时需读取所有的元素。针对目前难以同时提升单双盘故障修复效率的问题,对RDP码进行拓展,提出了一种具有局部修复性质的阵列码模型——DRDP码。DRDP码在RDP码的基础上将部分数据列按水平线进行异或计算生成局部水平校验列,并将其参与到全局校验列的编码计算中,从而缩短了修复链,使其拥有局部修复的功能。通过理论分析,DRDP码拥有良好的编译码复杂度和更新效率,大幅节省了单盘故障修复读取开销,并对双盘故障修复读取开销进行了优化,同时能修复75%三盘故障的情况。实验结果表明,与RDP码、LRRDP码和RDP(p,3)码相比,DRDP码的编码时间可节省8.23%~32.89%、单盘故障修复时间可节省7.08%~35.01%、双盘故障修复时间可节省5.07%~29.26%。 展开更多
关键词 阵列码 RDP码 存储系统 局部修复 读取开销
下载PDF
从BERT到ChatGPT:大模型训练中的存储系统挑战与技术发展 被引量:6
17
作者 冯杨洋 汪庆 +1 位作者 谢旻晖 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期809-823,共15页
以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算... 以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算模式、访存模式、数据特征,这使得针对互联网、大数据等应用的传统存储技术在处理大模型训练任务时效率低下,且容错开销大.然后分别阐述了针对大模型训练的3类存储加速技术与2类存储容错技术.针对大模型训练的存储加速技术包括:1)基于大模型计算模式的分布式显存管理技术,依据大模型计算任务的划分模式和计算任务间的依赖关系,设计模型数据在分布式集群中的划分、存储和传输策略;2)大模型训练访存感知的异构存储技术,借助大模型训练中的访存模式可预测的特性,设计异构设备中的数据预取和传输策略;3)大模型数据缩减技术,针对大模型数据的特征,对模型训练过程中的数据进行缩减.针对大模型训练的存储容错技术包括:1)参数检查点技术,将大模型参数存储至持久化存储介质;2)冗余计算技术,在多张GPU中重复计算相同版本的参数.最后给出了总结和展望. 展开更多
关键词 ChatGPT 大模型 存储系统 容错 大模型训练系统
下载PDF
基于SSH轻量级框架的教学信息加密存储系统设计
18
作者 戴少锋 《信息与电脑》 2024年第4期248-250,共3页
由于传统的教学信息存储方式存在数据泄露、数据损坏等安全隐患,设计基于SSH轻量级框架的教学信息加密存储系统。采用J2EE轻量级开发框架SSH作为教学信息加密存储系统的架构。采用区块链技术加密处理教学信息,通过基于N+i模式的编码冗... 由于传统的教学信息存储方式存在数据泄露、数据损坏等安全隐患,设计基于SSH轻量级框架的教学信息加密存储系统。采用J2EE轻量级开发框架SSH作为教学信息加密存储系统的架构。采用区块链技术加密处理教学信息,通过基于N+i模式的编码冗余存储机制将教学信息分块存储在区块链节点上,完成教学信息加密存储。测试结果表明,该系统在恶意攻击干扰下加密存储教学信息的成功率高达96.1%,可以保障信息的完整性与安全性。 展开更多
关键词 SSH轻量级框架 教学信息 加密存储 系统设计
下载PDF
微服务架构在分布式云存储系统中的应用与关键技术研究
19
作者 王悦 《湖南邮电职业技术学院学报》 2024年第4期70-75,共6页
本研究聚焦于微服务架构在分布式云存储系统中的应用及关键技术,针对传统单体架构在扩展性、维护成本及系统耦合度方面的局限性,提出了一种基于微服务架构的解决方案。通过合理拆分微服务粒度、优化服务间通信机制及构建自动化运维体系... 本研究聚焦于微服务架构在分布式云存储系统中的应用及关键技术,针对传统单体架构在扩展性、维护成本及系统耦合度方面的局限性,提出了一种基于微服务架构的解决方案。通过合理拆分微服务粒度、优化服务间通信机制及构建自动化运维体系,提升了系统性能、可靠性和运维效率。实验结果表明,中等粒度的微服务拆分与异步通信机制结合,能够大幅度提高系统吞吐量和减少响应时间,同时基于AI的自动化运维体系进一步增强了系统稳定性。 展开更多
关键词 微服务架构 分布式云存储系统 拆分粒度 通信机制 自动化运维
下载PDF
基于GPU直访存储架构的推荐模型预估系统
20
作者 谢旻晖 陆游游 +1 位作者 冯杨洋 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期589-599,共11页
新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在... 新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在着CPU-GPU通信开销大和额外的内存拷贝2个问题,这增加了嵌入层的访存延迟,进而损害模型预估的性能.提出了一种基于GPU直访存储架构的推荐模型预估系统GDRec.GDRec的核心思想是在嵌入参数的访问路径上移除CPU参与,由GPU通过零拷贝的方式高效直访内外存资源.对于内存直访,GDRec利用统一计算设备架构(compute unified device architecture,CUDA)提供的统一虚拟地址特性,实现GPU核心函数(kernel)对主机内存的细粒度访问,并引入访问合并与访问对齐2个机制充分优化访存性能;对于外存直访,GDRec实现了一个轻量的固态硬盘(solid state disk,SSD)驱动程序,允许GPU从SSD中直接读取数据至显存,避免内存上的额外拷贝,GDRec还利用GPU的并行性缩短提交I/O请求的时间.在3个点击率预估数据集上的实验表明,GDRec在性能上优于高度优化后的基于CPU访存架构的系统NVIDIA HugeCTR,可以提升多达1.9倍的吞吐量. 展开更多
关键词 GPU直访存储 参数存储 推荐系统 预估系统 存储系统
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部