期刊文献+
共找到141篇文章
< 1 2 8 >
每页显示 20 50 100
前言
1
作者 舒继武 王意洁 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期555-556,共2页
进入数字经济时代,数据已成为新的核心生产要素,其重要战略资源地位日益凸显,数据潜能的有效激发取决于数据的存储与分析处理.随着先进计算以计算为核心逐步向以数据为中心的不断演进,高效安全存储和智能数据分析成为学术界和产业界广... 进入数字经济时代,数据已成为新的核心生产要素,其重要战略资源地位日益凸显,数据潜能的有效激发取决于数据的存储与分析处理.随着先进计算以计算为核心逐步向以数据为中心的不断演进,高效安全存储和智能数据分析成为学术界和产业界广泛关注的焦点. 展开更多
关键词 安全存储 智能数据分析 以数据为中心 核心生产要素 有效激发 数据的存储 产业界
下载PDF
从BERT到ChatGPT:大模型训练中的存储系统挑战与技术发展 被引量:6
2
作者 冯杨洋 汪庆 +1 位作者 谢旻晖 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期809-823,共15页
以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算... 以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算模式、访存模式、数据特征,这使得针对互联网、大数据等应用的传统存储技术在处理大模型训练任务时效率低下,且容错开销大.然后分别阐述了针对大模型训练的3类存储加速技术与2类存储容错技术.针对大模型训练的存储加速技术包括:1)基于大模型计算模式的分布式显存管理技术,依据大模型计算任务的划分模式和计算任务间的依赖关系,设计模型数据在分布式集群中的划分、存储和传输策略;2)大模型训练访存感知的异构存储技术,借助大模型训练中的访存模式可预测的特性,设计异构设备中的数据预取和传输策略;3)大模型数据缩减技术,针对大模型数据的特征,对模型训练过程中的数据进行缩减.针对大模型训练的存储容错技术包括:1)参数检查点技术,将大模型参数存储至持久化存储介质;2)冗余计算技术,在多张GPU中重复计算相同版本的参数.最后给出了总结和展望. 展开更多
关键词 ChatGPT 大模型 存储系统 容错 大模型训练系统
下载PDF
基于GPU直访存储架构的推荐模型预估系统
3
作者 谢旻晖 陆游游 +1 位作者 冯杨洋 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期589-599,共11页
新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在... 新型深度学习推荐模型已广泛应用至现代推荐系统,其独有的特征——包含万亿嵌入参数的嵌入层,带来的大量不规则稀疏访问已成为模型预估的性能瓶颈.然而,现有的推荐模型预估系统依赖CPU对内存、外存等存储资源上的嵌入参数进行访问,存在着CPU-GPU通信开销大和额外的内存拷贝2个问题,这增加了嵌入层的访存延迟,进而损害模型预估的性能.提出了一种基于GPU直访存储架构的推荐模型预估系统GDRec.GDRec的核心思想是在嵌入参数的访问路径上移除CPU参与,由GPU通过零拷贝的方式高效直访内外存资源.对于内存直访,GDRec利用统一计算设备架构(compute unified device architecture,CUDA)提供的统一虚拟地址特性,实现GPU核心函数(kernel)对主机内存的细粒度访问,并引入访问合并与访问对齐2个机制充分优化访存性能;对于外存直访,GDRec实现了一个轻量的固态硬盘(solid state disk,SSD)驱动程序,允许GPU从SSD中直接读取数据至显存,避免内存上的额外拷贝,GDRec还利用GPU的并行性缩短提交I/O请求的时间.在3个点击率预估数据集上的实验表明,GDRec在性能上优于高度优化后的基于CPU访存架构的系统NVIDIA HugeCTR,可以提升多达1.9倍的吞吐量. 展开更多
关键词 GPU直访存储 参数存储 推荐系统 预估系统 存储系统
下载PDF
大规模问题数据并行性能的分析 被引量:14
4
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
下载PDF
一种电力系统暂态稳定并行计算的优化分区策略 被引量:12
5
作者 舒继武 薛巍 郑纬民 《电力系统自动化》 EI CSCD 北大核心 2003年第19期6-10,共5页
大规模电力系统的区域特性为暂态稳定并行计算任务的优化划分创造了条件。基于分层递归二分法的思想 ,分析了基于块对角加边策略的空间暂态稳定并行计算的任务划分目标 ,提出了一种基于区域特性的任务划分策略 ,将电力系统自然的分层分... 大规模电力系统的区域特性为暂态稳定并行计算任务的优化划分创造了条件。基于分层递归二分法的思想 ,分析了基于块对角加边策略的空间暂态稳定并行计算的任务划分目标 ,提出了一种基于区域特性的任务划分策略 ,将电力系统自然的分层分区特性与并行计算领域的图划分算法相结合 ,有效地降低了暂态稳定计算中协调系统规模和算法通信量 ,提高了各个计算进程的负载平衡度和并行计算性能。实际大规模电力系统的算例仿真结果表明 ,文中提出的方法优于METIS图划分软件 ,与其划分后计算性能的对比可见 ,暂态稳定并行计算最佳仿真速率提高超过 10 % ,有效地提高了并行计算性能 ,为大规模电力系统实时暂态稳定并行计算的实现奠定了基础。 展开更多
关键词 电力系统暂态稳定 并行计算 负载平衡 分区优化 递归二分法 块对角加边
下载PDF
区域分解法解黑油数值模拟问题的并行计算 被引量:9
6
作者 舒继武 归丽忠 +1 位作者 周维四 张德富 《南京大学学报(自然科学版)》 CAS CSCD 1999年第1期51-57,共7页
区域分解方法是适应并行计算机的工作原理应运而生的偏微分方程数值算法,将它应用于解决三维实际问题且行之有效的并行软件并不多见.本文基于共享内存多处理机并行系统解决一类三维黑油油藏数值模拟问题,分别给出了子结构类型DDM... 区域分解方法是适应并行计算机的工作原理应运而生的偏微分方程数值算法,将它应用于解决三维实际问题且行之有效的并行软件并不多见.本文基于共享内存多处理机并行系统解决一类三维黑油油藏数值模拟问题,分别给出了子结构类型DDM和Schwarz类型DDM两种区域分解方法的并行算法,并进行了比较。 展开更多
关键词 并行计算 油藏 数值模拟 区域分解法 黑油油藏
下载PDF
一种高可扩展存储网络系统TH-MSNS的研究与实现 被引量:5
7
作者 舒继武 薛巍 +1 位作者 李必刚 郑纬民 《计算机学报》 EI CSCD 北大核心 2005年第3期326-333,共8页
网络存储系统对海量信息的存储与处理、数据的可伸缩性访问与可用以及数据的服务质量与存储安全等都具有重要意义.该文基于FCP设计并实现了一种可扩展存储区域网络系统TH MSNS,该系统可通过双HBA卡增加带宽和可用性,通过双 I/O节点机增... 网络存储系统对海量信息的存储与处理、数据的可伸缩性访问与可用以及数据的服务质量与存储安全等都具有重要意义.该文基于FCP设计并实现了一种可扩展存储区域网络系统TH MSNS,该系统可通过双HBA卡增加带宽和可用性,通过双 I/O节点机增加可靠性和可用性,通过多 I/O节点扩展容量至 260TB等.该文介绍了TH MSNS的体系结构、SCSI目标模拟器、嵌入式操作系统EOS和存储管理的设计技术与实现方法.该系统 SCSI目标模拟器采用分层设计并提供规范接口,可扩充不同的SCSI设备以及不同的网络连接协议;设计的核心软件在嵌入式操作系统的核心态通过内核模块实现,提高了效率;存储管理软件采用分布式结构,独立于操作系统,实现了对象管理、设备自动发现、访问控制、日志等管理功能.与同类系统相比,该系统具有效率高、扩展方便、易维护和兼容性好的特点. 展开更多
关键词 网络存储系统 SCSI规范 网络存储 SAN FCP
下载PDF
解大型稀疏线性方程组的一种有效并行ICCG法 被引量:7
8
作者 舒继武 赵金熙 张德富 《计算机工程与应用》 CSCD 北大核心 1999年第7期30-31,34,共3页
该文分析了不完全Cholesky分解预处理共轭梯度(ICCG)法各部分的计算量,给出了占ICCG法主要计算时间的解预处理方程的并行算法,它既有比目前迭代算法快的收敛速度,又有较好的并行度。
关键词 稀疏线性方程组 ICCG法 并行迭代
下载PDF
一种高可用性存储系统TH-iSCSI的设计与实现 被引量:1
9
作者 舒继武 于冰 +1 位作者 薛巍 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期82-90,共9页
基于IP网络的存储在远距离传输、管理、成本和互操作性方面优于光纤通道技术,iSCSI存储技术已是目前研究的一个热点.详细介绍了一种基于iSCSI协议的高可用性存储系统TH-iSCSI的设计与实现.基于iSCSI控制器实现了IO负载的控制机制,并提... 基于IP网络的存储在远距离传输、管理、成本和互操作性方面优于光纤通道技术,iSCSI存储技术已是目前研究的一个热点.详细介绍了一种基于iSCSI协议的高可用性存储系统TH-iSCSI的设计与实现.基于iSCSI控制器实现了IO负载的控制机制,并提出了一种在线更换存储设备的机制,提高了系统的稳定性和可用性.提出了一种多通道控制技术,提供通道上的失效冗余和负载平衡,有效提高了TH-iSCSI存储系统并发IO能力.实现了多网络适配器轮转(Round-Robin)和热备份(Active-Standby)两种发送模式,利用负载均衡和失效恢复的调度算法将数据报分发到相应的网络接口上,从而实现了链路的聚合,既提高了吞吐率,又降低了链路的失效率,还提高了应用服务器和iSCSI控制器的可用性.此外,还提出了一种基于IP地址的存储设备映射方法,实现了启动器对虚拟设备标识符访问权限的控制,提高了系统的安全性.测试结果表明,TH-iSCSI存储系统具有较高的性能与可用性,多链路平均读写速度可达到300MBps,单链路有效负载率达到85%以上. 展开更多
关键词 存储区域网络 ISCSI 链路聚合 多通道控制技术 存储设备映射 高可用性
下载PDF
基于多层油藏问题负载均衡的并行任务划分 被引量:1
10
作者 舒继武 赵金熙 +2 位作者 赵金熙 周维四 张德富 《软件学报》 EI CSCD 北大核心 1999年第10期1061-1066,共6页
该文基于分布式并行计算机系统,对一类多层二维二相流油藏数值模拟问题给出了3种任务划分策略──“卷帘”方式、区域分解方式和“卷帘”与区域分解结合的方式,对它们进行了比较,提出了减少求解时间、利于负载均衡和提高并行性能的... 该文基于分布式并行计算机系统,对一类多层二维二相流油藏数值模拟问题给出了3种任务划分策略──“卷帘”方式、区域分解方式和“卷帘”与区域分解结合的方式,对它们进行了比较,提出了减少求解时间、利于负载均衡和提高并行性能的任务划分方法,并实际应用于有多达72万个网格节点的大规模油藏模拟问题实算结果表明,该策略划分产生的并行求解任务均衡,有利于加速比的提高.该方法也适用于区域或数据并行的任务划分问题. 展开更多
关键词 并行计算 负载均衡 任务划分 油藏 数值模拟
下载PDF
非均匀区域油藏模拟负载平衡的分区并行算法 被引量:1
11
作者 舒继武 赵金熙 +1 位作者 周维四 张德富 《软件学报》 EI CSCD 北大核心 1999年第2期187-192,共6页
基于分布式并行计算机系统,对一类非均匀区域的油藏数值模拟问题,采用了区域分解方法并行求解,给出了并行求解的负载平衡模型及区域负载平衡的一种有效分区算法,从而将这类油藏数值模拟问题均衡映射到并行环境中,高效地并行求解.... 基于分布式并行计算机系统,对一类非均匀区域的油藏数值模拟问题,采用了区域分解方法并行求解,给出了并行求解的负载平衡模型及区域负载平衡的一种有效分区算法,从而将这类油藏数值模拟问题均衡映射到并行环境中,高效地并行求解.在黑油油藏数值模拟并行软件的研究中,实验结果表明,该算法有利于提高加速比. 展开更多
关键词 油藏 数值模拟 区域分解 负载平衡 并行算法
下载PDF
一类大规模油藏数值模拟问题的有效并行计算 被引量:1
12
作者 舒继武 赵金熙 +1 位作者 归丽忠 张德富 《电子学报》 EI CAS CSCD 北大核心 1999年第11期90-92,共3页
:大型科学计算领域的并行处理一直是人们非常关注的,如油藏数值模拟的并行计算.本文基于用网络连接多台共享内存多处理机的分布并行处理系统,运用并行计算理论和方法,采用负载均衡策略,解决了网格节点多达728万的大规模油藏数值模拟问题... :大型科学计算领域的并行处理一直是人们非常关注的,如油藏数值模拟的并行计算.本文基于用网络连接多台共享内存多处理机的分布并行处理系统,运用并行计算理论和方法,采用负载均衡策略,解决了网格节点多达728万的大规模油藏数值模拟问题,提高了油藏数值模拟的计算速度和能力. 展开更多
关键词 并行计算 大规模 油藏数值模拟 负载均衡
下载PDF
基于异构并行环境的大型稀疏线性方程组求解的任务映射算法
13
作者 舒继武 赵金熙 +1 位作者 张德富 周维四 《电子学报》 EI CAS CSCD 北大核心 1999年第8期102-104,共3页
本文基于异构并行环境,针对大型稀疏形线性方程组的并行求解,给出了求解方程组的静态任务映射,提出了合理的任务映射费用函数,并运用模拟退火算法寻找最佳任务映射,从而将一类不均匀任务合理地映射到异构并行环境中高效地并行求解。
关键词 大型 任务映射 稀疏线性方程组 算法
下载PDF
网络存储专栏 分级存储与管理 被引量:8
14
作者 舒继武 《中国教育网络》 2007年第7期70-72,共3页
面对无休无止增长起来的数据量及越来越大的文件,要访问、存储和管理这些数据和文件已经变得越来越困难了,管理维护成本也越来越高。
关键词 管理 存储 维护成本 数据量 文件
下载PDF
基于机群系统的薄膜淀积并行计算
15
作者 舒继武 郑纬民 +1 位作者 沈美明 黄汉臣 《计算物理》 CSCD 北大核心 2001年第3期230-234,共5页
基于集群并行系统 ,实现了运用蒙特卡罗方法模拟 10 0× 10 0× 10 0个原子Si衬底Al薄膜淀积过程的并行计算 .采用了重叠的区域分解法和异步通信的有效并行计算策略 ,将区域的合理划分与薄膜淀积的空间填补的拓扑几何机理结合起... 基于集群并行系统 ,实现了运用蒙特卡罗方法模拟 10 0× 10 0× 10 0个原子Si衬底Al薄膜淀积过程的并行计算 .采用了重叠的区域分解法和异步通信的有效并行计算策略 ,将区域的合理划分与薄膜淀积的空间填补的拓扑几何机理结合起来 ,着重减少通信耗费 ,提高算法的并行性能 ,大量地缩短了薄膜淀积模拟计算时间 ,从而为运用计算机方法模拟薄膜淀积、完成薄膜材料淀积的预测提供了更高效的手段 . 展开更多
关键词 薄膜淀积 并行模拟 蒙特卡罗方法 区域分解 集群系统 异步通信
下载PDF
前言
16
作者 舒继武 王意洁 吴晨涛 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期291-292,共2页
随着大数据时代的到来,各领域的数据呈现出爆炸式增长态势,数据资源得到了各行各业的广泛关注.如何挖掘大数据价值,进而充分发挥大数据效益?大数据的4V特征使得数据获取、数据存储、数据搜索、数据共享、数据分析、数据可视化等各个环... 随着大数据时代的到来,各领域的数据呈现出爆炸式增长态势,数据资源得到了各行各业的广泛关注.如何挖掘大数据价值,进而充分发挥大数据效益?大数据的4V特征使得数据获取、数据存储、数据搜索、数据共享、数据分析、数据可视化等各个环节对存储系统构建带来了新的技术挑战.同时,伴随着人工智能的崛起,智能存储与智能分析逐渐成为发挥大数据效益的有效技术途径. 展开更多
关键词 大数据 数据可视化 数据搜索 数据共享 人工智能 智能分析 智能存储 数据存储
下载PDF
存储虚拟化 被引量:6
17
作者 舒继武 《中国教育网络》 2007年第4期67-70,共4页
从广义上讲,虚拟化技术在存储与服务器解决方案中已经应用多年。存储虚拟化是一个抽象的技术,在存储的所有层面上几乎都可以应用,如文件系统、文件、块、主机、网络、存储设备等层次都可以进行虚拟化。目前,存储虚拟化甚至被人们看作是... 从广义上讲,虚拟化技术在存储与服务器解决方案中已经应用多年。存储虚拟化是一个抽象的技术,在存储的所有层面上几乎都可以应用,如文件系统、文件、块、主机、网络、存储设备等层次都可以进行虚拟化。目前,存储虚拟化甚至被人们看作是继SAN之后的又一个新浪潮。未来的存储虚拟化将会为存储应用带来更加高级的存储功能,如分级存储、异构复制和快照等。 展开更多
关键词 存储设备 虚拟化 文件系统 服务器 应用 技术
下载PDF
网络存储安全 被引量:5
18
作者 舒继武 《中国教育网络》 2007年第10期64-65,共2页
随着数字信息的爆炸式增长和个人与组织对这些信息的依赖性不断增加,存储系统正逐渐成为整个信息系统的中心,数据成为最重要的资产,而存储系统作为数据的储藏地,是数据保护的最后一道防线;另外存储系统由本地直连向着网络化和分布... 随着数字信息的爆炸式增长和个人与组织对这些信息的依赖性不断增加,存储系统正逐渐成为整个信息系统的中心,数据成为最重要的资产,而存储系统作为数据的储藏地,是数据保护的最后一道防线;另外存储系统由本地直连向着网络化和分布式的方向发展,并被网络上的众多计算机共享,从而使存储系统变得更易受到攻击,相对静态的存储系统往往成为攻击者的首选目标,达到窃取、篡改或破坏数据的目的,因此数据保护的重要性增大。 展开更多
关键词 网络存储 存储系统 安全 数字信息 数据保护 信息系统 依赖性 分布式
下载PDF
存储系统的体系结构 被引量:5
19
作者 舒继武 《中国教育网络》 2007年第3期66-68,共3页
信息化步伐的加快,使得数据量爆炸增长。数据的处理、传输、存储等成为了很多高校管理者关注的焦点,本刊特邀了清华大学舒继武教授,开设了“网络存储”专栏,为广大读者介绍存储系统与技术的发展,网络存储的发展与方向,国内外的研究现状... 信息化步伐的加快,使得数据量爆炸增长。数据的处理、传输、存储等成为了很多高校管理者关注的焦点,本刊特邀了清华大学舒继武教授,开设了“网络存储”专栏,为广大读者介绍存储系统与技术的发展,网络存储的发展与方向,国内外的研究现状及热点等,其中包括存储虚拟化技术、网络存储的容灾、网络存储的安全、面向对象的网络存储技术、存储服务质量等等,以满足读者的需求。 展开更多
关键词 存储系统 体系结构 网络存储技术 高校管理者 清华大学 面向对象 服务质量 信息化
下载PDF
前言
20
作者 舒继武 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2018年第9期2000-2001,共2页
信息技术和系统应用的发展对信息存储技术提出了诸多新的要求.一方面,大数据时代对数据存储的规模和处理能力需求越来越高,亟需新型存储系统和技术以提供更高的性能和更好的可扩展性.而随着固态闪存和非易失性内存等存储介质的发展,一... 信息技术和系统应用的发展对信息存储技术提出了诸多新的要求.一方面,大数据时代对数据存储的规模和处理能力需求越来越高,亟需新型存储系统和技术以提供更高的性能和更好的可扩展性.而随着固态闪存和非易失性内存等存储介质的发展,一些基于固态闪存和非易失性内存的软件系统被设计和提出,这些为新型存储系统的构建与实现带来了新的机遇.另一方面,随着数据中心、云端数据存储服务及人工智能应用的日益广泛,现有的存储技术和系统难以满足上层应用的需求,人们仍在探索采用传统磁盘介质的存储系统的改进方案,以解决海量数据存储系统的高效可靠的架构及构造方法. 展开更多
关键词 数据存储系统 信息存储技术 存储介质 非易失性 信息技术 可扩展性 软件系统 数据中心
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部