期刊文献+
共找到250篇文章
< 1 2 13 >
每页显示 20 50 100
钱德沛:算网融合与智算融合共促算力网建设
1
作者 钱德沛 《中国信息界》 2024年第8期3-4,共2页
要把关系国计民生、关乎国家创新发展、由国家主要投入的高端算力联成一张“网”,作为一个基础设施来运行,支撑科研发展。算力网的建设,需要考虑二个融合:第一个融合是计算资源与网络资源的融合。算网融合实际上是建立算力网的一个基本... 要把关系国计民生、关乎国家创新发展、由国家主要投入的高端算力联成一张“网”,作为一个基础设施来运行,支撑科研发展。算力网的建设,需要考虑二个融合:第一个融合是计算资源与网络资源的融合。算网融合实际上是建立算力网的一个基本的条件,它可以说是技术上的这个保证,也是一些理念上的启发。 展开更多
关键词 基础设施 网络资源 网融合 国家创新发展 计算资源 国计民生
下载PDF
GNNSched:面向GPU的图神经网络推理任务调度框架 被引量:1
2
作者 孙庆骁 刘轶 +4 位作者 杨海龙 王一晴 贾婕 栾钟治 钱德沛 《计算机工程与科学》 CSCD 北大核心 2024年第1期1-11,共11页
由于频繁的显存访问,图神经网络GNN在GPU上运行时往往资源利用率较低。现有的推理框架由于没有考虑GNN输入的不规则性,直接适用到GNN进行推理任务共置时可能会超出显存容量导致任务失败。对于GNN推理任务,需要根据其输入特点预先分析并... 由于频繁的显存访问,图神经网络GNN在GPU上运行时往往资源利用率较低。现有的推理框架由于没有考虑GNN输入的不规则性,直接适用到GNN进行推理任务共置时可能会超出显存容量导致任务失败。对于GNN推理任务,需要根据其输入特点预先分析并发任务的显存占用情况,以确保并发任务在GPU上的成功共置。此外,多租户场景提交的推理任务亟需灵活的调度策略,以满足并发推理任务的服务质量要求。为了解决上述问题,提出了GNNSched,其在GPU上高效管理GNN推理任务的共置运行。具体来说,GNNSched将并发推理任务组织为队列,并在算子粒度上根据成本函数估算每个任务的显存占用情况。GNNSched实现了多种调度策略来生成任务组,这些任务组被迭代地提交到GPU并发执行。实验结果表明,GNNSched能够满足并发GNN推理任务的服务质量并降低推理任务的响应时延。 展开更多
关键词 图神经网络 图形处理器 推理框架 任务调度 估计模型
下载PDF
面向天河新一代超算系统通用处理器的性能分析工具集
3
作者 冯文韬 栾钟治 +1 位作者 杨海龙 钱德沛 《计算机学报》 EI CSCD 北大核心 2024年第2期423-440,共18页
天河新一代超算系统是继天河2号后天河系列的新一代超算系统.该系统拟采用通用处理器配合加速器的混合异构架构,其中通用处理器采用ARM架构.目前,面向ARM架构处理器的性能分析工具仍不够完善,而面向新一代超算的性能分析工具更是较为匮... 天河新一代超算系统是继天河2号后天河系列的新一代超算系统.该系统拟采用通用处理器配合加速器的混合异构架构,其中通用处理器采用ARM架构.目前,面向ARM架构处理器的性能分析工具仍不够完善,而面向新一代超算的性能分析工具更是较为匮乏,实用性和效率还难以满足编程人员的需求.本文针对天河新一代超算系统的通用处理器,设计开发了一套性能分析工具集,包含缓存冲突检测、伪共享检测和内存缺陷检测三个子工具.工具集可以在天河新一代超算系统的普通用户权限下分析系统单节点内以及数据并行性较高的多节点程序的性能问题,并可以解决程序的内存问题.本文使用min-write、缓存行对齐填充、线程访问隔离等多种性能优化策略来提高工具性能,采用以上策略的工具的运行时间可至多减少至原先的1/20,同时使用新颖的红区检测法和红区隐藏与恢复机制来降低工具报告的假错误率.本文还开发了配套的可视化界面,使用户可以对程序的性能分析数据进行可视化的分析和处理,提高了工具的实用性和易用性.工具对程序执行带来的额外时间开销是40~100倍,额外内存开销是100~200倍,正确性和实用性得以保证,可以提高天河新一代超算系统的编程效率和程序性能. 展开更多
关键词 性能分析工具 天河新一代超算系统 伪共享检测 内存缺陷检测 程序优化
下载PDF
面向GPU并行编程的线程同步综述
4
作者 高岚 赵雨晨 +2 位作者 张伟功 王晶 钱德沛 《软件学报》 EI CSCD 北大核心 2024年第2期1028-1047,共20页
并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GP... 并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GPU系统却难以高效地支持真实应用中复杂的线程同步.研究者虽然提出了很多支持GPU线程同步的方法并取得了较大进展,但GPU独特的体系结构及并行模式导致GPU线程同步的研究仍然面临很多挑战.根据不同的线程同步目的和粒度对GPU并行编程中的线程同步进行分类.在此基础上,围绕GPU线程同步的表达和执行,首先分析总结GPU线程同步存在的难以高效表达、错误频发、执行效率低的关键问题及挑战;而后依据不同的GPU线程同步粒度,从线程同步表达方法和性能优化方法两个方面入手,介绍近年来学术界和产业界对GPU线程竞争同步及合作同步的研究,对现有研究方法进行分析与总结.最后,指出GPU线程同步未来的研究趋势和发展前景,并给出可能的研究思路,从而为该领域的研究人员提供参考. 展开更多
关键词 通用图形处理器(GPGPU) 并行编程 线程同步 性能优化
下载PDF
从网格到“东数西算”:构建国家算力基础设施 被引量:18
5
作者 钱德沛 栾钟治 刘轶 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第9期1561-1574,共14页
简要回顾了几十年来计算机使用方式的变迁,介绍了基于网络计算技术的国家高性能计算基础设施CNGrid的设计与实现。讨论了在“东数西算”战略工程背景下中国算力发展的新趋势,以及国家算力基础设施发展面临的新的技术挑战,并对中国未来... 简要回顾了几十年来计算机使用方式的变迁,介绍了基于网络计算技术的国家高性能计算基础设施CNGrid的设计与实现。讨论了在“东数西算”战略工程背景下中国算力发展的新趋势,以及国家算力基础设施发展面临的新的技术挑战,并对中国未来超算应用生态和算力基础设施建设提出了展望。 展开更多
关键词 高性能计算 基础设施 网格计算 CNGrid 东数西算
下载PDF
一种基于UML的协同入侵检测系统分析方法 被引量:2
6
作者 钱德沛 张然 白跃彬 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第9期803-807,共5页
为了提高对分布式协同攻击的检测能力 ,提出了一种具有广泛适用性的分布式协同入侵检测模型 ,该模型以多代理为构造基础 ,通过协调代理协同下层检测代理 ,实现对复杂攻击的协同检测 .采用统一建模语言 (UML) ,对模型的主要功能、静态组... 为了提高对分布式协同攻击的检测能力 ,提出了一种具有广泛适用性的分布式协同入侵检测模型 ,该模型以多代理为构造基础 ,通过协调代理协同下层检测代理 ,实现对复杂攻击的协同检测 .采用统一建模语言 (UML) ,对模型的主要功能、静态组织结构、代理内部的推理行为和代理间的交互行为进行了分析和设计 .UML为协同入侵检测系统的分析和设计提供了有效的手段 。 展开更多
关键词 安全 协调 检测 协同攻击 代理 统一建模语言
下载PDF
动态构造网管中管理功能与被管对象的关联 被引量:1
7
作者 钱德沛 栾钟治 +1 位作者 陈衡 李云春 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2003年第10期852-855,共4页
在动态构造的网络管理中 ,管理功能与被管对象的关联机制是核心关键技术 .这种关联机制采用被管对象集MOS(ManagedObjectsSets)的思想 .MOS提供对协议、设备及应用相关的被管对象的定义及描述 ,通过动态编译的技术生成及扩展MOS 。
关键词 网络管理 动态构造 关联 被管对象集 动态编译
下载PDF
我国高性能计算的回顾与展望 被引量:2
8
作者 钱德沛 《民主与科学》 2017年第4期20-23,共4页
高性能计算是战略性、前沿性的高技术,是发达国家争夺的战略制高点。高性能计算是解决国家经济建设、社会发展、科学进步、国家安全方面一系列重大挑战性问题的重要手段,是国家创新体系的重要组成部分。高性能计算产生的原始创新和高... 高性能计算是战略性、前沿性的高技术,是发达国家争夺的战略制高点。高性能计算是解决国家经济建设、社会发展、科学进步、国家安全方面一系列重大挑战性问题的重要手段,是国家创新体系的重要组成部分。高性能计算产生的原始创新和高端技术会影响下游产业的发展,因此美国、日本、欧盟在这方面均有大量的投入,包括资金和人力,以确保他们的技术始终保持着领先地位。 展开更多
关键词 性能 国家创新体系 展望 国家经济建设 高技术 发达国家 社会发展 科学进步
下载PDF
构建支撑科技创新的新一代计算基础设施 被引量:17
9
作者 钱德沛 《数据与计算发展前沿》 2020年第1期1-17,共17页
【背景】理论分析、实验观察与计算模拟是科学研究的三大手段。高性能计算作为一个国家综合国力的主要标志之一,具有重要的战略意义。【方法】本文从我国高性能计算机的研制、高性能计算机环境的建设以及计算应用的发展等方面,重点回顾... 【背景】理论分析、实验观察与计算模拟是科学研究的三大手段。高性能计算作为一个国家综合国力的主要标志之一,具有重要的战略意义。【方法】本文从我国高性能计算机的研制、高性能计算机环境的建设以及计算应用的发展等方面,重点回顾了我国高性能计算在过去20年的发展历程和取得的主要成就,进而对当前“十三五”期间我国对高性能计算重点研发项目的部署和进展进行介绍。【结论】并基于对当前高性能计算发展形势的分析,对加强新一代计算基础设施的建设以及应用的构建提出设想并展开讨论。 展开更多
关键词 高性能计算 计算基础设施 计算应用 软件基础平台
下载PDF
分簇无线传感器网络的双时槽混合MAC协议
10
作者 钱德沛 李世晗 +1 位作者 刘轶 杜治高 《高技术通讯》 EI CAS CSCD 北大核心 2009年第5期441-445,共5页
基于事件驱动的无线传感器网络应用,提出了一个基于分簇优化的低时延混合MAC协议——CHMAC。 CHMAC采用双时槽传输调度和载波检测多路接入/时分多址接入(CSMA/TDMA)混合模式,采用适合分簇网络的时槽分配,优先保证紧急事件的最小延迟发送... 基于事件驱动的无线传感器网络应用,提出了一个基于分簇优化的低时延混合MAC协议——CHMAC。 CHMAC采用双时槽传输调度和载波检测多路接入/时分多址接入(CSMA/TDMA)混合模式,采用适合分簇网络的时槽分配,优先保证紧急事件的最小延迟发送,并充分利用分簇网络的数据流特点,精细控制节点的侦听、睡眠以及传输功率,以提高能量有效性和网络吞吐量。理论分析和模拟试验表明,该协议能够以良好的适应性和健壮性在各种流量条件下均表现良好的性能。 展开更多
关键词 无线传感器网络 媒体接入控制(MAC) 载波检测多路接入(CSMA) 分时多址 接入(TDMA)
下载PDF
分布式共享存储器型多处理机的研究
11
作者 钱德沛 王秀萍 崔巍 《西安交通大学学报》 EI CAS CSCD 北大核心 1996年第9期8-16,123,共10页
文章提出了一台分层结构分布式共享存储器型多处理机DSMArc的系统结构.该系统采用总线监听式和目录式相结合的cache一致性协议,来保持分布式局部cache与共享主存内容的一致.为压缩目录所需存储空间,文章提出了一种... 文章提出了一台分层结构分布式共享存储器型多处理机DSMArc的系统结构.该系统采用总线监听式和目录式相结合的cache一致性协议,来保持分布式局部cache与共享主存内容的一致.为压缩目录所需存储空间,文章提出了一种新的目录存储结构-目录cache.在SunSparc工作站上对DSMArc原型进行了模拟。 展开更多
关键词 多处理机 共享存储器 分布式 存储器
下载PDF
网格技术与信息化建设 被引量:5
12
作者 钱德沛 《电子商务世界》 2004年第4期92-95,共4页
网格使我们能像按需使用电力那样使用Internet中的各种资源,它将Internet从通讯和信息交互的平台提升到资源共享和协同工作的平台。
关键词 网格技术 信息化建设 协同工作 运行成本 高性能计算机
下载PDF
一个并行程序开发环境的研究与实现
13
作者 钱德沛 钱强 《西安交通大学学报》 EI CAS CSCD 北大核心 1997年第9期31-38,共8页
文章介绍一个面向普通PC互连构成的多处理机系统的并行程序开发环境ParaDK.ParaDK由并行程序设计语言ParaC、并行操作系统ParaOS和一个并行程序调试工具组成.ParaC是标准C++扩展了支持并行的宏与库... 文章介绍一个面向普通PC互连构成的多处理机系统的并行程序开发环境ParaDK.ParaDK由并行程序设计语言ParaC、并行操作系统ParaOS和一个并行程序调试工具组成.ParaC是标准C++扩展了支持并行的宏与库函数而成.ParaOS在MSDOS基础上增加了并行处理所需功能并支持多线程.对ParaOS的多线程机制和线程间同步与通信的方式作了较详细的讨论,并简要介绍了并行调试工具的功能. 展开更多
关键词 并行操作系统 软件开发 并行计算机 程序设计
下载PDF
我国网格技术应用现状及发展探讨 被引量:2
14
作者 钱德沛 《国土资源信息化》 2004年第5期3-5,共3页
近年,我国大力推进的信息化进程对信息技术提出前所未有的需求和挑战。网格技术体现了构建信息系统的新思维方式,是解决大规模分布资源共享和协同工作问题的新的平台技术,是支撑各类应用的新的国家基础设施。网格技术的普及将加快我国... 近年,我国大力推进的信息化进程对信息技术提出前所未有的需求和挑战。网格技术体现了构建信息系统的新思维方式,是解决大规模分布资源共享和协同工作问题的新的平台技术,是支撑各类应用的新的国家基础设施。网格技术的普及将加快我国信息化进程。 展开更多
关键词 信息化进程 中国 发展 需求 平台技术 推进 基础设施 网格技术 协同工作 大规模
下载PDF
国家高性能计算发展现况 被引量:1
15
作者 钱德沛 《中国教育网络》 2014年第1期33-33,共1页
科研信息化有三个基本要素,第一,计算,第二,海量数据的存储与处理,第三,交流与协同能力。这三个能力形成了科研信息化的支撑手段。当然网络支撑所有的,包括计算、协同和数据传输的最基础手段。科研信息化关乎一国竞争力和科研水平的发展... 科研信息化有三个基本要素,第一,计算,第二,海量数据的存储与处理,第三,交流与协同能力。这三个能力形成了科研信息化的支撑手段。当然网络支撑所有的,包括计算、协同和数据传输的最基础手段。科研信息化关乎一国竞争力和科研水平的发展,是一种长久的计划,不是可抓可不抓的问题。我国在高性能计算方面有很多的部署,从自然科学基金开始。自然科学基金刚刚设立了一个重大研究计划,"高性能科学计算的基础算法与可计算建模",该计划将持续八年,投资1.8亿人民币,专门研究高性能计算的算法与建模方法。即将结束的一个重要计划是以网络为基础的科学活动环境的研究。 展开更多
关键词 科研信息化 网格服务 自然科学基金 重大研究计划 高性能计算机 网络支撑 虚拟计算环境 协同能力 发展现况 天河一号
下载PDF
互联网应用性能测量系统的研究与实现 被引量:18
16
作者 张文杰 钱德沛 +2 位作者 张然 杨新宇 张兴军 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期60-67,共8页
致力于建立互联网应用系统网络性能的基础性测量平台 ,它为互联网上众多的应用系统提供了一个分布式可扩展的性能测量系统 首先分析了应用系统性能数据的数据特征 ,并将性能数据划分为 3类数据集 ;建立了互联网应用系统网络性能测量模... 致力于建立互联网应用系统网络性能的基础性测量平台 ,它为互联网上众多的应用系统提供了一个分布式可扩展的性能测量系统 首先分析了应用系统性能数据的数据特征 ,并将性能数据划分为 3类数据集 ;建立了互联网应用系统网络性能测量模型 ,并针对应用网络性能测量数据获取的难点 ,提出了应用探针和区域探针的分布式体系结构 最后结合海量信息系统测量平台的研究 。 展开更多
关键词 互联网 性能测量系统 INTERNET 测量模型 性能评价 分布式体系结构 可视化 应用系统 计算机网络
下载PDF
入侵检测技术研究综述 被引量:47
17
作者 张然 钱德沛 +2 位作者 张文杰 刘轶 栾钟治 《小型微型计算机系统》 CSCD 北大核心 2003年第7期1113-1118,共6页
入侵检测是一种重要的主动安全防御技术 .本文首先概述了入侵检测技术的发展历史及其通用模型和框架CIDF;接着依据不同标准对入侵检测系统进行了分类 ,并评述了各种入侵检测方法和技术 ;然后分析了现存的三种入侵检测体系结构 .
关键词 入侵检测 通用入侵检测框架 入侵检测系统
下载PDF
众核处理器系统核资源动态分组的自适应调度算法 被引量:14
18
作者 曹仰杰 钱德沛 +1 位作者 伍卫国 董小社 《软件学报》 EI CSCD 北大核心 2012年第2期240-252,共13页
针对众核处理器系统的核资源优化使用问题,提出了一种支持核资源动态分组的自适应调度算法CASM(core-partitioned adaptive scheduling for many-core systems).该算法通过对任务簇的拆分与合并,动态构建可弹性分区的核逻辑组,实现核资... 针对众核处理器系统的核资源优化使用问题,提出了一种支持核资源动态分组的自适应调度算法CASM(core-partitioned adaptive scheduling for many-core systems).该算法通过对任务簇的拆分与合并,动态构建可弹性分区的核逻辑组,实现核资源的隔离优化访问.为了平衡核资源利用率及任务调度效率,CASM算法针对任务簇间和簇内的不同特点,分别采用公平性较好的均衡调度算法和资源利用率较高的自适应调度算法.在线竞争理论分析表明,CASM算法的任务执行时间在线竞争比为常数2,其性能可扩展性较好.实验结果表明,与WS(work-stealing),AGDEQ(adaptive greedy dynamic equi-partitioning)和EQUI?EQUI算法相比,CASM算法使任务集运行时间分别减少了近46%,32%和15%.在相同能耗情况下,CASM算法大幅度地提升了系统吞吐量. 展开更多
关键词 众核处理器 分组调度 自适应调度 竞争分析 高效能计算
下载PDF
主动网络管理体系结构的研究 被引量:16
19
作者 徐斌 钱德沛 +1 位作者 张文杰 栾钟治 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期488-494,共7页
主动网络作为一种新型的网络体系结构,能够有效地加快网络协议和服务的开发、验证和部署,但与此同时,对它的管理也需要采用与传统网络管理不同的技术.针对主动网络支持的协议和服务动态变化的特点,提出了一种基于管理小应用(MA... 主动网络作为一种新型的网络体系结构,能够有效地加快网络协议和服务的开发、验证和部署,但与此同时,对它的管理也需要采用与传统网络管理不同的技术.针对主动网络支持的协议和服务动态变化的特点,提出了一种基于管理小应用(MALet)和管理代理(MA)的主动网络管理体系结构(M2BMA).该体系结构包括主动网络管理服务器、本地节点管理器、主动网络管理代理执行环境和消息系统.主动网络管理服务器和本地节点管理器能够根据主动网络服务的变化而动态构造网络管理应用,本地节点管理器还为主动节点的自管理提供了一种有效的手段.主动网络管理代理执行环境为管理代理的动态部署提供了支持.在该管理体系结构下,管理者可以方便灵活地对主动网络进行有效地管理.该体系结构还与传统的网络管理兼容. 展开更多
关键词 体系结构 主动网络 网络管理 管理代理 计算机网络
下载PDF
内存计算技术研究综述 被引量:32
20
作者 罗乐 刘轶 钱德沛 《软件学报》 EI CSCD 北大核心 2016年第8期2147-2167,共21页
在大数据时代,如何高效地处理海量数据以满足性能需求,是一个需要解决的重要问题.内存计算充分利用大容量内存进行数据处理,减少甚至避免I/O操作,因而极大地提高了海量数据处理的性能,同时也面临一系列有待解决的问题.首先,在分析内存... 在大数据时代,如何高效地处理海量数据以满足性能需求,是一个需要解决的重要问题.内存计算充分利用大容量内存进行数据处理,减少甚至避免I/O操作,因而极大地提高了海量数据处理的性能,同时也面临一系列有待解决的问题.首先,在分析内存计算技术特点的基础上对其进行了分类,并分别介绍了各类技术及系统的原理、研究现状及热点问题;其次,对内存计算的典型应用进行了分析;最后,从总体层面和应用层面对内存计算面临的挑战予以分析,并且对其发展前景做了展望. 展开更多
关键词 内存计算 新型混合内存 分布式集群 图计算 大数据处理
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部