期刊文献+
共找到215篇文章
< 1 2 11 >
每页显示 20 50 100
践行科教融合、贯穿产学研的创新人才培养——中国科学院计算技术研究所的实践
1
作者 董慧 李晓维 《软件工程》 2017年第7期1-4,共4页
世界已进入科教融合日趋紧密的大科学时代。本文在多年研究生教育管理实践的基础之上,通过研究借鉴国际先进科研机构和大学的成功经验,探索新的体制机制和管理模式,以计算机体系结构国家重点实验室为例,以建设国际一流的科研机构为目标... 世界已进入科教融合日趋紧密的大科学时代。本文在多年研究生教育管理实践的基础之上,通过研究借鉴国际先进科研机构和大学的成功经验,探索新的体制机制和管理模式,以计算机体系结构国家重点实验室为例,以建设国际一流的科研机构为目标,以科教融合、产学研结合为核心理念、提出人才培养的四项创新举措,并对两个案例分析展开论述,介绍了践行科教融合、贯穿产学研的创新人才培养实践。 展开更多
关键词 科教融合 产学研结合 创新人才培养
下载PDF
面向集成电路质量技术创新人才培养的探索与实践——计算机体系结构国家重点实验室的实践 被引量:3
2
作者 董慧 李晓维 《高教学刊》 2018年第1期18-20,共3页
文章通过以计算机体系结构国家重点实验室为例,介绍了面向计算机集成电路质量技术创新人才培养的课程体系建设及其特色,教材建设及教学成效,案例翔实。
关键词 集成电路 质量技术 创新人才培养
下载PDF
2018年中国高性能计算机发展现状分析 被引量:7
3
作者 袁国兴 张云泉 袁良 《计算机工程与科学》 CSCD 北大核心 2018年第12期2097-2102,共6页
本文根据2018年10月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域、部署机构等方面进行了讨论分析,同时对未来发展进行了展望。
关键词 高性能计算机 性能 排行榜 测评技术
下载PDF
2019年中国高性能计算机发展现状分析 被引量:7
4
作者 袁国兴 张云泉 袁良 《计算机工程与科学》 CSCD 北大核心 2019年第12期2095-2100,共6页
根据2019年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域、部署机构等方面进行了讨论分析,同时对未来发展进行了展望。
关键词 高性能计算机 性能 排行榜 测评技术
下载PDF
2021年中国高性能计算机发展现状分析 被引量:4
5
作者 袁国兴 张云泉 袁良 《计算机工程与科学》 CSCD 北大核心 2021年第12期2091-2097,共7页
根据2021年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域和部署机构等方面进行了讨论分析,同时对未来发展进行了展望。
关键词 高性能计算机 性能 排行榜 测评技术
下载PDF
2020年中国高性能计算机发展现状分析 被引量:4
6
作者 袁国兴 张云泉 袁良 《计算机工程与科学》 CSCD 北大核心 2020年第12期2103-2108,共6页
根据2020年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域、部署机构等方面进行了讨论分析,同时对未来发展进行了展望。
关键词 高性能计算机 性能 排行榜 测评技术
下载PDF
2018年中国高性能计算机发展现状分析与展望 被引量:13
7
作者 张云泉 《计算机科学》 CSCD 北大核心 2019年第1期1-5,共5页
根据2018年11月发布的中国高性能计算机TOP100排行榜的数据,文中从总体性能、制造商、行业领域等方面对国内高性能计算机的发展现状进行了深入分析。中国TOP100的平均Linpack性能继续保持高于国际TOP500平均Linpack性能的局面,且TOP100... 根据2018年11月发布的中国高性能计算机TOP100排行榜的数据,文中从总体性能、制造商、行业领域等方面对国内高性能计算机的发展现状进行了深入分析。中国TOP100的平均Linpack性能继续保持高于国际TOP500平均Linpack性能的局面,且TOP100的入门性能门槛仍然超过TOP500。中国TOP100上的超级计算系统均是国产超算系统,曙光和联想并列为数量冠军,曙光、联想和浪潮三强争霸的局面继续保持和加强。在此基础上,根据十七届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析和预测。根据新的数据,笔者认为:峰值Exaflops的机器将在2019-2020年间出现;峰值10Exaflops的机器将在2022-2023年间出现;峰值100Exaflops的机器将在2024-2025年间出现。 展开更多
关键词 高性能计算机 TOP100 排行榜 性能 分析
下载PDF
2021年中国高性能计算机发展现状分析与展望 被引量:3
8
作者 张云泉 袁良 +1 位作者 袁国兴 李希代 《数据与计算发展前沿》 CSCD 2021年第6期98-107,共10页
【目的】本文根据2021年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP 500平均Linpack性能... 【目的】本文根据2021年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP 500平均Linpack性能高的局面,且TOP100的入门性能门槛仍然超过TOP 500。中国TOP100上的超级计算系统出现了新面孔,北龙超云公司的五台机器上榜。联想为系统数量冠军,联想、曙光和浪潮三强争霸的局面逐步演化为联想和浪潮的竞争。应用领域新增算力服务,充分反映当前发展趋势。【结论】本文根据二十届排行榜的性能数据,详细阐述了算力经济发展现状,并对未来中国大陆高性能计算机的发展趋势进行了分析预测。 展开更多
关键词 高性能计算机 TOP100 排行榜 性能 分析
下载PDF
2022年中国高性能计算机发展现状分析与展望 被引量:3
9
作者 张云泉 袁良 +1 位作者 袁国兴 李希代 《数据与计算发展前沿》 CSCD 2022年第6期3-12,共10页
【目的】本文根据2022年11月发布的中国高性能计算机TOP 100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP 100的入门性能门槛仍然超过TOP 500。中国TOP 100上的超级... 【目的】本文根据2022年11月发布的中国高性能计算机TOP 100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP 100的入门性能门槛仍然超过TOP 500。中国TOP 100上的超级计算系统冠军再次更新,其Linpack性能超过200 PFlops0联想为系统数量冠军,联想、曙光和浪潮三强争霸的局面逐步演化为联想和浪潮的竞争。算力服务这一应用领域的占比继续增长,充分反映当前算力经济发展趋势。【结论】本文根据二十一届排行榜的性能数据,详细阐述了算力经济发展现状,并对未来中国大陆高性能计算机的发展趋势进行了分析预测。 展开更多
关键词 高性能计算机 TOP100 排行榜 性能 分析
下载PDF
2019年中国高性能计算机发展现状分析与展望 被引量:13
10
作者 张云泉 袁良 +1 位作者 袁国兴 李希代 《数据与计算发展前沿》 2020年第1期18-26,共9页
【目的】本文根据2019年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP500平均Linpack性能... 【目的】本文根据2019年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP500平均Linpack性能高的局面,且TOP100的入门性能门槛仍然超过TOP500。中国TOP100上的超级计算系统依然全部都是国产超算系统,曙光和联想并列为数量冠军,曙光、联想和浪潮三强争霸的局面继续保持和加强。【结论】在此基础上,本文根据十八届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析预测。根据新的数据,我们认为:峰值Exaflops的机器将在2020年到2021年间出现;峰值10Exaflops的机器将在2022年到2023年间出现;峰值100Exaflops的机器将在2024年到2025年间出现。 展开更多
关键词 高性能计算机 TOP100 排行榜 性能 分析
下载PDF
2020年中国高性能计算机发展现状分析与展望 被引量:6
11
作者 张云泉 袁良 +1 位作者 袁国兴 李希代 《数据与计算发展前沿》 2020年第6期1-10,共10页
【目的】本文根据2020年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP500平均Linpack性能... 【目的】本文根据2020年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。【结果】中国TOP100的平均Linpack性能继续保持比国际TOP500平均Linpack性能高的局面,且TOP100的入门性能门槛仍然超过TOP500。中国TOP100上的超级计算系统出现了新面孔,Dell公司的一台机器上榜,打破了榜单连续两年全为国产超算系统的记录。联想为系统数量冠军,联想、曙光和浪潮三强争霸的局面继续保持。【结论】在此基础上,本文根据十九届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析预测。根据新的数据,我们认为:峰值Exaflops的机器将在2021年到2022年间出现。 展开更多
关键词 高性能计算机 TOP100 排行榜 性能 分析
下载PDF
中国高性能计算机发展现状分析与展望 被引量:5
12
作者 张云泉 《民主与科学》 2017年第4期26-27,共2页
Linpack测试结果是衡量高性能计算机的一个重要指标。自1993年起,国际上根据这个指标对世界范围内的计算机进行排行,一年两次,前500名进入排名(简称TOP500)。由此,这个排行榜越来越多地获得人们的重视,成为高性能计算机研制生产... Linpack测试结果是衡量高性能计算机的一个重要指标。自1993年起,国际上根据这个指标对世界范围内的计算机进行排行,一年两次,前500名进入排名(简称TOP500)。由此,这个排行榜越来越多地获得人们的重视,成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。 展开更多
关键词 高性能计算机 展望 现状 中国 世界范围 研制生产 市场发展 排行榜
下载PDF
一种结合轻量级注意力机制的人体姿态估计算法
13
作者 李文星 喻明毫 +2 位作者 王子牛 高建瓴 林宁 《计算机应用与软件》 北大核心 2024年第5期131-137,共7页
针对现有的人体姿态估计模型存在的模型参数量和计算量大、冗余度高、耗时长等问题,提出一种基于轻量级注意力机制的网络框架。使用轻量级网络MobilenetV3替代了原OpenPose的主干网络VGG-19;对OpenPose的二分支多阶段的卷积神经网络框... 针对现有的人体姿态估计模型存在的模型参数量和计算量大、冗余度高、耗时长等问题,提出一种基于轻量级注意力机制的网络框架。使用轻量级网络MobilenetV3替代了原OpenPose的主干网络VGG-19;对OpenPose的二分支多阶段的卷积神经网络框架进行压缩;引入空间和通道相结合的注意力机制模块CBAM对模型的速度和精度进行权衡。实验结果表明,该方法下的网络模型大小和浮点计算量分别为10.51 MB和22.65 GFlops,相对于原OpenPose减少了79.91%和83.35%;在COCO2017测试集下,能够在保持较高的检测精度和召回率的基础上显著提升检测速度。 展开更多
关键词 人体姿态估计 计算机视觉 OpenPose 轻量级网络注意力机制
下载PDF
计算机系统容错设计简述 被引量:1
14
作者 鄢贵海 李晓维 《集成技术》 2013年第6期82-88,共7页
高可靠计算机系统是是保证信息服务质量的基石。从第一台计算机ENIAC诞生起,可靠性就是计算机系统面临的主要挑战之一,容错设计是实现可靠性的有效途径,也是一项典型的跨计算机多个设计层次的系统科学。从底层的器件到顶层的应用程序,... 高可靠计算机系统是是保证信息服务质量的基石。从第一台计算机ENIAC诞生起,可靠性就是计算机系统面临的主要挑战之一,容错设计是实现可靠性的有效途径,也是一项典型的跨计算机多个设计层次的系统科学。从底层的器件到顶层的应用程序,都存在优化可靠性的设计空间,每个层次的设计面向特定的可靠性设计挑战。文章将遵循自底向上的逻辑层次简述这些经典的设计方法。 展开更多
关键词 计算机系统 可靠性 容错设计
下载PDF
计算与通信相结合的体系结构
15
作者 唐志敏 《集成技术》 2012年第1期89-92,共4页
本文从应用和技术两个方面,分析了通信与计算相结合的计算机体系结构的研究与开发现状,以及云、网、端方面的新兴应用对处理器结构的需求,提出了适合通信应用的众核处理器研究思路。
关键词 相结合 体系结构 可编程处理器 通信网络 计算机应用 通信系统 处理器阵列 研究思路 计算技术 服务器
下载PDF
一种面向科学计算的数据流优化方法 被引量:9
16
作者 申小伟 叶笑春 +7 位作者 王达 张浩 王飞 谭旭 张志敏 范东睿 唐志敏 孙凝晖 《计算机学报》 EI CSCD 北大核心 2017年第9期2181-2196,共16页
传统数据流结构通过多上下文来隐藏指令等待源操作数的延迟,然而这种隐藏方式只能部分提高数据流处理器执行单元的利用率.在面向例如Stencil、FFT和矩阵乘法等典型科学应用时,传统数据流结构的执行单元利用率仍然较低.科学计算中的核心... 传统数据流结构通过多上下文来隐藏指令等待源操作数的延迟,然而这种隐藏方式只能部分提高数据流处理器执行单元的利用率.在面向例如Stencil、FFT和矩阵乘法等典型科学应用时,传统数据流结构的执行单元利用率仍然较低.科学计算中的核心程序一般是对不同数据进行相同的操作,而且这些操作可以并行执行,数据之间没有直接依赖关系.传统数据流结构是面向通用计算的,通常采用循环来实现对不同数据的相同操作.在这些循环中,迭代是按照顺序依次执行的,这导致了传统数据流结构没有利用科学计算的并行性来提高性能.所以传统数据流结构在处理这些规则的科学应用时没有协调好数据流计算模式和科学计算特征,而数据流计算是非常适合科学计算这种类型的规则计算.基于科学计算的这些特征,该文提出了一种面向科学计算的数据流结构优化方法:循环流水优化方法.循环流水优化方法利用科学计算的分块和并行处理特征,对传统数据流结构中的上下文控制逻辑进行了改进,将科学计算中的循环采用硬件自迭代的方式实现,并将上下文切换逻辑进行了流水化,使数据流结构中的上下文以流水线方式进入执行单元阵列,从而提高计算单元的利用率.面对这种循环流水优化后的数据流结构,传统数据流结构上的指令映射算法不再适用.通过分析循环流水优化后的结构特征,该文进一步提出了一种改进的指令映射算法:LBC(Load Balance Centric)指令映射算法.LBC算法按照深度优先顺序依次映射数据流图中的所有指令,对每条指令分别计算执行单元阵列中所有位置的代价,取最小代价的位置作为最佳映射位置.LBC算法以执行单元负载均衡为核心,同时将定点指令和浮点指令分开处理,保证执行单元上的定点部件和浮点部件的负载均衡.每当映射一条指令时,LBC算法采用相邻节点传输延迟与已经映射的该类型指令数量的乘积作为负载代价,来实现计算部件的负载均衡.另外,LBC算法将网络拥堵也作为指令映射的影响因素.LBC算法将节点与所有父节点的距离之和作为传输代价,使指令间传输消息的路径最短,从而减小片上网络消息传递的跳数.实验结果表明,在处理典型科学应用时,相比于传统数据流结构,循环流水的优化方法将数据流结构的性能平均提高了4.6%.相比于传统指令映射算法SPDI和SPS,在循环流水优化后的数据流结构上,LBC指令映射算法将性能分别平均提升了182.6%和158.1%. 展开更多
关键词 指令映射 数据流 循环流水 科学计算处理器 高性能计算
下载PDF
高性能计算多层次不连续非线性可扩展现象研究 被引量:1
17
作者 张云泉 袁良 +2 位作者 陈一峯 冯晓兵 张贺 《计算机学报》 EI CSCD 北大核心 2020年第6期973-989,共17页
高性能计算是计算科学的具体实践,极大地促进了各领域的科学进展,也对国家的经济建设起到了无法替代的基础性作用.从几十年发展的时间尺度和十万至百万核量级并行规模尺度研究大规模并行软件的研制发展历史来看,发现大规模并行应用软件... 高性能计算是计算科学的具体实践,极大地促进了各领域的科学进展,也对国家的经济建设起到了无法替代的基础性作用.从几十年发展的时间尺度和十万至百万核量级并行规模尺度研究大规模并行软件的研制发展历史来看,发现大规模并行应用软件的开发中物理模型、并行算法、并行软件实现以及底层硬件多个层次中存在的可扩展性的两种有趣现象,即不连续性和非线性现象.本文总结分析这一普遍存在现象,系统梳理计算机软硬件发展,特别是高性能计算发展中的可扩展问题,为未来并行计算领域发展提供方法论层面的借鉴和指导. 展开更多
关键词 高性能计算 超级计算 可扩展性 多层次 不连续 非线性
下载PDF
YOLO检测网络的FPGA加速计算模型的研究 被引量:3
18
作者 裴颂文 汪显荣 《小型微型计算机系统》 CSCD 北大核心 2022年第8期1681-1686,共6页
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态... FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态定点量化方法降低了数据存储和传输量.然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合等策略分别实现了基于Winograd和GEMM的快速卷积计算引擎,提高加速计算效率.实验结果表明,本文在PYNQ-Z1验证平台上获得的计算性能达到64.9 GOP/s,比基于典型滑动窗口卷积计算方法的性能提高了2.15倍. 展开更多
关键词 FPGA YOLO 快速卷积算法 并行计算 流水线
下载PDF
数据流计算研究进展与概述 被引量:1
19
作者 范志华 李文明 +1 位作者 叶笑春 范东睿 《数据与计算发展前沿》 CSCD 2021年第5期65-81,共17页
【目的】本文追溯数据流计算的起源,就数据流计算理论和系统的相关研究背景、关键技术展开介绍。【文献范围】本文整理上世纪60年代至今数据流计算相关的研究文献。【方法】从数据流的起源、软件系统、硬件架构研究进展三个方面介绍了... 【目的】本文追溯数据流计算的起源,就数据流计算理论和系统的相关研究背景、关键技术展开介绍。【文献范围】本文整理上世纪60年代至今数据流计算相关的研究文献。【方法】从数据流的起源、软件系统、硬件架构研究进展三个方面介绍了数据流计算的重要工作和关键技术。【结果】对数据流计算的发展趋势和挑战进行了分析与总结。【结论】本文将对未来数据流计算的研究提供参考,希望给该领域的研究人员带来一定的启发。 展开更多
关键词 数据流执行模型 数据流软件系统 数据流硬件架构
下载PDF
基于线程池的GPU任务并行计算模式研究 被引量:21
20
作者 李涛 董前琨 +3 位作者 张帅 孔令晏 康宏 杨愚鲁 《计算机学报》 EI CSCD 北大核心 2018年第10期2175-2192,共18页
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU... GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU上的计算资源,难以有效地处理不规则的并行应用问题.为从体系结构角度探索GPU硬件支持的页锁定内存和统一虚拟地址空间等特征,该文提出了CPU辅助任务调度管理下的基于线程池技术的GPU任务并行计算模型CAGTP,实现了CPU-GPU异构计算系统上的共享内存式程序设计.提出并设计了CPU端的任务队列、计算线程块级任务调度器、任务槽和GPU端的任务复用kernel函数等机制,实现了CPU与GPU间的高效细粒度任务交互,避免了原生CUDA程序中多次启停kernel函数的开销,有效地支持了GPU上的细粒度不规则并行任务计算,而且利用模型API接口函数能够降低CPU-GPU异构计算系统的编程难度.实验结果表明,CAGTP模型中任务调度的开销是kernel函数调用的5%,有效提升了通用矩阵乘、乔列斯基分解和K均值、T近邻等典型线性代数和机器学习算法的计算性能;CAGTP模型易于扩展使用多块GPU,且在性能差异较大的多个GPU之间达到负载均衡,能够高效求解混合任务和具有不规则并行性的应用问题. 展开更多
关键词 异构计算系统 统一计算设备架构 线程池 任务并行 任务复用函数
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部