期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
高性能计算技术及标准现状分析 被引量:1
1
作者 陆平静 熊泽宇 赖明澈 《计算机科学》 CSCD 北大核心 2023年第11期1-7,共7页
高性能计算是科技创新体系的重要组成,是知识创新和技术创新的重要能力支撑,是新时期下与理论、实验并重的三大科技创新手段之一。在过去的三十年间,高性能计算取得了以突飞猛进的进展,高性能计算已经进入E级计算时代,我国在高性能计算... 高性能计算是科技创新体系的重要组成,是知识创新和技术创新的重要能力支撑,是新时期下与理论、实验并重的三大科技创新手段之一。在过去的三十年间,高性能计算取得了以突飞猛进的进展,高性能计算已经进入E级计算时代,我国在高性能计算领域也取得了跨越式的发展,取得了天河、神威、曙光为代表的一系列成果,高性能系统研制水平跻身国际一流行列。随着摩尔定律接近极限,高性能计算技术的性能提升之路面临巨大挑战,在后摩尔时代,将依赖算法、软件和硬件架构去提升高性能计算机系统的终极性能。另一方面,与高性能计算机技术飞速发展相比,高性能计算标准的发展还存在很多不足。文中首先分析了当前国内外高性能计算机技术的发展现状及趋势,然后剖析了当前国内外高性能计算标准的现状及趋势,最后给出了当前发展中国高性能计算机标准的必要性和重要性。 展开更多
关键词 高性能计算 E级计算 计算机体系结构 标准 集群 大规模并行处理机 后摩尔时代
下载PDF
众核处理器系统核资源动态分组的自适应调度算法 被引量:14
2
作者 曹仰杰 钱德沛 +1 位作者 伍卫国 董小社 《软件学报》 EI CSCD 北大核心 2012年第2期240-252,共13页
针对众核处理器系统的核资源优化使用问题,提出了一种支持核资源动态分组的自适应调度算法CASM(core-partitioned adaptive scheduling for many-core systems).该算法通过对任务簇的拆分与合并,动态构建可弹性分区的核逻辑组,实现核资... 针对众核处理器系统的核资源优化使用问题,提出了一种支持核资源动态分组的自适应调度算法CASM(core-partitioned adaptive scheduling for many-core systems).该算法通过对任务簇的拆分与合并,动态构建可弹性分区的核逻辑组,实现核资源的隔离优化访问.为了平衡核资源利用率及任务调度效率,CASM算法针对任务簇间和簇内的不同特点,分别采用公平性较好的均衡调度算法和资源利用率较高的自适应调度算法.在线竞争理论分析表明,CASM算法的任务执行时间在线竞争比为常数2,其性能可扩展性较好.实验结果表明,与WS(work-stealing),AGDEQ(adaptive greedy dynamic equi-partitioning)和EQUI?EQUI算法相比,CASM算法使任务集运行时间分别减少了近46%,32%和15%.在相同能耗情况下,CASM算法大幅度地提升了系统吞吐量. 展开更多
关键词 众核处理器 分组调度 自适应调度 竞争分析 高效能计算
下载PDF
一种基于多处理器任务复制的分簇调度算法 被引量:5
3
作者 徐成 赵林祥 杨志邦 《计算机应用研究》 CSCD 北大核心 2012年第8期2931-2934,共4页
任务调度的优劣是决定并行分布式计算机系统性能好坏的重要因素之一。为优化任务调度,基于一些典型算法(如LG、PPA算法等),提出了一种新的任务调度算法。该算法一方面复制满足条件的前驱任务来缩短调度长度;另一方面合理地复制其他前驱... 任务调度的优劣是决定并行分布式计算机系统性能好坏的重要因素之一。为优化任务调度,基于一些典型算法(如LG、PPA算法等),提出了一种新的任务调度算法。该算法一方面复制满足条件的前驱任务来缩短调度长度;另一方面合理地复制其他前驱任务和合并冗余簇来减少所需处理器的数目。实验表明,该算法在调度长度和所需处理器的数目上优于以上典型算法,并具有更小的时间复杂度,对并行计算机系统性能的提升具有一定的意义。 展开更多
关键词 任务复制 任务调度 多处理器 分簇复制
下载PDF
一种同构机群系统中的处理机分配算法 被引量:7
4
作者 温钰洪 王鼎兴 沈美明 《软件学报》 EI CSCD 北大核心 1997年第3期161-169,共9页
机群系统的分布式计算环境为并行处理技术带来了新的研究与应用问题,正成为并行计算的热点问题.如何合理、有效地将并行任务划分到机群系统的结点上,将直接影响系统的执行性能.本文分析影响系统执行效率的执行开销因素。
关键词 处理机分配 工作站 机群系统 算法
下载PDF
基于图形处理器的数据流快速聚类 被引量:24
5
作者 曹锋 周傲英 《软件学报》 EI CSCD 北大核心 2007年第2期291-302,共12页
在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类以及数据流簇进化... 在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类以及数据流簇进化分析方法.这些方法的共同特点是充分利用了GPU强大的处理能力和流水线特性.与以往具有独立框架的数据流聚类算法不同,这些基于GPU的聚类算法具有同一框架和多种聚类分析功能,为数据流聚类分析提供了统一的平台.从分析可知,数据流聚类分析的核心操作实际上就是距离计算和比较.基于这一认识,利用GPU的子素向量处理功能进行距离计算.性能验证实验是在配有Pentium IV3.4G CPU和NVIDIA GeForce 6800 GT显卡的PC上进行的.综合分析和实验结果表明,基于GPU的数据流聚类算法比传统的CPU算法平均快7倍,从而为高速数据流应用提供了良好的支持. 展开更多
关键词 数据流 聚类 图形处理器 进化 窗口
下载PDF
基于SMP集群系统的并行编程模式研究与分析 被引量:5
6
作者 宋伟 宋玉 《计算机技术与发展》 2007年第2期164-167,171,共5页
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点... 并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 展开更多
关键词 并行计算 对称多处理器 集群 消息传递模型 共享存储模型 MPI OPENMP 混合编程
下载PDF
一种多核环境下的WebGIS模型优化策略 被引量:5
7
作者 郭明强 黄颖 谢忠 《计算机工程》 CAS CSCD 2013年第8期15-19,共5页
为提高网络地理信息系统(WebGIS)的并发访问性能,提出一种多核服务器集群环境下的WebGIS模型优化策略。设计集群中各服务节点和服务节点内部两级并行处理机制,利用任务响应比计算方法、请求队列缓冲机制和多线程调度方法提高系统并发处... 为提高网络地理信息系统(WebGIS)的并发访问性能,提出一种多核服务器集群环境下的WebGIS模型优化策略。设计集群中各服务节点和服务节点内部两级并行处理机制,利用任务响应比计算方法、请求队列缓冲机制和多线程调度方法提高系统并发处理性能。实验结果表明,优化后的模型能在大用户量并发访问下充分利用服务器节点的多核计算优势,CPU核心越多,并发处理能力提升越高。 展开更多
关键词 网络地理信息系统 集群 多核处理器 多线程 负载均衡 并发
下载PDF
异构环境下MPI通信技术研究 被引量:3
8
作者 蒋艳凰 赵强利 卢宇彤 《小型微型计算机系统》 CSCD 北大核心 2009年第9期1724-1729,共6页
异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进... 异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进行了详细阐述,分析它们对MPI通信的影响;然后基于Open MPI系统,对这两类异构问题的具体实现进行介绍,测试并分析它们对通信性能的影响;最后展望了这一研究方向的技术难点与发展趋势. 展开更多
关键词 高性能计算 MPI 集群 网络异构 处理器异构
下载PDF
一种针对处理器集群的源代码级调试系统实现方案 被引量:1
9
作者 林广栋 朱艳 +1 位作者 黄光红 耿锐 《中国集成电路》 2018年第5期43-50,54,共9页
本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层... 本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层硬件的差异。该调试系统使用命令行接口作为用户接口,通过网关来管理不同的底层硬件。该调试系统支持集成到可视化开发环境中,以图形化的方式进行调试。 展开更多
关键词 处理器集群 源代码级调试 魂芯 MCCD
下载PDF
一种运算簇间互连通信单元的设计
10
作者 李斌 谢憬 毛志刚 《计算机工程》 CAS CSCD 2013年第9期153-156,共4页
在高性能并行处理器设计中,权衡通信效率与硬件设计开销是一个关键的问题。基于此,在基于簇状处理单元的线性阵列处理器架构前提下,提出一种基于多运算簇处理器结构的运算簇间互连通信设计方案,包括通信单元结构和典型数字信号处理数据... 在高性能并行处理器设计中,权衡通信效率与硬件设计开销是一个关键的问题。基于此,在基于簇状处理单元的线性阵列处理器架构前提下,提出一种基于多运算簇处理器结构的运算簇间互连通信设计方案,包括通信单元结构和典型数字信号处理数据传输的应用案例分析。实验结果表明,与传统线性阵列处理器结构相比,该方案可使互连通信单元的相应性能提升30%以上。 展开更多
关键词 互连通信 并行运算 多集群处理器结构 运算簇 线性阵列 通信块
下载PDF
基于共享Cache多核处理器的Radix聚集连接优化
11
作者 邓亚丹 景宁 +1 位作者 熊伟 吴秋云 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第4期68-73,共6页
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并... 基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并根据聚集连接执行时的代价模型,优化了聚集连接执行框架和各种线程参数。在实验中,基于内存数据库EaseDB实现了本文提出了算法,实验结果表明,聚集连接性能得到较大提高。 展开更多
关键词 多核处理器 radix—join 聚集连接
下载PDF
分簇处理器中分簇投机的L0 Cache设计
12
作者 杨兵 毛志刚 +1 位作者 陈晓 尹捷明 《微电子学与计算机》 CSCD 北大核心 2010年第7期15-20,共6页
处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内... 处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内简单快速的L0 Cache,较好地隐藏了下级Cache的访问延迟.仿真结果显示在8簇的分簇处理器中,采用4kB,2路组相连的分簇L0 Cache后处理器性能平均提升5.6%,在部分测试程序中达到20%以上. 展开更多
关键词 分簇处理器 CACHE结构 投机访问
下载PDF
分布式Kahn处理网络的一种集群调度算法
13
作者 钱正平 齐德昱 曾鸣 《计算机应用研究》 CSCD 北大核心 2009年第12期4463-4466,4470,共5页
研究并提出一种采用分布式Kahn处理网络表达的并行程序在多处理器集群环境下的任务———处理器动态分配算法。由于Kahn处理网络的不可判定性,静态作业调度算法不能适用,而忽略其显式数据依赖关系的动态负载均衡策略存在很大的随机性,... 研究并提出一种采用分布式Kahn处理网络表达的并行程序在多处理器集群环境下的任务———处理器动态分配算法。由于Kahn处理网络的不可判定性,静态作业调度算法不能适用,而忽略其显式数据依赖关系的动态负载均衡策略存在很大的随机性,往往带来不必要的进程迁移。基于运行时动态生成的离散事件序列,预测Kahn处理网络在不同分配方案下的执行效率(处理器资源利用率),迭代寻求最优动态分配方案,仿真效果良好。 展开更多
关键词 分布式Kahn处理网络 处理器分配 集群调度 负载均衡 离散事件
下载PDF
64位流处理器中运算群的设计与验证
14
作者 隋兵才 罗礼 毛二坤 《计算机与现代化》 2007年第11期1-3,6,共4页
流处理器作为新型高性能处理器,能够高效地处理32位流程序。但是对于64位流处理器的设计,由于VLSI技术的限制,存在着很多挑战。运算群作为流处理器的核心运算部件,在整个流处理器中起着重要作用。运算群部件设计的好坏直接关系到流处理... 流处理器作为新型高性能处理器,能够高效地处理32位流程序。但是对于64位流处理器的设计,由于VLSI技术的限制,存在着很多挑战。运算群作为流处理器的核心运算部件,在整个流处理器中起着重要作用。运算群部件设计的好坏直接关系到流处理器的性能。本文以典型的流处理器为模型,说明了64位流处理器中运算群的设计技术,并对其功能进行了模拟验证,达到了预期效果。 展开更多
关键词 流处理器 运算群 流体系结构
下载PDF
调度PVM任务 被引量:7
15
作者 鞠九滨 王勇 《计算机学报》 EI CSCD 北大核心 1997年第5期470-474,共5页
本文介绍一个自行设计和实现的PVM任务调度系统,可进行空闲机选择,对任务池(Pooloftasks)和动态生成的子任务进行调度,提高处理机资源利用率,改进作业响应时间和简化用户编程过程.
关键词 工作站 并行编程环境 任务调度 PVM 计算机网络
下载PDF
基于SMP集群的多层次并行编程模型与并行优化技术 被引量:25
16
作者 单莹 吴建平 王正华 《计算机应用研究》 CSCD 北大核心 2006年第10期254-256,260,共4页
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行... 详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。 展开更多
关键词 SMP集群 MPI/OpenMP 并行 优化 单处理器性能优化
下载PDF
基于机群并行通信处理器HCP的广播通信算法
17
作者 李金宝 李建中 《黑龙江大学自然科学学报》 CAS 1999年第3期44-47,共4页
提出了一种基于作者自行研制的通信处理器HCP的互连网络的广播通信算法。互连网络具有Hypercube拓扑结构。该算法使用通信处理器HCP实现网络上一个HCP向所有其他HCP广播数据的操作.该算法已经用于作者自行设计的微型机计算机群并行计... 提出了一种基于作者自行研制的通信处理器HCP的互连网络的广播通信算法。互连网络具有Hypercube拓扑结构。该算法使用通信处理器HCP实现网络上一个HCP向所有其他HCP广播数据的操作.该算法已经用于作者自行设计的微型机计算机群并行计算环境和并行数据库管理系统,取得了良好效果。 展开更多
关键词 计算机机群 并行计算环境 通信处理器 HCP
下载PDF
基于机群并行通信处理器HCP的选播通信操作算法
18
作者 李金宝 李秀华 李建中 《黑龙江大学自然科学学报》 CAS 2000年第4期36-40,共5页
在我们自行研制的并行通信处理器HPC基础上,给出了一种基于Hypercube互连网络环境下的通信处理器HCP的选播通信算法,该算法可实现网络上的一个HCP向其他任意多个HCP发送相同的Frame的操作。
关键词 计算机机群 并行计算环境 计算机机群通信处理器 Hypercube互连网络 HCP选播通信
下载PDF
通用数据库集群服务器系统 被引量:1
19
作者 陈付龙 赵诚 +2 位作者 纪书国 李明东 汪迅宝 《计算机工程与科学》 CSCD 2005年第12期45-46,67,共3页
数据库集群服务器系统有许多不同的构造方法,文中在介绍了数据集群服务器概念和基本构造方法的基础之上,设计了一种可以提供通用编程接口的体系结构,并分析了其工作原理和实现技术,同时探讨了需要解决的数据存储、数据运算和事务管理问题。
关键词 数据库集群服务器系统 分布式数据接口 默认事物处理器
下载PDF
基于计算机机群并行通信处理器HCP的点对点通信算法
20
作者 李金宝 李建中 《黑龙江大学自然科学学报》 CAS 1999年第4期60-64,共5页
提出了一种基于自行研制的通信处理器HCP的互连网络的点对点通信算法。互连网络具有Hyperchbe拓扑结构。该算法使用通信处理器HCP实现了网络上任意两台HCP之间的高速点对点并行通信,已经用于作者自行设计的微型机计... 提出了一种基于自行研制的通信处理器HCP的互连网络的点对点通信算法。互连网络具有Hyperchbe拓扑结构。该算法使用通信处理器HCP实现了网络上任意两台HCP之间的高速点对点并行通信,已经用于作者自行设计的微型机计算机机群并行计算环境和并行数据库管理系统,取得了良好效果。 展开更多
关键词 计算机机群 并行计算系统 点对点通信算法 HCP
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部