期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
无资源管理自协调网格计算模型的研究 被引量:2
1
作者 杨愚鲁 何凯 +1 位作者 于洋 学刚 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期87-89,共3页
提出了一个无资源管理自协调网格计算模型,描述了该模型的体系结构、信息管理和递归资源调度机制。在该模型中,不存在任何管理节点,所有节点功能相同,采用改进的eager scheduling来屏蔽环境的动态性。对该模型的性能进行了初步分析,仿... 提出了一个无资源管理自协调网格计算模型,描述了该模型的体系结构、信息管理和递归资源调度机制。在该模型中,不存在任何管理节点,所有节点功能相同,采用改进的eager scheduling来屏蔽环境的动态性。对该模型的性能进行了初步分析,仿真结果表明,该模型能充分利用Internet上空闲的计算资源,用以解决大规模分布式应用问题。 展开更多
关键词 网格计算 资源管理 自协调 递归调度
下载PDF
基于遗传算法的可重构系统软硬件划分 被引量:9
2
作者 李涛 杨愚鲁 +1 位作者 马平 柴欣 《计算机工程与应用》 CSCD 北大核心 2007年第26期56-58,共3页
在考虑动态部分重构及重构延时等特征的基础上,采用遗传算法及其与爬山算法的融合实现可重构系统软硬件任务的划分,并采用动态优先级调度算法进行划分结果的评价。实验表明,在可重构系统的资源约束等条件下,算法能够有效地实现应用任务... 在考虑动态部分重构及重构延时等特征的基础上,采用遗传算法及其与爬山算法的融合实现可重构系统软硬件任务的划分,并采用动态优先级调度算法进行划分结果的评价。实验表明,在可重构系统的资源约束等条件下,算法能够有效地实现应用任务图到可重构系统的时空映射。 展开更多
关键词 可重构硬件 动态部分重构 软硬件划分 可重构系统
下载PDF
动态部分重配置及其FPGA实现 被引量:9
3
作者 李涛 刘培峰 杨愚鲁 《计算机工程》 EI CAS CSCD 北大核心 2006年第14期224-226,共3页
动态部分重配置充分利用了FPGA芯片提供的可重配置功能,提高了FPGA芯片的利用率,减小了FPGA芯片的配置时间,有效地提高了系统的整体性能。该文介绍了动态部分重配置的两种实现方法,并在Spartan-ⅡFPGA上进行了验证。
关键词 FPGA Spartan—Ⅱ 可重配置计算 动态部分重配置
下载PDF
可重构资源管理及硬件任务布局的算法研究 被引量:12
4
作者 李涛 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2008年第2期375-382,共8页
可重构系统具有微处理器的灵活性和接近于ASIC的计算速度,可重构硬件的动态部分重构能力能够实现计算和重构操作的重叠,使系统能够动态地改变运行任务,可重构资源管理和硬件任务布局方法是提高可重构系统性能的关键.提出了基于任务上边... 可重构系统具有微处理器的灵活性和接近于ASIC的计算速度,可重构硬件的动态部分重构能力能够实现计算和重构操作的重叠,使系统能够动态地改变运行任务,可重构资源管理和硬件任务布局方法是提高可重构系统性能的关键.提出了基于任务上边界计算最大空闲矩形的算法(TT-KAMER),能够有效地管理系统的空闲可重构资源;在此基础上使用FF和启发式BF算法进行硬件任务的布局.实验表明,算法能够有效地实现在线资源分配与任务布局,获得较高的资源利用率. 展开更多
关键词 可重构系统 可重构硬件 动态部分重构 TT—KAMER 布局
下载PDF
集群高速互连网络分析 被引量:2
5
作者 李涛 陈宇明 +2 位作者 赵精龙 倪长顺 杨愚鲁 《计算机科学》 CSCD 北大核心 2005年第10期20-22,共3页
集群是当今高性能计算领域的重要发展方向,高速互连网络是构建高性能集群系统的关键技术,它是影响集群系统整体性能的关键因素。本文对几种用于集群互连的高带宽、低延迟高速互连网络进行了分析与比较,最后指出了高速互连网络的未来发展。
关键词 集群 高性能计算 互连网络 高速互连 集群系统 网络分析 高性能计算 互连网络 整体性能 高带宽 低延迟
下载PDF
细粒度任务并行GPU通用矩阵乘 被引量:5
6
作者 张帅 李涛 +2 位作者 王艺峰 焦晓帆 杨愚鲁 《计算机工程与科学》 CSCD 北大核心 2015年第5期847-856,共10页
稠密线性代数运算对模式识别和生物信息等许多实际应用至关重要,而通用矩阵乘(GEMM)处于稠密线性代数运算的基础地位。在cuBLAS与MAGMA中,GEMM被实现为若干kernel函数,对大型GEMM计算能够达到很高的性能。然而,现有实现对批量的小型GEM... 稠密线性代数运算对模式识别和生物信息等许多实际应用至关重要,而通用矩阵乘(GEMM)处于稠密线性代数运算的基础地位。在cuBLAS与MAGMA中,GEMM被实现为若干kernel函数,对大型GEMM计算能够达到很高的性能。然而,现有实现对批量的小型GEMM计算性能发挥则较为有限。而且,现有实现也不能在多个具有不同性能的GPU之间自动扩展并达到负载均衡。提出任务并行式GEMM(TPGEMM),用细粒度任务并行的方式实现批量矩阵乘和多GPU矩阵乘。一个或多个GEMM的计算能够被拆分为多个任务,动态地调度到一个或多个GPU上。TPGEMM避免了为批量矩阵乘启动多个kernel函数的开销,对批量矩阵乘能够取得显著高于cuBLAS与MAGMA的性能。在低开销细粒度任务调度的基础上,TPGEMM支持单个GEMM计算在多个GPU间的自动并行,在一台具有四个不同性能GPU的工作站上取得了接近100%的扩展效率。 展开更多
关键词 通用矩阵乘 持久化kernel 任务并行 负载均衡
下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
7
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 CPU-GPU异构计算 计算统一设备架构 OpenMP
下载PDF
基于混合编程模型的支持向量机训练并行化 被引量:2
8
作者 李涛 刘学臣 +2 位作者 张帅 王恺 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1098-1108,共11页
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储... 支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力. 展开更多
关键词 支持向量机训练 计算统一设备架构 消息传递接口 页锁定内存 CPU-GPU异构系统
下载PDF
给定平均连接度的无标度网络演化模型 被引量:4
9
作者 何凯 学刚 杨愚鲁 《计算机工程》 EI CAS CSCD 北大核心 2006年第17期181-183,共3页
由于Internet、www等网络的复杂性,需要构造符合真实网络特性的仿真网络来对其进行研究。在BA模型的基础上,提出了一种给定平均连接度无标度网络]化模型,网络生长时,按照概率pk添加k个连接。通过速率方程证明了该网络是节点度分布符合... 由于Internet、www等网络的复杂性,需要构造符合真实网络特性的仿真网络来对其进行研究。在BA模型的基础上,提出了一种给定平均连接度无标度网络]化模型,网络生长时,按照概率pk添加k个连接。通过速率方程证明了该网络是节点度分布符合幂律分布的无标度网络,其幂指数为-3,且平均连接度为给定值。仿真结果和理论计算值很好地吻合。 展开更多
关键词 无标度 平均连接度 复杂网络 幂律
下载PDF
一种基于竞标机制的通用网格资源管理模型 被引量:5
10
作者 赵宏 杨愚鲁 《计算机工程》 CAS CSCD 北大核心 2006年第12期104-106,共3页
目前大多数的网格资源管理都有表示网格资源的全局信息中心。该文提出了一种网格资源管理模型,在该模型中不存在全局的资源信息中心,网格资源管理采用节点的完全自治管理,网格资源的发现和匹配工作是通过在网格中采用竞标机制实现的,即... 目前大多数的网格资源管理都有表示网格资源的全局信息中心。该文提出了一种网格资源管理模型,在该模型中不存在全局的资源信息中心,网格资源管理采用节点的完全自治管理,网格资源的发现和匹配工作是通过在网格中采用竞标机制实现的,即资源提供者不仅管理自己的资源而且通过竞标参与网格资源的匹配和任务调度工作。 展开更多
关键词 网格资源管理模型 竞标机制 资源发现 资源匹配 任务调度
下载PDF
集群高效通信机制分析 被引量:2
11
作者 李涛 王华 +2 位作者 刘培峰 刘光武 杨愚鲁 《计算机应用研究》 CSCD 北大核心 2005年第10期257-260,共4页
集群是当今高性能计算领域的重要发展方向,随着高速互联网络硬件的发展,低效的通信方式成为制约集群整体性能的关键因素。高效的通信机制能够更好地利用互联网络硬件为高性能计算提供更高性能的通信支持,通信性能通常都远高于传统的IP... 集群是当今高性能计算领域的重要发展方向,随着高速互联网络硬件的发展,低效的通信方式成为制约集群整体性能的关键因素。高效的通信机制能够更好地利用互联网络硬件为高性能计算提供更高性能的通信支持,通信性能通常都远高于传统的IP协议。 展开更多
关键词 集群 高性能计算 通信机制
下载PDF
基于最大空闲矩形的可重构资源管理方法 被引量:4
12
作者 李涛 杨愚鲁 《计算机工程》 CAS CSCD 北大核心 2008年第3期46-48,共3页
可重构硬件如FPGA的规模和集成度的提高使其承载的硬件任务越来越多,FPGA的动态部分重构能力使任务可在系统运行过程中动态地添加或者删除而不影响其他任务的运行,对可重构硬件的资源管理非常重要。该文提出一种基于任务上边界计算最大... 可重构硬件如FPGA的规模和集成度的提高使其承载的硬件任务越来越多,FPGA的动态部分重构能力使任务可在系统运行过程中动态地添加或者删除而不影响其他任务的运行,对可重构硬件的资源管理非常重要。该文提出一种基于任务上边界计算最大空闲矩形的算法,使用这些最大空闲矩形能够有效地管理可重构资源,便于更好地利用具有动态部分重构能力的可重构硬件。 展开更多
关键词 可重构硬件 动态部分重构 最大空闲矩形
下载PDF
基于PRDT的16节点NoC路由算法 被引量:2
13
作者 段新明 杨愚鲁 《计算机工程》 CAS CSCD 北大核心 2007年第9期12-14,18,共4页
网络结构对于片上网络系统的性能和功耗发挥着重要作用,PRDT(2,1)有着较低的网络直径和平均距离、常数的节点度以及良好的可扩展性,这些特点使其非常适于NoC。为了提高小规模PRDT的路由性能,该文提出了一种binary路由算法,当网络规模不... 网络结构对于片上网络系统的性能和功耗发挥着重要作用,PRDT(2,1)有着较低的网络直径和平均距离、常数的节点度以及良好的可扩展性,这些特点使其非常适于NoC。为了提高小规模PRDT的路由性能,该文提出了一种binary路由算法,当网络规模不大于16时,该算法无须使用虚拟通道即可实现无死锁路由,通过增加少量虚拟通道,可改进为完全自适应路由算法。对所提出的路由算法与原有的向量路由算法进行仿真比较,结果显示binary算法在硬件成本较低的同时,性能更为优异,完全可以应用于基于PRDT的小规模NoC网络。 展开更多
关键词 片上网络 PRDT网络 路由算法 无死锁
下载PDF
网格PVM的编程环境研究与设计 被引量:1
14
作者 叶志霞 裴巍 +2 位作者 郝志敏 张景春 杨愚鲁 《计算机应用》 CSCD 北大核心 2005年第B12期451-453,共3页
网格可用于解决大规模计算问题,但是在网格上进行程序设计是一件非常困难的工作。实现网格化的并行消息传递库是目前解决网格编程困难的主要手段。文中将PVM与G lobus结合,充分利用G lobus Toolkit提供的服务,为在网格上执行PVM应用提... 网格可用于解决大规模计算问题,但是在网格上进行程序设计是一件非常困难的工作。实现网格化的并行消息传递库是目前解决网格编程困难的主要手段。文中将PVM与G lobus结合,充分利用G lobus Toolkit提供的服务,为在网格上执行PVM应用提供一个框架,对其中的安全性、资源管理、信息管理和远程文件传输进行了详细设计,使得用PVM开发的应用不做任何修改就能运行在网格环境上。 展开更多
关键词 网格 消息传递 GLOBUS PVM
下载PDF
Mesh网络耐故障虫孔路由 被引量:3
15
作者 段新明 杨愚鲁 《计算机科学》 CSCD 北大核心 2007年第11期29-31,共3页
耐故障是互连网络设计中的一个重要问题。本文提出了一种新的耐故障路由算法,并将其应用于使用虫孔交换技术的Mesh网络。由于使用了较低的路由限制,这一算法具有很强的自适应性,可以在各种不同故障域的Mesh网络中保持路由的连通性和无... 耐故障是互连网络设计中的一个重要问题。本文提出了一种新的耐故障路由算法,并将其应用于使用虫孔交换技术的Mesh网络。由于使用了较低的路由限制,这一算法具有很强的自适应性,可以在各种不同故障域的Mesh网络中保持路由的连通性和无死锁性;由于使用了最小限度的虚拟通道,这一算法所需的缓冲器资源很少,非常适宜构建低成本的耐故障互连网络;由于根据本地故障信息进行绕行故障节点的决策,这一算法的路由决策速度较快并且易于在互连网络中实现。最后网络仿真试验显示,这一算法具有良好的平滑降级使用的性能。 展开更多
关键词 MESH网络 路由算法 耐故障 无死锁
下载PDF
一种低管理开销的网格计算模型 被引量:1
16
作者 何凯 学刚 +1 位作者 周庶恺 杨愚鲁 《计算机工程与应用》 CSCD 北大核心 2008年第8期123-127,共5页
针对利用Internet上大量空闲计算资源来解决大规模分布式计算问题这一需求,提出了一种低管理开销的网格计算模型。在该模型中,不存在任何节点来管理动态变化的资源,而与之相适应的信息机制、任务调度算法和有限任务复制算法在没有管理... 针对利用Internet上大量空闲计算资源来解决大规模分布式计算问题这一需求,提出了一种低管理开销的网格计算模型。在该模型中,不存在任何节点来管理动态变化的资源,而与之相适应的信息机制、任务调度算法和有限任务复制算法在没有管理节点存在的情况下,以较低的开销使系统在动态的环境中达到自然的协调,实现大规模的分布计算。开发的仿真软件验证了该模型的有效性,并对相关结果进行了初步的性能分析;仿真结果表明,该模型在动态的环境中负载分布合理,资源的计算能力能得到充分利用,为高效地完成参数扫描、蒙特卡罗模拟等大规模易并行计算提供了一个可行的方法。 展开更多
关键词 计算网格 低管理开销 任务调度 信息机制
下载PDF
分布式网格系统的任务调度算法DE Scheduling 被引量:1
17
作者 于洋 杨愚鲁 +1 位作者 学刚 贺铭 《计算机工程》 CAS CSCD 北大核心 2008年第14期75-77,80,共4页
目前研究的动态任务调度算法都基于集中式或部分分布式网格系统,系统中心节点(组)进行资源管理。该文提出一种面向无资源管理的完全分布式网格系统动态任务调度算法DE Scheduling。该算法使用任务冗余调度算法屏蔽解决系统的动态性问... 目前研究的动态任务调度算法都基于集中式或部分分布式网格系统,系统中心节点(组)进行资源管理。该文提出一种面向无资源管理的完全分布式网格系统动态任务调度算法DE Scheduling。该算法使用任务冗余调度算法屏蔽解决系统的动态性问题,通过动态调节冗余量减少无效计算和保证系统负载均衡。使用给定平均连接度的无标度网络演化模型构造具有1000个节点的Internet网络模型仿真任务处理过程。仿真结果表明,任务数为10000-100000时该系统冗余调度次数均为2次,冗余计算量占总计算量的比例不超过0.35%,且随着任务数增加而递减。 展开更多
关键词 分布式网格系统 任务调度 冗余调度
下载PDF
一种完全分布的网格任务调度算法 被引量:2
18
作者 赵宏 杨愚鲁 《计算机工程与应用》 CSCD 北大核心 2005年第13期17-19,31,共4页
目前国内外网格项目采用集中的网格资源管理和发现机制,在网格中有明确的信息中心,随着网格规模的不断扩大,维护和管理网格信息中心的开销过大,从而影响提高网格性能和成为扩大网格规模的瓶颈。论文提出了一种完全分布的网格资源管理模... 目前国内外网格项目采用集中的网格资源管理和发现机制,在网格中有明确的信息中心,随着网格规模的不断扩大,维护和管理网格信息中心的开销过大,从而影响提高网格性能和成为扩大网格规模的瓶颈。论文提出了一种完全分布的网格资源管理模型,即在网格中没有任何全局的资源信息,同时提出了与此资源模型相适应的基于任务压力的网格任务调度算法。模拟试验表明该资源模型和任务调度算法在不知道整个网格资源处于何种状况的情况下,能够将任务调度到网格的每一个角落,同时具有较好的负载平衡。 展开更多
关键词 网格计算 任务压力 任务调度概率 任务调度
下载PDF
全球计算系统及其关键技术的研究 被引量:2
19
作者 何凯 杨愚鲁 《计算机工程与应用》 CSCD 北大核心 2005年第17期129-132,共4页
全球计算系统利用Internet上空闲计算资源来解决大规模分布式应用。基于Internet的全球计算系统需要重新考虑分布式系统的一些问题:可扩展性、容错、异构、安全、编程模型等,论文分析了一些典型的全球计算系统,讨论并总结它们解决这些... 全球计算系统利用Internet上空闲计算资源来解决大规模分布式应用。基于Internet的全球计算系统需要重新考虑分布式系统的一些问题:可扩展性、容错、异构、安全、编程模型等,论文分析了一些典型的全球计算系统,讨论并总结它们解决这些问题的关键技术。 展开更多
关键词 全球计算系统 可扩展性 容错 编程模型
下载PDF
超级递归基准互连网络性能分析 被引量:2
20
作者 侯国峰 杨愚鲁 《计算机科学》 CSCD 北大核心 2001年第10期85-88,共4页
Based on Delta network, Baseline network and current VLSI technique development level, a new family of MINs using 8× 8 switches which is called Super Recursive Baseline Interconnection Net-work (SRB) has been pre... Based on Delta network, Baseline network and current VLSI technique development level, a new family of MINs using 8× 8 switches which is called Super Recursive Baseline Interconnection Net-work (SRB) has been presented. This paper makes network performance analysis, simulation and com-parison, and proves that SRB has superior qualities in network pass rates, bandwidths and perfor-mance/cost ratios, etc. Therefore, SRB is proved to be a family of Multistage Interconnection Network simple in routing, superior in performance, and easy in expanding. 展开更多
关键词 超级递归基准互连网络 性能分析 拓扑结构 计算机网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部