期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
LINPACK与机群系统的LINPACK测试 被引量:13
1
作者 都志辉 吴博 +3 位作者 刘鹏 陈渝 王小鸽 李三立 《计算机科学》 CSCD 北大核心 2002年第5期8-10,59,共4页
一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不... 一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不是制订一个测试计算机性能的统一标准,而只是提供一些常用的计算方法的实现,但是由于该软件包的广泛使用,这样就为通过LINPACK例程来比较不同计算机的性能提供了可能. 展开更多
关键词 线性代数软件包 linpack 机群系统 测试 并行计算机
下载PDF
基于Linpack的高性能计算机集群的并行性能测试 被引量:8
2
作者 余江洪 肖燕成 +2 位作者 朱宗柏 蔡永华 肖金生 《船电技术》 2009年第5期56-60,共5页
基于计算机集群的高性能并行计算,已成为广大工程与科学计算的有效手段。本文以DELL HPCC高性能计算机集群为硬件平台,以Linpack为并行性能测试软件,测试了不同计算机节点数或处理器数、最高Gflops值的矩阵规模N、求解矩阵的分块大小NB... 基于计算机集群的高性能并行计算,已成为广大工程与科学计算的有效手段。本文以DELL HPCC高性能计算机集群为硬件平台,以Linpack为并行性能测试软件,测试了不同计算机节点数或处理器数、最高Gflops值的矩阵规模N、求解矩阵的分块大小NB、处理器网格中水平方向处理器个数P、处理器网格中垂直方向处理器个数Q的并行性能。通过测试和分析来研究高性能计算机集群的并行性能及其优化策略。 展开更多
关键词 计算机集群 高性能计算 并行效率 计算流体动力学linpack
下载PDF
Linpack并行性能模型及其预测 被引量:6
3
作者 王申 漆锋滨 +1 位作者 谷洪峰 潘治 《计算机工程》 CAS CSCD 2012年第16期81-84,共4页
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Lin... 通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Linpack并行性能的影响,尤其在大规模矩阵情况下预测误差不到1%。 展开更多
关键词 linpack测试 并行性能模型 预测 矩阵规模 网络带宽
下载PDF
基于IBM1350机群的Linpack快速测试 被引量:2
4
作者 姜晓玲 任国林 《计算机技术与发展》 2007年第3期65-68,共4页
Linpack是目前测试机群浮点运算性能的通用标准。文中旨在解决Linpack采用通用参数配置时因盲目配置参数多而导致测试周期长的缺陷,提出了一种可大幅度减少测试周期的基于最优化路径的Linpack参数配置策略。IBM1350机群浮点性能的快速... Linpack是目前测试机群浮点运算性能的通用标准。文中旨在解决Linpack采用通用参数配置时因盲目配置参数多而导致测试周期长的缺陷,提出了一种可大幅度减少测试周期的基于最优化路径的Linpack参数配置策略。IBM1350机群浮点性能的快速测试显示该研究达到了预先设计要求。参数配置规律的深入分析表明该策略对于其它机群性能测试具有借鉴意义。 展开更多
关键词 linpack 检测机群性能 最优化路径 参数配置策略 快速测试
下载PDF
异构高性能计算系统Linpack效率受限因素分析 被引量:1
5
作者 贾迅 邬贵明 谢向辉 《计算机工程与科学》 CSCD 北大核心 2018年第2期224-230,共7页
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构... 能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。 展开更多
关键词 异构 高性能 linpack 效率
下载PDF
高性能计算集群Linpack测试与优化研究 被引量:1
6
作者 张策 吴驰 龙涛 《信息与电脑》 2021年第18期14-17,共4页
Linpack是业内公认的用于衡量高性能计算集群实际计算性能的基准测试程序,对高性能计算集群进行Linpack测试不仅能了解集群的实际运算能力,还可以通过测试分析出集群的性能瓶颈,从而对其进行针对性的改进。由于在Linpack测试过程中不同... Linpack是业内公认的用于衡量高性能计算集群实际计算性能的基准测试程序,对高性能计算集群进行Linpack测试不仅能了解集群的实际运算能力,还可以通过测试分析出集群的性能瓶颈,从而对其进行针对性的改进。由于在Linpack测试过程中不同输入参数对实测的算力峰值影响非常大,参数选择十分费力,以往都是凭借经验配置参数,不断尝试以获取较满意的测试结果。笔者以华中科技大学高性能计算集群为测试对象,采用HPL(Hero Pro League)软件进行Linpack测试,通过对Linpack测试原理进行深入分析,提出一套标准测试方案。通过此方案步骤能够大大减少盲目测试次数,快速获得满意的性能效率。 展开更多
关键词 高性能计算 linpack 性能测试
下载PDF
对LINPACK中矩阵分解步骤的修改及其应用
7
作者 林应举 《南京大学学报(数学半年刊)》 CAS 北大核心 1993年第2期141-145,共5页
关键词 矩阵 分解 软件 linpack LU分解
下载PDF
一个实用高性能PC集群的Linpack测试与分析 被引量:8
8
作者 肖明旺 许坚 +1 位作者 车永刚 王正华 《计算机应用研究》 CSCD 北大核心 2004年第9期183-184,187,共3页
HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点... HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点数之间近似线性关系的结论,并给出了处理器维数、问题规模与系统性能之间的关系。 展开更多
关键词 PC集群 性能评价 基准测试 HPL
下载PDF
高性能计算集群的Linpack测试及其在大数据中的应用 被引量:2
9
作者 韩菲 孙赞东 苏辉 《计算机与现代化》 2015年第5期25-29,共5页
高性能计算集群用于高效并行计算,具有很高的性价比和良好的可扩展性,如何测试和评价集群系统性能成为一个关键问题。本文基于6个节点的集群进行Linpack测试,测试不同问题规模、计算节点数、求解矩阵数据分块NB、处理器网格拓扑P×... 高性能计算集群用于高效并行计算,具有很高的性价比和良好的可扩展性,如何测试和评价集群系统性能成为一个关键问题。本文基于6个节点的集群进行Linpack测试,测试不同问题规模、计算节点数、求解矩阵数据分块NB、处理器网格拓扑P×Q、网络通信等重要因素,将单机与集群的计算性能进行对比,测试集群性能,结果表明:该集群的并行计算性能良好,可扩展性强,但硬件通讯能力需进一步改善。应用该集群到实际的地震大数据计算中,该集群的并行计算能力得到了很大的提升。 展开更多
关键词 高性能计算 性能测试 大数据
下载PDF
Tesla K80再度突破超算大赛LINPACK记录
10
《智能制造》 2016年第6期8-8,共1页
2016年6月24日,在ISC2016的大学生超算竞赛上,NVIDIATeslaK80GPU加速器再次助力中国代表队获佳绩.华中科技大学代表队在3000瓦功耗下,取得了LINPACK基础测试12.56TFLOPS的成绩,并刷新了世界记录.这是TeslaK80自发布1年半以来,连续第三... 2016年6月24日,在ISC2016的大学生超算竞赛上,NVIDIATeslaK80GPU加速器再次助力中国代表队获佳绩.华中科技大学代表队在3000瓦功耗下,取得了LINPACK基础测试12.56TFLOPS的成绩,并刷新了世界记录.这是TeslaK80自发布1年半以来,连续第三次在超算大赛中帮助参赛队伍刷新LINPACK世界记录.值得一提的是,在三年前的ISC13上,华中科技大学同样是借助TeslaGPU,创下了当时的LINPACK世界记录. 展开更多
关键词 linpack 华中科技大学 参赛队伍 大学生 加速器 世界 刷新
下载PDF
高性能计算处理集群部署应用研究
11
作者 何芸 杨敏 +1 位作者 许涛 景少军 《信息系统工程》 2024年第4期107-110,共4页
鉴于高密度、高精度地震采集数据量、处理计算量几何级增长,使处理集群高性能计算和存储资源紧缺。为满足油气勘探需求,扩充数据处理能力。引进部署国产自主安全可控的海光集群,利用x CAT等技术批量部署集群节点,组建高速以太网交换网络... 鉴于高密度、高精度地震采集数据量、处理计算量几何级增长,使处理集群高性能计算和存储资源紧缺。为满足油气勘探需求,扩充数据处理能力。引进部署国产自主安全可控的海光集群,利用x CAT等技术批量部署集群节点,组建高速以太网交换网络,部署Gridview综合系统实现集群高效监控管理,搭建高性能计算处理集群环境,提升海量数据处理能力建设。 展开更多
关键词 GRIDVIEW xCAT linpack 作业管理
下载PDF
并行集群系统的Linpack性能测试分析 被引量:9
12
作者 罗水华 杨广文 +2 位作者 张林波 石威 郑纬民 《数值计算与计算机应用》 CSCD 北大核心 2003年第4期285-292,共8页
§1.引言 近些年随着计算机软硬件技术的提高,尤其是网络部件性能的提高,集群技术得到不断的发展.传统的PVP(Parallel Vector Processor)超级计算机以及MPP(Massively Parallel Processing)的成本很容易达到几千万美元,与此相比,具... §1.引言 近些年随着计算机软硬件技术的提高,尤其是网络部件性能的提高,集群技术得到不断的发展.传统的PVP(Parallel Vector Processor)超级计算机以及MPP(Massively Parallel Processing)的成本很容易达到几千万美元,与此相比,具有相同峰值性能的机群价格则要低1到2个数量级. 展开更多
关键词 并行集群系统 linpack性能 Moore定律 计算机系统 性能测试
原文传递
Nehalem平台的Linpack参数训练与优化 被引量:1
13
作者 孟金涛 贺鹏程 刘涛 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第S1期55-58,共4页
针对如何配置Linpack各参数并使得系统实测性能接近最优的问题,提出了一种Linpack参数调优的训练方法,实现了分离关键参数及非关键参数,并通过小规模参数训练粗粒度设置关键参数与非关键参数,然后在大规模参数训练中逐步精细调优所有参... 针对如何配置Linpack各参数并使得系统实测性能接近最优的问题,提出了一种Linpack参数调优的训练方法,实现了分离关键参数及非关键参数,并通过小规模参数训练粗粒度设置关键参数与非关键参数,然后在大规模参数训练中逐步精细调优所有参数.在Intel的Nehalem平台上对实例逐步分析,实现了Linpack的所有参数的最优化调整,使得Linpack的实测峰值性能优化到理论峰值的80.6%. 展开更多
关键词 linpack 参数分析 参数训练 性能测试 Nehalem平台
原文传递
Optimizing Linpack Benchmark on GPU-Accelerated Petascale Supercomputer 被引量:2
14
作者 王锋 杨灿群 +3 位作者 杜云飞 陈娟 易会战 徐炜遐 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第5期854-865,共12页
In this paper we present the programming of the Linpack benchmark on TianHe-1 system,the first petascale supercomputer system of China,and the largest GPU-accelerated heterogeneous system ever attempted before.A hybri... In this paper we present the programming of the Linpack benchmark on TianHe-1 system,the first petascale supercomputer system of China,and the largest GPU-accelerated heterogeneous system ever attempted before.A hybrid programming model consisting of MPI,OpenMP and streaming computing is described to explore the task parallel,thread parallel and data parallel of the Linpack.We explain how we optimized the load distribution across the CPUs and GPUs using the two-level adaptive method and describe the implementation in details.To overcome the low-bandwidth between the CPU and GPU communication,we present a software pipelining technique to hide the communication overhead.Combined with other traditional optimizations,the Linpack we developed achieved 196.7 GFLOPS on a single compute element of TianHe-1.This result is 70.1% of the peak compute capability,3.3 times faster than the result by using the vendor's library.On the full configuration of TianHe-1 our optimizations resulted in a Linpack performance of 0.563 PFLOPS,which made TianHe-1 the 5th fastest supercomputer on the Top500 list in November,2009. 展开更多
关键词 petascale linpack GPU HETEROGENEOUS SUPERCOMPUTER
原文传递
服务器平台计算性能工具Linpack 服务器性能测试利器(一)
15
作者 赵吉志 《科技浪潮》 2006年第10期21-22,共2页
计算机硬件的不断升级带来了系统处理性能的持续提高,如何对平台的性能作出正确的判断是性能测试的主要目标。业界有多种测试基准,有的是基于实际的应用种类如TPC-C,有的是测试系统某一部分的性能,如测试硬盘吞吐能力的IOmeter,测试内... 计算机硬件的不断升级带来了系统处理性能的持续提高,如何对平台的性能作出正确的判断是性能测试的主要目标。业界有多种测试基准,有的是基于实际的应用种类如TPC-C,有的是测试系统某一部分的性能,如测试硬盘吞吐能力的IOmeter,测试内存带宽的stream。本专题将对几个常见且权威的测试基准以及其使用方法作一下介绍。 展开更多
关键词 测试基准 内存带宽 服务器平台 服务器性能 linpack 性能测试 计算机硬件 浮点 处理性能
原文传递
面向龙芯3A体系结构的BLAS库优化 被引量:8
16
作者 何颂颂 顾乃杰 +1 位作者 朱海涛 刘燕君 《小型微型计算机系统》 CSCD 北大核心 2012年第3期571-575,共5页
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替... 双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多. 展开更多
关键词 矩阵乘法 BLAS 任务划分 linpack
下载PDF
HPL测试性能仿真与预测 被引量:13
17
作者 张文力 陈明宇 樊建平 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期557-562,共6页
HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试... HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试仿真模型,对执行时间进行更细致的评估.同时,在大量真实测试验证的基础上,利用该模型对各种系统性能提高因素将带给Linpack测试的益处进行预见,期望为体系的改进方向提供参考. 展开更多
关键词 高性能linpack测试软件包(HPL) 线性代数方程组 LU分解 MPI
下载PDF
线性代数要与科学计算结成好伙伴 被引量:34
18
作者 陈怀琛 《大学数学》 2010年第A01期28-34,共7页
讨论了大学教学中科学计算能力的重要性,评价了我国在这个领域的落后状况.一是科学计算能力的培养无人主管;二是线性代数课程忽视实用性,不教矩阵软件,与后续课的需求及计算机脱节.这两者的长期割裂阻碍了我国课程和教育的现代化.文章... 讨论了大学教学中科学计算能力的重要性,评价了我国在这个领域的落后状况.一是科学计算能力的培养无人主管;二是线性代数课程忽视实用性,不教矩阵软件,与后续课的需求及计算机脱节.这两者的长期割裂阻碍了我国课程和教育的现代化.文章提供的历史经验和国内外实践,都证明这两者的结合可以产生巨大的创新效果.文章结合十五年来的改革经验,提出改进的建议,并介绍了教育部"用MATLAB和建模实践改革工科线性代数"项目的实施情况. 展开更多
关键词 教育现代化 科学计算能力 线性代数 课程改革 矩阵运算 MATLAB linpack
下载PDF
基于HPL的Linux高性能计算集群基准测试研究 被引量:2
19
作者 金能智 文洮 +1 位作者 杨博超 安文婷 《现代信息科技》 2019年第14期60-62,共3页
高性能计算已成为国家科技创新核心竞争力的重要方面,其运算能力是重要的评价指标。HPL(High Performance Linpack)是行业内使用最广泛的高性能计算机浮点计算能力的基准测试程序。如何做好Linpack基准测试对于高性能计算有着重要的意义... 高性能计算已成为国家科技创新核心竞争力的重要方面,其运算能力是重要的评价指标。HPL(High Performance Linpack)是行业内使用最广泛的高性能计算机浮点计算能力的基准测试程序。如何做好Linpack基准测试对于高性能计算有着重要的意义,本文以甘肃省计算中心一套高性能计算集群为测试对象,从HPL原理、HPL测试及结果优化来探究Linpack基准测试方法。 展开更多
关键词 高性能计算 linpack HIGH PERFORMANCE linpack 基准测试
下载PDF
InfiniBand网络下的地震资料处理系统性能分析 被引量:3
20
作者 付庆华 王贤 +2 位作者 秦泽波 仉潮 刘斌 《信息系统工程》 2016年第1期92-93,95,共3页
地震资料处理系统是典型的高性能计算系统,随着CPU处理器计算能力的不断提升,集群式服务器间的千兆以太网络通讯逐渐成为系统性能提升的瓶颈。上世纪九十年逐渐兴起的Infiniband计算机互联技术,很好地解决了传统PCI总线数据结构传输方... 地震资料处理系统是典型的高性能计算系统,随着CPU处理器计算能力的不断提升,集群式服务器间的千兆以太网络通讯逐渐成为系统性能提升的瓶颈。上世纪九十年逐渐兴起的Infiniband计算机互联技术,很好地解决了传统PCI总线数据结构传输方式中的低效、延迟弊端。IB网络在高性能计算领域越来越多被采用。本文分析了一典型的基于IB网络的地震资料处理系统架构及各部分组成,并通过多次实验,测得了整体集群系统的CPU计算速率及服务器间网络通讯速率,得出集群整体CPU计算效率达到了理论值的88%,网络传输效率达到了理论值的65%。该架构匹配合理,集群系统整体性能极好。 展开更多
关键词 Infin Band网络 高性能计算 linpack CPU计算效率 网络传输效率
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部