期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
曙光5000A天体大规模数值模拟软件性能测试 被引量:1
1
作者 王婷 孙相征 +6 位作者 张云泉 杨超 李力刚 刘芳芳 管文华 唐雨新 姚继峰 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第10期71-75,共5页
在国产百万亿次超级计算机曙光5000A上进行了天体大规模数值模拟软件的性能和可扩展测试实验,详细介绍了软件中的测试程序以及测试环境和过程,并对测试结果进行了分析.对于80×80×50的网格规模,采用每节点4进程测试了16~128... 在国产百万亿次超级计算机曙光5000A上进行了天体大规模数值模拟软件的性能和可扩展测试实验,详细介绍了软件中的测试程序以及测试环境和过程,并对测试结果进行了分析.对于80×80×50的网格规模,采用每节点4进程测试了16~128个处理器核,每节点8进程、16进程分别测试了16~512个处理器核,相对加速比最终分别达到5.33、10.48和12.57,并行效率分别达到66.66%、32.58%和32.29%.对于160×160×100的网格规模,测试了每节点16进程的64~8192个核的性能,最大相对加速比为12.46,并行效率为9.73%.测试结果表明,曙光5000A具有良好的性能,测试结果对软件下一步的优化研究具有重要的指导意义. 展开更多
关键词 曙光5000a 数值模拟 性能测试 可扩展
下载PDF
基于曙光3000并行机的远程并行调试器
2
作者 陈勇 李春生 +2 位作者 安虹 郑启龙 陈志辉 《计算机科学》 CSCD 北大核心 2004年第3期179-182,200,共5页
并行调试对并行程序开发非常重要,然而传统的远程并行调试方式是采用登录(telnet)命令通过命令行的文本界面进行,非常繁杂。本文介绍了为曙光3000系统设计实现的远程并行调试器RPB(Remote Parallel Debugger)。RPB实现了完全并行调试等... 并行调试对并行程序开发非常重要,然而传统的远程并行调试方式是采用登录(telnet)命令通过命令行的文本界面进行,非常繁杂。本文介绍了为曙光3000系统设计实现的远程并行调试器RPB(Remote Parallel Debugger)。RPB实现了完全并行调试等功能,并且具备图形用户界面,用户界面采用Java语言和Swing工具包实现,具备平台独立的特点。RPB采用客户端/服务器模式,客户端和服务器之间的通信采用当今流行的CORBA中间件技术。RPB支持通过局域网或广域网远程调试并行机上的程序,屏蔽了客户平台的差异和并行机地理位置上的差异,因而大大提高了并行机的好用性。 展开更多
关键词 并行计算机 曙光5000 远程并行调试器 并行程序开发 图形用户界面 JAVA语言 文本界面
下载PDF
国产百万亿次机群系统Alltoall性能测试与分析 被引量:3
3
作者 饶立 张云泉 李玉成 《计算机科学》 CSCD 北大核心 2010年第8期186-188,207,共4页
随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响。在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信... 随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响。在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信开销是并行程序设计的瓶颈。为此,对现有主流Alltoall算法在曙光5000A和深腾7000上进行性能测试与分析,以期对未来的Alltoall算法的优化工作做出贡献。利用不同消息长度和不同进程数测试了Alltoall函数多种算法的性能,这些算法包括二维网格算法、三维网格算法、Bruck算法、原始算法、成对交换算法、递归倍增算法、环算法以及LAM/MPI中的简单算法等。实验结果表明:消息长度较小时,在曙光5000A上采用原始算法和Bruck算法的性能较好,而在深腾7000上用时较少的算法是简单算法和Bruck算法;对于长消息,曙光5000A上最优的算法是环算法,深腾7000上成对交换性能最优。 展开更多
关键词 集合通信 Alltoall 曙光5000a 性能测试与分析
下载PDF
上海超算中心机房基础设施建设与管理 被引量:5
4
作者 王晶 《建筑电气》 2011年第9期69-72,共4页
2009年曙光5000A高性能计算机部署到上海超算中心,上海超算中心为此对机房基础设施进行了改造建设。介绍曙光5000A机房基础设施的建设和运维管理,总结基础设施设计中存在的问题。
关键词 上海超算中心 曙光5000a高性能计算机 机房 水冷机柜 基础设施 管理
下载PDF
一类非张量积区域快速傅立叶变换算法在国产并行机上的可扩展性测试
5
作者 余元 张云泉 李会元 《数值计算与计算机应用》 CSCD 北大核心 2010年第2期123-130,共8页
本文给出了一类基于六边形非张量积区域上的广义离散快速傅立叶变换算法(HFFT)以及它在国产百万亿次超级计算机(曙光5000A)上的测试运行情况.文章介绍了该算法在曙光5000A上的大规模集群测试加速比和可扩展性特性,并通过分析,说明HFFT... 本文给出了一类基于六边形非张量积区域上的广义离散快速傅立叶变换算法(HFFT)以及它在国产百万亿次超级计算机(曙光5000A)上的测试运行情况.文章介绍了该算法在曙光5000A上的大规模集群测试加速比和可扩展性特性,并通过分析,说明HFFT在国产超级计算机的大规模并行环境下拥有良好的可扩展性.在使用8192个处理器核的情况下,HFFT加速比达到了277倍.我们同样对FFTW软件包进行了测试.本文的分析为解决其他科学计算程序在国产百万亿次规模集群上的可扩展性问题,提供了一些先行的参考和建议. 展开更多
关键词 非张量积区域 快速傅立叶变换 曙光5000a 可扩展性测试
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部