期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于国产众核超级计算机的6×10~5核并行矩量法
1
作者 顾宗静 吴昊翔 +3 位作者 赵勋旺 林中朝 张玉 张崎 《电子与信息学报》 EI CSCD 北大核心 2019年第4期845-850,共6页
为实现电磁计算的安全可靠和自主可控,该文基于"天河二号"国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方... 为实现电磁计算的安全可靠和自主可控,该文基于"天河二号"国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×10~5 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。 展开更多
关键词 矩量法 LU分解 国产超级计算机 6×105核
下载PDF
10万亿次国产超级计算机项目启动
2
作者 赵勇华 《中小学电教(综合)》 2003年第8期80-80,共1页
美国AMD公司与曙光信息产业有限公司联合宣布曙光采用AMD Opteron(tm)处理器建造中国最快的超级计算机。曙光4000A超级计算机运算速度超过每秒10万亿次(10TFlops)将是第一台由中国制造的、能够进入全球最强大计算机之列的超级计算机。... 美国AMD公司与曙光信息产业有限公司联合宣布曙光采用AMD Opteron(tm)处理器建造中国最快的超级计算机。曙光4000A超级计算机运算速度超过每秒10万亿次(10TFlops)将是第一台由中国制造的、能够进入全球最强大计算机之列的超级计算机。这项内部代号为“红色网格(redgrid)”的开发计划将成就中国最快的超级计算机,同时也是中国计算机产业界首次冲击世界集群式超级计算最高峰。“红色网格”受到了国家科技部、信息产业部和中科院的支持与肯定,曙光4000A将是863计划“十五”期间的重大成果,也将是中国科学院知识创新工程的重大成果。 展开更多
关键词 10万亿次 国产超级计算机项目 AMD opteron(tm)处理器 性能 IT行业
原文传递
国产异构系统上的HPCG并行算法及高效实现 被引量:1
3
作者 刘芳芳 王志军 +4 位作者 汪荃 吴丽鑫 马文静 杨超 孙家昶 《软件学报》 EI CSCD 北大核心 2021年第8期2341-2351,共11页
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升... HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升国产超级计算机HPCG的排名,还对很多应用提供了并行算法、优化技术等方面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对HPCG进行并行,并提出一种适用于结构化网格的图着色算法.该算法并行性能高于传统的JPL、CC等算法,且着色质量高,运用于HPCG后,迭代次数减少了3次,整体性能提升了6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算机峰值性能的1.67%,与单节点相比,整机弱可扩展性并行效率达到了92%. 展开更多
关键词 HPCG 国产超级计算机 图着色 SpMV SymGS
下载PDF
卷积神经网络并行方法研究 被引量:2
4
作者 朱传家 刘鑫 方佳瑞 《计算机应用与软件》 北大核心 2020年第11期209-214,共6页
随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于... 随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于国产超级计算机系统和深度学习框架Caffe进行实验。实验结果表明,对某些全连接层,使用模型并行相比使用数据并行加速可达33倍。 展开更多
关键词 卷积神经网络 并行方法 数据并行 模型并行 国产超级计算机系统
下载PDF
海洋数值模式运行管理系统的设计与实现 被引量:3
5
作者 韩琦琦 刘鑫 +1 位作者 曾云辉 朱光慧 《计算机应用与软件》 北大核心 2020年第4期6-11,共6页
针对海洋数值模式大规模连续性运行保障的需求,基于国产神威超级计算机设计和开发一套切实可行的海洋数值模式运行管理系统。采用B/S的结构模式,基于JeeSite框架实现系统快速开发,实现了模式流程管理、模式软件与数据管理、模式性能分... 针对海洋数值模式大规模连续性运行保障的需求,基于国产神威超级计算机设计和开发一套切实可行的海洋数值模式运行管理系统。采用B/S的结构模式,基于JeeSite框架实现系统快速开发,实现了模式流程管理、模式软件与数据管理、模式性能分析和故障快速定位等主要功能。该系统规范了海洋数值模式软件的管理和使用流程,并能够及时发现模式运行异常和运行故障,有利于保障大规模模式作业的连续性运行,提高国产超级计算机的易用性。 展开更多
关键词 海洋数值模式 国产超级计算机 故障定位 管理系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部