期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于国产众核超级计算机的6×10~5核并行矩量法
1
作者
顾宗静
吴昊翔
+3 位作者
赵勋旺
林中朝
张玉
张崎
《电子与信息学报》
EI
CSCD
北大核心
2019年第4期845-850,共6页
为实现电磁计算的安全可靠和自主可控,该文基于"天河二号"国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方...
为实现电磁计算的安全可靠和自主可控,该文基于"天河二号"国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×10~5 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。
展开更多
关键词
矩量法
LU分解
国产超级计算机
6×105核
下载PDF
职称材料
10万亿次国产超级计算机项目启动
2
作者
赵勇华
《中小学电教(综合)》
2003年第8期80-80,共1页
美国AMD公司与曙光信息产业有限公司联合宣布曙光采用AMD Opteron(tm)处理器建造中国最快的超级计算机。曙光4000A超级计算机运算速度超过每秒10万亿次(10TFlops)将是第一台由中国制造的、能够进入全球最强大计算机之列的超级计算机。...
美国AMD公司与曙光信息产业有限公司联合宣布曙光采用AMD Opteron(tm)处理器建造中国最快的超级计算机。曙光4000A超级计算机运算速度超过每秒10万亿次(10TFlops)将是第一台由中国制造的、能够进入全球最强大计算机之列的超级计算机。这项内部代号为“红色网格(redgrid)”的开发计划将成就中国最快的超级计算机,同时也是中国计算机产业界首次冲击世界集群式超级计算最高峰。“红色网格”受到了国家科技部、信息产业部和中科院的支持与肯定,曙光4000A将是863计划“十五”期间的重大成果,也将是中国科学院知识创新工程的重大成果。
展开更多
关键词
10万亿次
国产超级计算机
项目
AMD
opteron(tm)处理器
性能
IT行业
原文传递
国产异构系统上的HPCG并行算法及高效实现
被引量:
2
3
作者
刘芳芳
王志军
+4 位作者
汪荃
吴丽鑫
马文静
杨超
孙家昶
《软件学报》
EI
CSCD
北大核心
2021年第8期2341-2351,共11页
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升...
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升国产超级计算机HPCG的排名,还对很多应用提供了并行算法、优化技术等方面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对HPCG进行并行,并提出一种适用于结构化网格的图着色算法.该算法并行性能高于传统的JPL、CC等算法,且着色质量高,运用于HPCG后,迭代次数减少了3次,整体性能提升了6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算机峰值性能的1.67%,与单节点相比,整机弱可扩展性并行效率达到了92%.
展开更多
关键词
HPCG
国产超级计算机
图着色
SpMV
SymGS
下载PDF
职称材料
卷积神经网络并行方法研究
被引量:
2
4
作者
朱传家
刘鑫
方佳瑞
《计算机应用与软件》
北大核心
2020年第11期209-214,共6页
随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于...
随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于国产超级计算机系统和深度学习框架Caffe进行实验。实验结果表明,对某些全连接层,使用模型并行相比使用数据并行加速可达33倍。
展开更多
关键词
卷积神经网络
并行方法
数据并行
模型并行
国产超级计算机
系统
下载PDF
职称材料
海洋数值模式运行管理系统的设计与实现
被引量:
3
5
作者
韩琦琦
刘鑫
+1 位作者
曾云辉
朱光慧
《计算机应用与软件》
北大核心
2020年第4期6-11,共6页
针对海洋数值模式大规模连续性运行保障的需求,基于国产神威超级计算机设计和开发一套切实可行的海洋数值模式运行管理系统。采用B/S的结构模式,基于JeeSite框架实现系统快速开发,实现了模式流程管理、模式软件与数据管理、模式性能分...
针对海洋数值模式大规模连续性运行保障的需求,基于国产神威超级计算机设计和开发一套切实可行的海洋数值模式运行管理系统。采用B/S的结构模式,基于JeeSite框架实现系统快速开发,实现了模式流程管理、模式软件与数据管理、模式性能分析和故障快速定位等主要功能。该系统规范了海洋数值模式软件的管理和使用流程,并能够及时发现模式运行异常和运行故障,有利于保障大规模模式作业的连续性运行,提高国产超级计算机的易用性。
展开更多
关键词
海洋数值模式
国产超级计算机
故障定位
管理系统
下载PDF
职称材料
题名
基于国产众核超级计算机的6×10~5核并行矩量法
1
作者
顾宗静
吴昊翔
赵勋旺
林中朝
张玉
张崎
机构
西安电子科技大学陕西省超大规模电磁计算重点实验室
出处
《电子与信息学报》
EI
CSCD
北大核心
2019年第4期845-850,共6页
基金
国家重点研发计划(2017YFB0202102
2016YFE0121600)
中国博士后科学基金(2017M613068)~~
文摘
为实现电磁计算的安全可靠和自主可控,该文基于"天河二号"国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×10~5 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。
关键词
矩量法
LU分解
国产超级计算机
6×105核
Keywords
Method of Moments(MoM)
LU decomposition
Domestically-made supercomputer
6×105 cores
分类号
TP338.4 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
10万亿次国产超级计算机项目启动
2
作者
赵勇华
机构
北京
出处
《中小学电教(综合)》
2003年第8期80-80,共1页
文摘
美国AMD公司与曙光信息产业有限公司联合宣布曙光采用AMD Opteron(tm)处理器建造中国最快的超级计算机。曙光4000A超级计算机运算速度超过每秒10万亿次(10TFlops)将是第一台由中国制造的、能够进入全球最强大计算机之列的超级计算机。这项内部代号为“红色网格(redgrid)”的开发计划将成就中国最快的超级计算机,同时也是中国计算机产业界首次冲击世界集群式超级计算最高峰。“红色网格”受到了国家科技部、信息产业部和中科院的支持与肯定,曙光4000A将是863计划“十五”期间的重大成果,也将是中国科学院知识创新工程的重大成果。
关键词
10万亿次
国产超级计算机
项目
AMD
opteron(tm)处理器
性能
IT行业
分类号
TP332.2 [自动化与计算机技术—计算机系统结构]
原文传递
题名
国产异构系统上的HPCG并行算法及高效实现
被引量:
2
3
作者
刘芳芳
王志军
汪荃
吴丽鑫
马文静
杨超
孙家昶
机构
中国科学院软件研究所并行软件与计算科学实验室
中国科学院大学
计算机科学国家重点实验室(中国科学院软件研究所)
北京大学数学科学学院
出处
《软件学报》
EI
CSCD
北大核心
2021年第8期2341-2351,共11页
基金
中国科学院战略性先导科技专项(C类)(XDC01030200)
国家重点研发计划(2018YFB0204404,2016YFB0200603)。
文摘
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升国产超级计算机HPCG的排名,还对很多应用提供了并行算法、优化技术等方面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对HPCG进行并行,并提出一种适用于结构化网格的图着色算法.该算法并行性能高于传统的JPL、CC等算法,且着色质量高,运用于HPCG后,迭代次数减少了3次,整体性能提升了6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算机峰值性能的1.67%,与单节点相比,整机弱可扩展性并行效率达到了92%.
关键词
HPCG
国产超级计算机
图着色
SpMV
SymGS
Keywords
HPCG
domestic supercomputer
graph coloring
SpMV
SymGS
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
卷积神经网络并行方法研究
被引量:
2
4
作者
朱传家
刘鑫
方佳瑞
机构
江南计算技术研究所
清华大学计算机科学与技术系
出处
《计算机应用与软件》
北大核心
2020年第11期209-214,共6页
基金
国家重点研发计划“全球变化及应对”专项基金项目(2016YFA0602200)。
文摘
随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于国产超级计算机系统和深度学习框架Caffe进行实验。实验结果表明,对某些全连接层,使用模型并行相比使用数据并行加速可达33倍。
关键词
卷积神经网络
并行方法
数据并行
模型并行
国产超级计算机
系统
Keywords
CNN
Parallelism method
Data parallelism
Model parallelism
Domestic supercomputer
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
海洋数值模式运行管理系统的设计与实现
被引量:
3
5
作者
韩琦琦
刘鑫
曾云辉
朱光慧
机构
齐鲁工业大学(山东省科学院)
山东省计算中心(国家超级计算济南中心)
山东省计算机网络重点实验室
出处
《计算机应用与软件》
北大核心
2020年第4期6-11,共6页
基金
国家重点研发计划项目(2016YFB0201100)。
文摘
针对海洋数值模式大规模连续性运行保障的需求,基于国产神威超级计算机设计和开发一套切实可行的海洋数值模式运行管理系统。采用B/S的结构模式,基于JeeSite框架实现系统快速开发,实现了模式流程管理、模式软件与数据管理、模式性能分析和故障快速定位等主要功能。该系统规范了海洋数值模式软件的管理和使用流程,并能够及时发现模式运行异常和运行故障,有利于保障大规模模式作业的连续性运行,提高国产超级计算机的易用性。
关键词
海洋数值模式
国产超级计算机
故障定位
管理系统
Keywords
Ocean numerical model
Domestic supercomputer
Fault location
Management system
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于国产众核超级计算机的6×10~5核并行矩量法
顾宗静
吴昊翔
赵勋旺
林中朝
张玉
张崎
《电子与信息学报》
EI
CSCD
北大核心
2019
0
下载PDF
职称材料
2
10万亿次国产超级计算机项目启动
赵勇华
《中小学电教(综合)》
2003
0
原文传递
3
国产异构系统上的HPCG并行算法及高效实现
刘芳芳
王志军
汪荃
吴丽鑫
马文静
杨超
孙家昶
《软件学报》
EI
CSCD
北大核心
2021
2
下载PDF
职称材料
4
卷积神经网络并行方法研究
朱传家
刘鑫
方佳瑞
《计算机应用与软件》
北大核心
2020
2
下载PDF
职称材料
5
海洋数值模式运行管理系统的设计与实现
韩琦琦
刘鑫
曾云辉
朱光慧
《计算机应用与软件》
北大核心
2020
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部