期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
国产神威环境下Athread代码生成工具的设计与开发
1
作者
刘加伟
郭强
+3 位作者
庄园
张海红
王利
曾云辉
《计算机工程与设计》
北大核心
2024年第2期633-640,F0003,共9页
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调...
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调用slave程序的三层模板程序架构,集成常用众核优化方法的代码框架。经过实验分析,采用该自动转换工具生成的Athread代码相较于人工编写的OpenACC*加速的程序有更高的加速比,特别是对多个核心段进行众核化加速时的加速比相差15%,验证该转换工具具有很好的实用性。
展开更多
关键词
加速
线程
库
代码生成
模板引擎
语法分析
众核处理器
神威·太湖之光
高性能计算
下载PDF
职称材料
神威·太湖之光上排列熵算法异构并行加速
被引量:
1
2
作者
周倩
梁建国
傅游
《计算机工程与设计》
北大核心
2023年第2期400-406,共7页
为增加检测突变信号的时效性,提高各种故障检测系统的效率,提出在“神威·太湖之光”上基于两级并行模式改进的排列熵(PE)算法。在节点间采用MPI(信息传递接口)并行编程模型,通过对等模式轮询调度方式解决多文件负载不均衡问题;在...
为增加检测突变信号的时效性,提高各种故障检测系统的效率,提出在“神威·太湖之光”上基于两级并行模式改进的排列熵(PE)算法。在节点间采用MPI(信息传递接口)并行编程模型,通过对等模式轮询调度方式解决多文件负载不均衡问题;在核组内采用Athread(加速线程库)并行编程模型,通过相空间构建重构矩阵,实现从核级数据划分;采用双缓冲技术实现从核计算与访存的重叠,减少主从通信时间;利用DMA通信和重组传输数据的方法,减少主从通信次数。使用15个LDK UER204滚动轴承全寿命周期实验数据进行测试,结果表明,单核组性能较主核版本最高可获得11.86倍加速,128核组最高实现123.73倍的性能提升。
展开更多
关键词
SW26010处理器
信息传递接口(MPI)
加速
线程
库
(
athread
)
负载均衡
双缓冲
下载PDF
职称材料
基于申威26010处理器的大规模量子傅里叶变换模拟
被引量:
3
3
作者
刘晓楠
荆丽娜
+1 位作者
王立新
王美玲
《计算机科学》
CSCD
北大核心
2020年第8期93-97,共5页
量子计算由于其纠缠性和叠加性具有天然的并行优势,然而目前的量子计算设备受限于物理实现的工艺水平,距离可发挥巨大计算能力并解决有现实意义的实际问题还需要一定时间的技术积累和突破。因此,采用经典计算机对量子计算进行模拟成为...
量子计算由于其纠缠性和叠加性具有天然的并行优势,然而目前的量子计算设备受限于物理实现的工艺水平,距离可发挥巨大计算能力并解决有现实意义的实际问题还需要一定时间的技术积累和突破。因此,采用经典计算机对量子计算进行模拟成为验证量子算法的有效途径。量子傅里叶变换(Quantum Fourier Transform,QFT)是许多量子算法的关键组成部分,它涉及相位估计、求阶、因子等问题。对量子傅里叶变换的研究和大规模模拟实现,可以有效促进相关量子算法的研究、验证以及优化。文中使用我国自主研发的超级计算机——“神威·太湖之光”对大规模量子傅里叶变换进行模拟,并根据申威26010处理器异构并行的特点,采用MPI、加速线程库以及通信与计算隐藏技术进行优化。通过Shor算法中求解周期部分的运算来验证量子傅里叶变换模拟的正确性,实现了46位量子比特QFT算法的模拟和优化,为其他量子算法在超算平台上的验证优化以及新量子算法的提出提供了参考。
展开更多
关键词
量子傅里叶变换
申威26010
MPI
加速
线程
库
Shor算法
下载PDF
职称材料
题名
国产神威环境下Athread代码生成工具的设计与开发
1
作者
刘加伟
郭强
庄园
张海红
王利
曾云辉
机构
齐鲁工业大学(山东省科学院)计算机科学与技术学部
齐鲁工业大学(山东省科学院)山东省计算中心(国家超级计算济南中心)
出处
《计算机工程与设计》
北大核心
2024年第2期633-640,F0003,共9页
基金
科教产融合试点工程重大创新专项基金项目(2022JBZ01-01)。
文摘
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调用slave程序的三层模板程序架构,集成常用众核优化方法的代码框架。经过实验分析,采用该自动转换工具生成的Athread代码相较于人工编写的OpenACC*加速的程序有更高的加速比,特别是对多个核心段进行众核化加速时的加速比相差15%,验证该转换工具具有很好的实用性。
关键词
加速
线程
库
代码生成
模板引擎
语法分析
众核处理器
神威·太湖之光
高性能计算
Keywords
athread
library
code generation
template engine
syntactic analysis
many-core processor
Sunway Taihulight
high performance computing
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
神威·太湖之光上排列熵算法异构并行加速
被引量:
1
2
作者
周倩
梁建国
傅游
机构
山东科技大学计算机科学与工程学院
出处
《计算机工程与设计》
北大核心
2023年第2期400-406,共7页
基金
国家重点研发计划基金项目(2017YFB0202002)。
文摘
为增加检测突变信号的时效性,提高各种故障检测系统的效率,提出在“神威·太湖之光”上基于两级并行模式改进的排列熵(PE)算法。在节点间采用MPI(信息传递接口)并行编程模型,通过对等模式轮询调度方式解决多文件负载不均衡问题;在核组内采用Athread(加速线程库)并行编程模型,通过相空间构建重构矩阵,实现从核级数据划分;采用双缓冲技术实现从核计算与访存的重叠,减少主从通信时间;利用DMA通信和重组传输数据的方法,减少主从通信次数。使用15个LDK UER204滚动轴承全寿命周期实验数据进行测试,结果表明,单核组性能较主核版本最高可获得11.86倍加速,128核组最高实现123.73倍的性能提升。
关键词
SW26010处理器
信息传递接口(MPI)
加速
线程
库
(
athread
)
负载均衡
双缓冲
Keywords
SW26010 processor
MPI
athread
load balancing
double buffering
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于申威26010处理器的大规模量子傅里叶变换模拟
被引量:
3
3
作者
刘晓楠
荆丽娜
王立新
王美玲
机构
信息工程大学网络空间安全学院
郑州大学中原网络安全研究院
出处
《计算机科学》
CSCD
北大核心
2020年第8期93-97,共5页
基金
国家自然科学基金项目(61972413,61701539)
文摘
量子计算由于其纠缠性和叠加性具有天然的并行优势,然而目前的量子计算设备受限于物理实现的工艺水平,距离可发挥巨大计算能力并解决有现实意义的实际问题还需要一定时间的技术积累和突破。因此,采用经典计算机对量子计算进行模拟成为验证量子算法的有效途径。量子傅里叶变换(Quantum Fourier Transform,QFT)是许多量子算法的关键组成部分,它涉及相位估计、求阶、因子等问题。对量子傅里叶变换的研究和大规模模拟实现,可以有效促进相关量子算法的研究、验证以及优化。文中使用我国自主研发的超级计算机——“神威·太湖之光”对大规模量子傅里叶变换进行模拟,并根据申威26010处理器异构并行的特点,采用MPI、加速线程库以及通信与计算隐藏技术进行优化。通过Shor算法中求解周期部分的运算来验证量子傅里叶变换模拟的正确性,实现了46位量子比特QFT算法的模拟和优化,为其他量子算法在超算平台上的验证优化以及新量子算法的提出提供了参考。
关键词
量子傅里叶变换
申威26010
MPI
加速
线程
库
Shor算法
Keywords
Quantum fourier transform
SW26010
MPI
Accelerated thread library
Shor algorithm
分类号
TP385 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
国产神威环境下Athread代码生成工具的设计与开发
刘加伟
郭强
庄园
张海红
王利
曾云辉
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
2
神威·太湖之光上排列熵算法异构并行加速
周倩
梁建国
傅游
《计算机工程与设计》
北大核心
2023
1
下载PDF
职称材料
3
基于申威26010处理器的大规模量子傅里叶变换模拟
刘晓楠
荆丽娜
王立新
王美玲
《计算机科学》
CSCD
北大核心
2020
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部