期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
任务并行编程模型下排列熵算法的并行实现
1
作者
李维权
《软件工程》
2024年第2期40-43,共4页
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度...
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。
展开更多
关键词
排列熵算法
任务并行编程模型
OPENMP
StarPU
下载PDF
职称材料
用数据驱动的编程模型并行多重网格应用
被引量:
1
2
作者
郭杰
高希然
+2 位作者
陈莉
傅游
刘颖
《计算机科学》
CSCD
北大核心
2020年第8期32-40,共9页
多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植...
多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植到“天河二号”和“神威·太湖之光”两种不同架构的国产超算平台上,展示了使用该语言对计算循环、通信代码的任务并行方法,验证了AceMesh语言的跨平台性能可移植性。文中定性地分析了该应用的任务图特征和计算-通信重叠的特点,并分别在两个并行计算平台上将其与现有编程模型MPI/OpenMP和MPI/OpenACC进行性能对比,分析了AceMesh任务图并行程序对访存性能和通信-计算重叠的优化效果。实验数据表明,相比传统的并行编程方法,AceMesh在“神威·太湖之光”和“天河二号”平台上分别最高获得了1.19X和1.85X的性能加速。最后,针对该应用在不同网格层的通信特点以及通信序列化导致大量通信不能隐藏的问题,提出了未来的研究方向。
展开更多
关键词
多重网格
MPI遗产应用
数据驱动的
任务并行编程模型
异构众核
计算-通信重叠
下载PDF
职称材料
神威平台上AceMesh编程模型的构图优化
3
作者
叶雨曦
傅游
+3 位作者
梁建国
孟现粉
刘颖
花嵘
《山东科技大学学报(自然科学版)》
CAS
北大核心
2021年第4期76-85,共10页
面向高性能计算领域的多核、众核处理器飞速发展,为了降低并行编程的难度,提高并行计算效率,数据驱动的并行编程模型成为高性能计算领域的研究热点。AceMesh是数据流驱动的、支持多核和众核异构平台的任务并行编程模型,能自动发掘结构...
面向高性能计算领域的多核、众核处理器飞速发展,为了降低并行编程的难度,提高并行计算效率,数据驱动的并行编程模型成为高性能计算领域的研究热点。AceMesh是数据流驱动的、支持多核和众核异构平台的任务并行编程模型,能自动发掘结构化网格应用中存在的数据驱动的任务图并行性。但如果任务粒度划分较细,其构图过程会造成很大开销。本研究结合“申威26010”异构众核处理器的结构特点,从主、从核通信优化、内存池、无后继任务收集等方面对AceMesh构图过程进行优化,并采用航天飞行器应用中的7个热点子程序对优化效果进行测试。测试数据表明以上优化取得5倍的加速。为验证构图优化对AceMesh整体性能的提升,对航天飞行器应用分别在Acemesh和神威OpenACC的加速效果进行了测试,优化后的AceMesh加速效果约为神威OpenACC的1.5倍。
展开更多
关键词
DAG构图优化
任务并行编程模型
神威·太湖之光
申威处理器
性能
下载PDF
职称材料
题名
任务并行编程模型下排列熵算法的并行实现
1
作者
李维权
机构
青岛港湾职业技术学院信息与电气工程学院
出处
《软件工程》
2024年第2期40-43,共4页
基金
西兴技术智能语音系统(02030061003)。
文摘
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。
关键词
排列熵算法
任务并行编程模型
OPENMP
StarPU
Keywords
permutation entropy algorithm
task parallel programming model
OpenMP
StarPU
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
用数据驱动的编程模型并行多重网格应用
被引量:
1
2
作者
郭杰
高希然
陈莉
傅游
刘颖
机构
山东科技大学计算机科学与工程学院
中国科学院计算技术研究所计算机体系结构国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2020年第8期32-40,共9页
基金
国家自然科学基金(61521092)
国家重点研发计划(2016YFB0200803)
山东省重点研发计划(2019GGX101066)。
文摘
多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植到“天河二号”和“神威·太湖之光”两种不同架构的国产超算平台上,展示了使用该语言对计算循环、通信代码的任务并行方法,验证了AceMesh语言的跨平台性能可移植性。文中定性地分析了该应用的任务图特征和计算-通信重叠的特点,并分别在两个并行计算平台上将其与现有编程模型MPI/OpenMP和MPI/OpenACC进行性能对比,分析了AceMesh任务图并行程序对访存性能和通信-计算重叠的优化效果。实验数据表明,相比传统的并行编程方法,AceMesh在“神威·太湖之光”和“天河二号”平台上分别最高获得了1.19X和1.85X的性能加速。最后,针对该应用在不同网格层的通信特点以及通信序列化导致大量通信不能隐藏的问题,提出了未来的研究方向。
关键词
多重网格
MPI遗产应用
数据驱动的
任务并行编程模型
异构众核
计算-通信重叠
Keywords
Multigrid
MPI legacy application
Data-driven task parallel programming model
Heterogeneous many-core
Computation-communication overlap
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
神威平台上AceMesh编程模型的构图优化
3
作者
叶雨曦
傅游
梁建国
孟现粉
刘颖
花嵘
机构
山东科技大学计算机科学与工程学院
中科寒武纪科技股份有限公司
中国科学院计算技术研究所
出处
《山东科技大学学报(自然科学版)》
CAS
北大核心
2021年第4期76-85,共10页
基金
国家重点研发计划项目(2016YFB0200803)
山东省重点研发计划项目(2019GGX101066)。
文摘
面向高性能计算领域的多核、众核处理器飞速发展,为了降低并行编程的难度,提高并行计算效率,数据驱动的并行编程模型成为高性能计算领域的研究热点。AceMesh是数据流驱动的、支持多核和众核异构平台的任务并行编程模型,能自动发掘结构化网格应用中存在的数据驱动的任务图并行性。但如果任务粒度划分较细,其构图过程会造成很大开销。本研究结合“申威26010”异构众核处理器的结构特点,从主、从核通信优化、内存池、无后继任务收集等方面对AceMesh构图过程进行优化,并采用航天飞行器应用中的7个热点子程序对优化效果进行测试。测试数据表明以上优化取得5倍的加速。为验证构图优化对AceMesh整体性能的提升,对航天飞行器应用分别在Acemesh和神威OpenACC的加速效果进行了测试,优化后的AceMesh加速效果约为神威OpenACC的1.5倍。
关键词
DAG构图优化
任务并行编程模型
神威·太湖之光
申威处理器
性能
Keywords
DAG′s composition optimization
task-based parallel programming model
Sunway TaihuLight
SW26010 processor
performance
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
任务并行编程模型下排列熵算法的并行实现
李维权
《软件工程》
2024
0
下载PDF
职称材料
2
用数据驱动的编程模型并行多重网格应用
郭杰
高希然
陈莉
傅游
刘颖
《计算机科学》
CSCD
北大核心
2020
1
下载PDF
职称材料
3
神威平台上AceMesh编程模型的构图优化
叶雨曦
傅游
梁建国
孟现粉
刘颖
花嵘
《山东科技大学学报(自然科学版)》
CAS
北大核心
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部