期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于申威1600的3级BLAS GEMM函数优化 被引量:10
1
作者 刘昊 刘芳芳 +2 位作者 张鹏 杨超 蒋丽娟 《计算机系统应用》 2016年第12期234-239,共6页
BLAS是当前科学计算领域重要的底层支持数学库之一,其中的3级BLAS函数应用最为广泛.本文基于国产申威1600平台,提出了一种基础线性代数库BLAS的三级函数通用矩阵乘GEMM的高性能实现方法.在单核上,使用乘加指令、循环展开、软件流水线指... BLAS是当前科学计算领域重要的底层支持数学库之一,其中的3级BLAS函数应用最为广泛.本文基于国产申威1600平台,提出了一种基础线性代数库BLAS的三级函数通用矩阵乘GEMM的高性能实现方法.在单核上,使用乘加指令、循环展开、软件流水线指令重排、SIMD向量化运算、寄存器分块技术等与平台架构相关的技术手段,实现汇编级手工优化;在多核上,提出了适用于该平台的多线程加速方案.实验结果显示,在单核串行性能测试中,与知名开源数学库Goto BLAS相比,我们实现了平均4.72倍的加速效果;在多核并行扩展测试中,4线程版的性能则平均达到了单线程版性能的3.02倍. 展开更多
关键词 申威1600 三级blas GEMM 高性能计算 多核
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部