期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
CSRL与HUMBLE:对应特定问题的专用通用工具
1
作者 董德基 徐静文 《日本的科学与技术》 1989年第1期18-25,共8页
关键词 csrl HUMBLE 人工智能
下载PDF
一种提高SpMV向量化性能的新型稀疏矩阵存储格式 被引量:4
2
作者 刘芳芳 杨超 《数值计算与计算机应用》 CSCD 2014年第4期269-276,共8页
稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般... 稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般都采用SIMD向量化技术进行加速,但是传统CSR格式的稀疏矩阵向量乘由于访存的不规则性,不能直接采用向量化技术进行加速,为了利用SIMD技术,对具有局部性特征的稀疏矩阵,提出了新的稀疏矩阵存储格式CSRL(Compressed Sparse Row with Local information),该格式可以减少SpMV时内存访问次数,并且能够充分利用硬件的SIMD向量化技术进行读取和计算,提高了SpMV性能.实验表明,该方法相比国际著名商业库Intel MKL10.3版平均性能提升达到29.5%,最高可达89%的性能提升. 展开更多
关键词 稀疏矩阵 稀疏矩阵向量乘 向量化 局部性 csrl
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部