期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
C870流处理器上的大型矩阵计算方法
1
作者 贾丹 陈庆奎 《微计算机信息》 北大核心 2008年第24期303-305,共3页
C870流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用。根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏... C870流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用。根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏内存访问的延迟,从而提高存储系统的带宽。并首次提出了在C870流处理器上的使用芯片上共享内存(On-chip Shared Memory)的大型矩阵的计算方法,并用5000*5000和2000*2000的方形矩阵进行优化实验,实验结果证明了使用芯片上共享内存优化计算,可以使浮点性能提高7倍多。 展开更多
关键词 c870流处理器 矩阵计算 芯片上共享内存
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部