期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
C870流处理器上的大型矩阵计算方法
1
作者
贾丹
陈庆奎
《微计算机信息》
北大核心
2008年第24期303-305,共3页
C870流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用。根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏...
C870流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用。根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏内存访问的延迟,从而提高存储系统的带宽。并首次提出了在C870流处理器上的使用芯片上共享内存(On-chip Shared Memory)的大型矩阵的计算方法,并用5000*5000和2000*2000的方形矩阵进行优化实验,实验结果证明了使用芯片上共享内存优化计算,可以使浮点性能提高7倍多。
展开更多
关键词
c870
流处理器
矩阵计算
芯片上共享内存
下载PDF
职称材料
题名
C870流处理器上的大型矩阵计算方法
1
作者
贾丹
陈庆奎
机构
上海理工大学计算机与电气工程学院
出处
《微计算机信息》
北大核心
2008年第24期303-305,共3页
文摘
C870流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用。根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏内存访问的延迟,从而提高存储系统的带宽。并首次提出了在C870流处理器上的使用芯片上共享内存(On-chip Shared Memory)的大型矩阵的计算方法,并用5000*5000和2000*2000的方形矩阵进行优化实验,实验结果证明了使用芯片上共享内存优化计算,可以使浮点性能提高7倍多。
关键词
c870
流处理器
矩阵计算
芯片上共享内存
Keywords
c870 stream processor
Matrix Calculation
On-chip Shared Memory
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
C870流处理器上的大型矩阵计算方法
贾丹
陈庆奎
《微计算机信息》
北大核心
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部