期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
CUDA——了解和使用共享内存
下载PDF
职称材料
导出
摘要
CUDA开发人员面临的最重要的性能挑战之一就是如何充分利用本地多处理器内存资源,如共享内存、常量内存,以及寄存器。原因就是我们上一篇文章中讨论的,虽然全局内存可以提供超过60GB/秒的速度,但这对于只获取使用一次的数据来说,仅相当于15gf/秒——要获得更高的性能则要求能够重用本地数据。CUDA软件和硬件设计师做了~些出色的工作,以隐藏全局内存的延迟和全局内存的带宽限制——但这都是以本地数据重用为前提的。
作者
Rob Farber
机构地区
西北太平洋国家实验室
出处
《程序员》
2008年第11期114-115,共2页
Programmer
关键词
共享内存
内存资源
多处理器
数据重用
带宽限制
寄存器
设计师
性能
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
TP316.7 [自动化与计算机技术—计算机软件与理论]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
1
卢立托,李攀峰,马洪浩.
基于GPU的不规则三角网向规则格网数字高程模型转换算法优化[J]
.计算机应用,2015,35(A01):32-34.
被引量:2
2
彭爽,蒋荣欣.
面向高清视频监控系统的实时运动检测算法[J]
.计算机工程,2014,40(11):288-291.
被引量:9
3
王东滨,胡铭曾,智慧,余翔湛.
面向网络数据实时检测的多线程内存管理技术[J]
.高技术通讯,2008,18(12):1231-1235.
被引量:2
4
邹岩,杨志义,张凯龙.
CUDA并行程序的内存访问优化技术研究[J]
.计算机测量与控制,2009,17(12):2504-2506.
被引量:17
5
张一凡,余小清,安炫东,万旺根.
一种基于CUDA的局部敏感哈希算法[J]
.应用科学学报,2015,33(5):550-558.
被引量:1
6
赵镇辉,黄承晟,周敏奇,周傲英.
分布式内存数据库系统的容错管理[J]
.华东师范大学学报(自然科学版),2016(5):27-35.
被引量:1
7
王孝红,韩丹,景绍洪.
组态软件上位机监控系统设计与开发[J]
.信息技术与信息化,2005(6):78-80.
被引量:8
8
吴顺鹏.
组态软件上位机监控系统设计与开发[J]
.科技信息,2008(21):67-67.
被引量:3
9
张樱,张云泉,龙国平.
基于OpenCL的图像模糊化算法优化研究[J]
.计算机科学,2012,39(3):260-264.
被引量:6
10
陈鲍孜,吴庆波,谭郁松.
应用协同的进程组内存管理支撑技术[J]
.计算机工程与科学,2014,36(1):57-62.
被引量:2
程序员
2008年 第11期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部