期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
CPU-GPU并行矩阵乘法的实现与性能分析
被引量:
11
1
作者
程豪
张云泉
+1 位作者
张先轶
李玉成
《计算机工程》
CAS
CSCD
北大核心
2010年第13期24-26,29,共4页
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过...
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。
展开更多
关键词
混合并行
GPU技术
dgemm程序
加速比
下载PDF
职称材料
题名
CPU-GPU并行矩阵乘法的实现与性能分析
被引量:
11
1
作者
程豪
张云泉
张先轶
李玉成
机构
中国科学院软件研究所并行计算实验室
中国科学院研究生院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第13期24-26,29,共4页
基金
国家自然科学基金资助重点项目(60533020)
国家"863"计划基金资助项目(2006AA01A125
+2 种基金
2009AA01A129
2009AA01A134)
国家重大科研装备研制项目(ZDYZ2008-2-S01)
文摘
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。
关键词
混合并行
GPU技术
dgemm程序
加速比
Keywords
hybrid parallelization
GPU
dgemm
speedup ratio
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
CPU-GPU并行矩阵乘法的实现与性能分析
程豪
张云泉
张先轶
李玉成
《计算机工程》
CAS
CSCD
北大核心
2010
11
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部