期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
共轭梯度法在GPU及Xeon Phi下的并行优化及比较
被引量:
1
1
作者
黄敏
丁萍
罗海飚
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第11期35-46,53,共13页
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据...
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好.
展开更多
关键词
共轭梯度法
图形处理器
XEON
PHI
并行优化
稀疏矩阵向量乘
下载PDF
职称材料
题名
共轭梯度法在GPU及Xeon Phi下的并行优化及比较
被引量:
1
1
作者
黄敏
丁萍
罗海飚
机构
华南理工大学
软件
学院
广州中国科学院软件应用技术研究所智能视频实验室
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第11期35-46,53,共13页
基金
广东省公益研究与能力建设专项(2014A040401018)
广东省促进科技服务业发展计划项目(2013B040404009)
广东省新媒体与品牌传播创新应用重点实验室资助项目(2013WSYS0002)
文摘
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好.
关键词
共轭梯度法
图形处理器
XEON
PHI
并行优化
稀疏矩阵向量乘
Keywords
conjugate gradient method
graphics processing unit
Xeon Phi
parallel optimization
sparse matrix-vector multiplication
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
共轭梯度法在GPU及Xeon Phi下的并行优化及比较
黄敏
丁萍
罗海飚
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部