期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ESCA系统的层次化显式访存机制研究
被引量:
2
1
作者
饶金理
吴丹
+4 位作者
陈攀
董冕
邓承诺
戴葵
邹雪城
《计算机工程》
CAS
CSCD
北大核心
2011年第22期24-27,34,共5页
针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏...
针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏能够占据整体运行时间的56%,并获得1.5倍的加速比,能弥补计算与存储访问间的速度差异,提高系统计算效率。
展开更多
关键词
混合计算
存储
墙
多核处理器
ESCA系统
层次
化显示
存储
访问
延迟隐藏
下载PDF
职称材料
基于现代硬件的并行内存排序方法综述
被引量:
11
2
作者
郭诚欣
陈红
+2 位作者
孙辉
李翠平
吴天贞
《计算机学报》
EI
CSCD
北大核心
2017年第9期2070-2092,共23页
研究了现代硬件上的并行内存排序方法,对其研究现状与进展进行了综述.首先简要阐述了经典排序算法以及排序网络的优缺点,分析其并行优化的适用性,然后从现代CPU处理器设备(多核、配备大内存)、图形处理器(GPU)、现场可编程逻辑门阵列(FP...
研究了现代硬件上的并行内存排序方法,对其研究现状与进展进行了综述.首先简要阐述了经典排序算法以及排序网络的优缺点,分析其并行优化的适用性,然后从现代CPU处理器设备(多核、配备大内存)、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)等新型处理器设备介绍现有排序方法的研究成果.处理器设备的架构不同,对排序算法的优化策略也不同,现代CPU主要利用线程的本地存储层次优化数据在存储单元中的排列,以减少访存次数及减少访存缺失,同时利用单指令多数据流技术(SIMD),以提高算法的数据级并行度;GPU则需要将多个线程组织成线程块,依靠共享内存提高线程块的访存速度,而在线程块内则使用单指令多线程(SIMT)技术提高线程的执行效率;FPGA则更靠近于硬件底层,受到自身的资源限制,FPGA的优化策略主要依靠硬件描述语言或高级综合语言优化电路的设计,提高资源利用率的同时增加FPGA的吞吐量.现有的成果表明,GPU的并行内存排序性能优于CPU端上的并行内存排序性能.作者最后对未来的研究方向进行了展望.
展开更多
关键词
现代硬件处理器
排序算法
存储访问层次
并行优化
图形处理器
现场可编程逻辑门阵列
下载PDF
职称材料
CPU和GPU协同处理的光学卫星遥感影像正射校正方法
被引量:
33
3
作者
方留杨
王密
李德仁
《测绘学报》
EI
CSCD
北大核心
2013年第5期668-675,共8页
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GP...
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。
展开更多
关键词
正射校正
CPU和GPU协同处理
层次
性分块
配置选择优化
存储
层次
性
访问
下载PDF
职称材料
题名
基于ESCA系统的层次化显式访存机制研究
被引量:
2
1
作者
饶金理
吴丹
陈攀
董冕
邓承诺
戴葵
邹雪城
机构
华中科技大学电子科学与技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第22期24-27,34,共5页
基金
国家自然科学基金资助项目(NSFC60973035
NSFC60976027)
湖北省自然科学基金资助项目(2010CBD02705)
文摘
针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏能够占据整体运行时间的56%,并获得1.5倍的加速比,能弥补计算与存储访问间的速度差异,提高系统计算效率。
关键词
混合计算
存储
墙
多核处理器
ESCA系统
层次
化显示
存储
访问
延迟隐藏
Keywords
hybrid computing
memory wall
multi-core processor
Engineering and Scientific Computing Architecture(ESCA) system
hierarchical explicit memory access
hidden of latency
分类号
TP302.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于现代硬件的并行内存排序方法综述
被引量:
11
2
作者
郭诚欣
陈红
孙辉
李翠平
吴天贞
机构
中国人民大学数据工程与知识工程国家教育部重点实验室
中国人民大学信息学院
出处
《计算机学报》
EI
CSCD
北大核心
2017年第9期2070-2092,共23页
基金
国家自然科学基金(61532021
61272137
+1 种基金
61202114)
华为创新研究计划(HIRP 20140507)资助~~
文摘
研究了现代硬件上的并行内存排序方法,对其研究现状与进展进行了综述.首先简要阐述了经典排序算法以及排序网络的优缺点,分析其并行优化的适用性,然后从现代CPU处理器设备(多核、配备大内存)、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)等新型处理器设备介绍现有排序方法的研究成果.处理器设备的架构不同,对排序算法的优化策略也不同,现代CPU主要利用线程的本地存储层次优化数据在存储单元中的排列,以减少访存次数及减少访存缺失,同时利用单指令多数据流技术(SIMD),以提高算法的数据级并行度;GPU则需要将多个线程组织成线程块,依靠共享内存提高线程块的访存速度,而在线程块内则使用单指令多线程(SIMT)技术提高线程的执行效率;FPGA则更靠近于硬件底层,受到自身的资源限制,FPGA的优化策略主要依靠硬件描述语言或高级综合语言优化电路的设计,提高资源利用率的同时增加FPGA的吞吐量.现有的成果表明,GPU的并行内存排序性能优于CPU端上的并行内存排序性能.作者最后对未来的研究方向进行了展望.
关键词
现代硬件处理器
排序算法
存储访问层次
并行优化
图形处理器
现场可编程逻辑门阵列
Keywords
modern hardware processors
sorting algorithm
memory access hierarchy
parallelism optimization
graphics processing unit
field-programmable gate array
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
CPU和GPU协同处理的光学卫星遥感影像正射校正方法
被引量:
33
3
作者
方留杨
王密
李德仁
机构
武汉大学测绘遥感信息工程国家重点实验室
出处
《测绘学报》
EI
CSCD
北大核心
2013年第5期668-675,共8页
基金
国家973计划(2012CB719902)
国家863计划(2011AA120203)
+1 种基金
教育部新世纪优秀人才支持计划(NCET-10-0650)
中央高校基本科研业务费专项资金(2012619020205)
文摘
系统地探讨基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用"层次性分块"策略设计基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的试验结果表明,本文方法可大幅提高光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5 s以内,可满足对海量数据光学卫星遥感影像进行快速正射校正的要求。
关键词
正射校正
CPU和GPU协同处理
层次
性分块
配置选择优化
存储
层次
性
访问
Keywords
orthographic rectification
CPU-GPU co-processing
hierarchical tiling
configuration optimization
memory hierarchical access
分类号
P237 [天文地球—摄影测量与遥感]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于ESCA系统的层次化显式访存机制研究
饶金理
吴丹
陈攀
董冕
邓承诺
戴葵
邹雪城
《计算机工程》
CAS
CSCD
北大核心
2011
2
下载PDF
职称材料
2
基于现代硬件的并行内存排序方法综述
郭诚欣
陈红
孙辉
李翠平
吴天贞
《计算机学报》
EI
CSCD
北大核心
2017
11
下载PDF
职称材料
3
CPU和GPU协同处理的光学卫星遥感影像正射校正方法
方留杨
王密
李德仁
《测绘学报》
EI
CSCD
北大核心
2013
33
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部