期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
两级Trace Cache的设计与研究
1
作者
康海涛
唐朔飞
+2 位作者
季振洲
王凯峰
吴代辉
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2006年第9期1450-1454,共5页
通过引入二级trace cache做为一级trace cache补充,捕获那些由于一级trace cache容量冲突而被换出的trace,能够部分缓解trace cache容量失效问题.在进一步提高处理器的性能的同时,也大大降低了为构造trace而对指令cache带宽的要求,空闲...
通过引入二级trace cache做为一级trace cache补充,捕获那些由于一级trace cache容量冲突而被换出的trace,能够部分缓解trace cache容量失效问题.在进一步提高处理器的性能的同时,也大大降低了为构造trace而对指令cache带宽的要求,空闲的指令cache带宽可以进一步被trace的预构及其他一些技术所利用.实验表明,在64KB一级Trace Cache的基础上,引入一个容量为1MB的二级Trace Cache后,对于go和gcc这类工作集较大的程序,处理器的性能提高了13%,指令cache带宽要求下降27%.
展开更多
关键词
TRACE
cache
多级cache
容量失效
TRACE
并行性
下载PDF
职称材料
多级缓存模式下的数据块替换优化算法
被引量:
3
2
作者
兰丽
《计算机工程》
CAS
CSCD
2013年第4期78-81,共4页
多数处理器中采用多级包含的cache存储层次,现有的末级cache块替换算法带来的性能开销较大。针对该问题,提出一种优化的末级cache块替换算法PLI,在选择丢弃块时考虑其在上级cache的访问频率,以较小的代价选出最优的LLC替换块。在时钟精...
多数处理器中采用多级包含的cache存储层次,现有的末级cache块替换算法带来的性能开销较大。针对该问题,提出一种优化的末级cache块替换算法PLI,在选择丢弃块时考虑其在上级cache的访问频率,以较小的代价选出最优的LLC替换块。在时钟精确模拟器上的评测结果表明,该算法较原算法性能平均提升7%。
展开更多
关键词
cache
替换算法
LRU算法
PLI算法
多级cache
末级
cache
包容
cache
下载PDF
职称材料
基于流访问特征的多级硬件预取
被引量:
1
3
作者
贾迅
翁志强
胡向东
《计算机工程》
CAS
CSCD
北大核心
2016年第1期51-55,共5页
硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。...
硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。针对上述问题,以流访问特征的预取为基础,提出一种同时对多级Cache进行预取的方法,并对流访问特征的预取进行实现。基于SPEC CPU2000测试程序集的实验结果表明,与仅对一级Cache进行预取相比,对多级Cache同时进行预取可以将整数程序的性能平均提升2.11%,最高提升11.19%,浮点程序的性能平均提升3.08%,最高提升12.77%。
展开更多
关键词
存储墙
流访问
处理器
多级cache
硬件预取
下载PDF
职称材料
CMFSim:高可配可扩展的缓存微架构功能模拟器
4
作者
宋双洋
赵姗
杨秋松
《计算机系统应用》
2017年第10期36-43,共8页
作为提高CPU读取和存储数据的效率,弥补与主存之间存取速度差距的有效策略,CPU的缓存(Cache)充分利用其对数据使用的局部性原理,对最近或最常使用的数据进行暂存,对CPU的性能起着决定性作用.缓存的微架构正是决定缓存性能的关键性因素....
作为提高CPU读取和存储数据的效率,弥补与主存之间存取速度差距的有效策略,CPU的缓存(Cache)充分利用其对数据使用的局部性原理,对最近或最常使用的数据进行暂存,对CPU的性能起着决定性作用.缓存的微架构正是决定缓存性能的关键性因素.然而,现代先进的CPU缓存都具备极为复杂的结构,存在多种策略、多种硬件算法和多个层级等不同维度的设计,从硬件上直接设计和论证不仅耗时而且成本很高,Cache微架构模拟器正是用软件方法对硬件微架构进行模拟和仿真.设计一款结构优良的缓存,对不同微架构进行评估,是一件具有深远意义的工作.本文从硬件结构出发,设计实现了一款多级、高可配、高可扩展的缓存微架构功能模拟器CMFSim(Cache microarchitecture functional simulator),实现了常见的缓存策略和硬件算法,可以进行给定配置下的缓存功能的模拟,从而分析配置参数与缓存性能间的关系.
展开更多
关键词
多级cache
cache
微架构
cache
模拟器
下载PDF
职称材料
题名
两级Trace Cache的设计与研究
1
作者
康海涛
唐朔飞
季振洲
王凯峰
吴代辉
机构
哈尔滨工业大学计算机科学与工程系
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2006年第9期1450-1454,共5页
文摘
通过引入二级trace cache做为一级trace cache补充,捕获那些由于一级trace cache容量冲突而被换出的trace,能够部分缓解trace cache容量失效问题.在进一步提高处理器的性能的同时,也大大降低了为构造trace而对指令cache带宽的要求,空闲的指令cache带宽可以进一步被trace的预构及其他一些技术所利用.实验表明,在64KB一级Trace Cache的基础上,引入一个容量为1MB的二级Trace Cache后,对于go和gcc这类工作集较大的程序,处理器的性能提高了13%,指令cache带宽要求下降27%.
关键词
TRACE
cache
多级cache
容量失效
TRACE
并行性
Keywords
trace
cache
multi-level
cache
capacity miss
trace, parallelism
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
多级缓存模式下的数据块替换优化算法
被引量:
3
2
作者
兰丽
机构
兰州交通大学电子与信息工程学院
出处
《计算机工程》
CAS
CSCD
2013年第4期78-81,共4页
文摘
多数处理器中采用多级包含的cache存储层次,现有的末级cache块替换算法带来的性能开销较大。针对该问题,提出一种优化的末级cache块替换算法PLI,在选择丢弃块时考虑其在上级cache的访问频率,以较小的代价选出最优的LLC替换块。在时钟精确模拟器上的评测结果表明,该算法较原算法性能平均提升7%。
关键词
cache
替换算法
LRU算法
PLI算法
多级cache
末级
cache
包容
cache
Keywords
cache
replacement algorithm
Least Recently Used(LRU) algorithm
PLI algorithm
multi-level
cache
Last-level
cache
(LLC)
inclusive-
cache
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于流访问特征的多级硬件预取
被引量:
1
3
作者
贾迅
翁志强
胡向东
机构
上海高性能集成电路设计中心
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第1期51-55,共5页
基金
"核高基"重大专项"超级计算机处理器研发"(2013ZX01028-001-001-001)
文摘
硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。针对上述问题,以流访问特征的预取为基础,提出一种同时对多级Cache进行预取的方法,并对流访问特征的预取进行实现。基于SPEC CPU2000测试程序集的实验结果表明,与仅对一级Cache进行预取相比,对多级Cache同时进行预取可以将整数程序的性能平均提升2.11%,最高提升11.19%,浮点程序的性能平均提升3.08%,最高提升12.77%。
关键词
存储墙
流访问
处理器
多级cache
硬件预取
Keywords
memory wall
stream access
processor
multiple level
cache
hardware prefetching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
CMFSim:高可配可扩展的缓存微架构功能模拟器
4
作者
宋双洋
赵姗
杨秋松
机构
中国科学院软件研究所
中国科学院大学
出处
《计算机系统应用》
2017年第10期36-43,共8页
基金
国家"核高基"科技重大专项(2014ZX01029101-002)
文摘
作为提高CPU读取和存储数据的效率,弥补与主存之间存取速度差距的有效策略,CPU的缓存(Cache)充分利用其对数据使用的局部性原理,对最近或最常使用的数据进行暂存,对CPU的性能起着决定性作用.缓存的微架构正是决定缓存性能的关键性因素.然而,现代先进的CPU缓存都具备极为复杂的结构,存在多种策略、多种硬件算法和多个层级等不同维度的设计,从硬件上直接设计和论证不仅耗时而且成本很高,Cache微架构模拟器正是用软件方法对硬件微架构进行模拟和仿真.设计一款结构优良的缓存,对不同微架构进行评估,是一件具有深远意义的工作.本文从硬件结构出发,设计实现了一款多级、高可配、高可扩展的缓存微架构功能模拟器CMFSim(Cache microarchitecture functional simulator),实现了常见的缓存策略和硬件算法,可以进行给定配置下的缓存功能的模拟,从而分析配置参数与缓存性能间的关系.
关键词
多级cache
cache
微架构
cache
模拟器
Keywords
multi-level
cache
cache
microarchitecture
cache
simulator
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
两级Trace Cache的设计与研究
康海涛
唐朔飞
季振洲
王凯峰
吴代辉
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2006
0
下载PDF
职称材料
2
多级缓存模式下的数据块替换优化算法
兰丽
《计算机工程》
CAS
CSCD
2013
3
下载PDF
职称材料
3
基于流访问特征的多级硬件预取
贾迅
翁志强
胡向东
《计算机工程》
CAS
CSCD
北大核心
2016
1
下载PDF
职称材料
4
CMFSim:高可配可扩展的缓存微架构功能模拟器
宋双洋
赵姗
杨秋松
《计算机系统应用》
2017
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部