期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向访问模式的多核末级Cache优化方法 被引量:2
1
作者 刘胜 陈海燕 +1 位作者 葛磊磊 刘仲 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第2期79-85,共7页
多核处理器架构已经成为当前处理器的主流趋势,应用程序中访问模式的多样性给多核处理器的末级Cache带来了许多挑战。提出了访问模式的多核末级Cache优化方法,它包含"可配置的共享私有Cache划分"、"可配置的旁路Cache策... 多核处理器架构已经成为当前处理器的主流趋势,应用程序中访问模式的多样性给多核处理器的末级Cache带来了许多挑战。提出了访问模式的多核末级Cache优化方法,它包含"可配置的共享私有Cache划分"、"可配置的旁路Cache策略"和"优先权替换策略"三个协同递进的层次。通过使用该方法,程序员能够灵活地改变末级Cache执行行为,从而高效地适应应用程序访问模式的变化。实验结果表明,提出的方法能够显著降低末级Cache的缺失率,进而提高系统的整体性能。 展开更多
关键词 多核处理器 末级cache 访问模式 共享私有cache划分 旁路cache 优先权替换
下载PDF
片上多核处理器末级共享Cache可重用数据预测机制 被引量:1
2
作者 韩立敏 高德远 +2 位作者 樊晓桠 史莉雯 安建峰 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第6期1505-1509,共5页
为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问... 为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问信息过滤出会被重复使用的数据,并将其保存在片上专用存储器中。仿真结果表明:本文的可重用数据预测机制将IPC(Instruction per clock)平均提高了2.9%,平均减少了应用程序中22.69%的有害替换,有效地减少了Cache抖动。 展开更多
关键词 计算机系统结构 多核处理器 冲突缺失 cache抖动 共享cache
下载PDF
位置信息与替换概率相结合的多核共享Cache管理机制
3
作者 徐金波 庞征斌 李琰 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第5期32-38,共7页
多核系统中末级Cache是影响整体性能的关键。为了提出一种细粒度、低延迟、低代价的末级共享Cache资源管理机制,将系统性能目标转换为每个内核当前占用Cache资源的替换概率,以决定每个内核能够提供的被替换资源的数量;对某个需要增加Ca... 多核系统中末级Cache是影响整体性能的关键。为了提出一种细粒度、低延迟、低代价的末级共享Cache资源管理机制,将系统性能目标转换为每个内核当前占用Cache资源的替换概率,以决定每个内核能够提供的被替换资源的数量;对某个需要增加Cache资源的内核,从可提供被替换资源的候选内核中选出距离较近且替换概率较高的一个内核,并以Cache块为粒度进行替换,从而实现Cache资源在不同内核间的动态划分。与传统以相联度为粒度的粗粒度替换机制相比,以Cache块为单位的替换机制具有更细的替换粒度,灵活性更高。另外,通过将位置信息和替换概率结合,保证了Cache资源与相应内核在物理布局上的收敛,降低了访问延迟。同时,所提出的方法只需要增加极少的硬件代价。实验结果表明,根据实验场景和对比对象的不同,所提方法与其他已有研究成果相比,可以实现从6.8%到22.7%的性能提升。 展开更多
关键词 多核系统 末级cache 动态划分 替换策略
下载PDF
多级缓存模式下的数据块替换优化算法 被引量:3
4
作者 兰丽 《计算机工程》 CAS CSCD 2013年第4期78-81,共4页
多数处理器中采用多级包含的cache存储层次,现有的末级cache块替换算法带来的性能开销较大。针对该问题,提出一种优化的末级cache块替换算法PLI,在选择丢弃块时考虑其在上级cache的访问频率,以较小的代价选出最优的LLC替换块。在时钟精... 多数处理器中采用多级包含的cache存储层次,现有的末级cache块替换算法带来的性能开销较大。针对该问题,提出一种优化的末级cache块替换算法PLI,在选择丢弃块时考虑其在上级cache的访问频率,以较小的代价选出最优的LLC替换块。在时钟精确模拟器上的评测结果表明,该算法较原算法性能平均提升7%。 展开更多
关键词 cache替换算法 LRU算法 PLI算法 cache 末级cache 包容cache
下载PDF
众核系统私有存储自适应共享化架构设计与实现 被引量:1
5
作者 叶英 刘佩林 《计算机与现代化》 2013年第4期48-52,56,共6页
众核架构的发展与共享化数据模型的普及,使共享型、私有型存储架构不再胜任。综合两者的Cooperative Caching虽对多核系统表现良好,但对众核系统,其对被替换数据块的唯一保留,导致大量片上长距离访存,增加片上通信,影响整体性能。对此,... 众核架构的发展与共享化数据模型的普及,使共享型、私有型存储架构不再胜任。综合两者的Cooperative Caching虽对多核系统表现良好,但对众核系统,其对被替换数据块的唯一保留,导致大量片上长距离访存,增加片上通信,影响整体性能。对此,本文提出私有存储自适应共享化架构:允许被替换数据块多副本保留,并自适应控制保留数量。仿真结果显示,该架构较Cooperative Caching片上通信量平均减少12.8%,最好减少32.7%,整体性能提高9.1%;证明其在众核、共享化环境下性能出色。 展开更多
关键词 众核处理架构 末级cache管理 被替换数据块保留
下载PDF
面向多线程应用的片上多核处理器私有LLC优化
6
作者 吴建宇 彭蔓蔓 《计算机工程》 CAS CSCD 北大核心 2015年第1期316-321,共6页
片上多核处理器已逐渐取代传统超标量处理器成为集成电路设计的主流结构,但芯片的存储墙问题依旧是设计的一个难题。CMP通过大容量的末级高速缓存来缓解访存压力。在软件编程模式向多线程并行方式转变的背景下,针对多线程应用在多核处... 片上多核处理器已逐渐取代传统超标量处理器成为集成电路设计的主流结构,但芯片的存储墙问题依旧是设计的一个难题。CMP通过大容量的末级高速缓存来缓解访存压力。在软件编程模式向多线程并行方式转变的背景下,针对多线程应用在多核处理器上的Cache访问特征,提出一种面向私有末级Cache的优化算法,通过硬件缓冲器记录处理器访存地址,从而实现共享数据在Cache间的传递机制,有效降低Cache失效开销。实验结果表明,在硬件开销不超过Cache部件0.1%的情况下,测试用例平均加速比为1.13。 展开更多
关键词 片上多核处理器 存储墙 末级cache 失效开销 缓冲器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部