期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
一种面向CMP的可变相联度混合Cache结构 被引量:1
1
作者 晏沛湘 杨先炬 张民选 《电子学报》 EI CAS CSCD 北大核心 2011年第3期656-659,共4页
以V-Way Cache结构为原型,提出一种面向CMP的可变相联度混合Cache结构CMP-VH.CMP-VH将最后一级片上Cache划分成一种优化的私有/共享结构,Tag私有,数据部分私有部分共享.采用基于数据块的重用信息替换策略,提供显式和隐式两种机制在核间... 以V-Way Cache结构为原型,提出一种面向CMP的可变相联度混合Cache结构CMP-VH.CMP-VH将最后一级片上Cache划分成一种优化的私有/共享结构,Tag私有,数据部分私有部分共享.采用基于数据块的重用信息替换策略,提供显式和隐式两种机制在核间对共享数据进行容量划分.并行程序负载SPLASH-2的模拟实验结果表明,CMP-VH具有比单一的私有/共享结构更好的整体性能. 展开更多
关键词 片上多核处理器 混合cache结构 Reuse替换策略
下载PDF
SCMP中共享多端口数据Cache结构的研究
2
作者 黄光奇 《计算机工程与科学》 CSCD 2002年第1期109-109,共1页
关键词 单芯片多处理器 SCMP 多端口数据 cache结构
下载PDF
片上非一致Cache体系结构研究 被引量:1
3
作者 贾小敏 黄彩霞 +2 位作者 张民选 孙彩霞 齐树波 《计算机工程与科学》 CSCD 北大核心 2009年第8期93-98,共6页
随着集成电路制造工艺的发展,片上集成大容量Cache成为微处理器的发展趋势。然而,互连线延迟所占比例越来越大,成为大容量Cache的性能瓶颈,因此需要新的Cache体系结构来克服这些问题。非一致Cache体系结构通过在Cache内部支持多级延迟... 随着集成电路制造工艺的发展,片上集成大容量Cache成为微处理器的发展趋势。然而,互连线延迟所占比例越来越大,成为大容量Cache的性能瓶颈,因此需要新的Cache体系结构来克服这些问题。非一致Cache体系结构通过在Cache内部支持多级延迟和数据块迁移来减少Cache的命中时间,提高性能,从而克服互连线延迟对大容量Cache的限制,已经成为微处理器片上存储结构的研究热点。本文回顾了非一致Cache体系结构模型的研究进展,特别是对片上多核处理器中的非一致Cache体系结构模型进行了详细介绍,比较了不同模型的贡献和不足。最后,对非一致Cache体系结构的发展进行了展望。 展开更多
关键词 非一致cache结构 多级延迟 块迁移 片上多核
下载PDF
多核处理器非一致Cache体系结构延迟优化技术研究综述 被引量:4
4
作者 黄安文 高军 张民选 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期118-124,共7页
非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache... 非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache环境下共享/私有机制中的延迟-容量权衡问题,讨论映射、迁移、复制和搜索等数据管理机制在多核环境下的优缺点.最后,针对基于片上网络(network-on-chip,NoC)互连结构的可扩展CMP体系结构,从NUCA模型优化、数据管理和一致性维护机制3个方面讨论和预测未来CMP NUCA延迟优化领域的发展趋势及面临的挑战性问题. 展开更多
关键词 非一致cache体系结构 多核处理器 片上网络 存储墙 延迟优化
下载PDF
非一致Cache体系结构技术综述 被引量:1
5
作者 吴俊杰 杨学军 《计算机工程与科学》 CSCD 北大核心 2011年第2期51-60,共10页
存储墙问题使得Cache技术的研究始终非常重要。面对日益增长的片上Cache容量,线延迟逐渐成为制约Cache设计的重要因素。为了提供统一的访问延迟,传统的Cache设计方法不得不迁就离处理器最远的Cache Bank的访问时间。为此,研究人员提出... 存储墙问题使得Cache技术的研究始终非常重要。面对日益增长的片上Cache容量,线延迟逐渐成为制约Cache设计的重要因素。为了提供统一的访问延迟,传统的Cache设计方法不得不迁就离处理器最远的Cache Bank的访问时间。为此,研究人员提出了一种非一致Cache结构(NUCA),NUCA几乎成为未来处理器中大容量Cache设计的一种趋势。处理器访问NUCA时,如果在离处理器较近的Bank中发生命中,处理器的等待时间就较短;如果在离处理器较远的Bank中发生命中,处理器的等待时间就较长。本文综述了NUCA技术产生的原因、发展,以及当前最典型的NUCA系统;并且指出了对NUCA技术研究有借鉴的两种多机存储系统技术——NUMA和COMA;最后,提出了NUCA技术研究的关键问题,并给出了相应的解决思路。 展开更多
关键词 非一致cache 线延迟 局部性 多核 非一致存储访问 cache存储结构
下载PDF
分簇处理器中分簇投机的L0 Cache设计
6
作者 杨兵 毛志刚 +1 位作者 陈晓 尹捷明 《微电子学与计算机》 CSCD 北大核心 2010年第7期15-20,共6页
处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内... 处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内简单快速的L0 Cache,较好地隐藏了下级Cache的访问延迟.仿真结果显示在8簇的分簇处理器中,采用4kB,2路组相连的分簇L0 Cache后处理器性能平均提升5.6%,在部分测试程序中达到20%以上. 展开更多
关键词 分簇处理器 cache结构 投机访问
下载PDF
面向机器学习的高性能SIMT处理器cache的设计与实现 被引量:2
7
作者 许晓燕 李涛 +1 位作者 孙哲 邢立冬 《计算机应用与软件》 北大核心 2019年第7期282-286,333,共6页
为了满足机器学习中大数据、并行计算及降低处理器与主存之间的差距等要求,设计基于自主研发的SIMT处理器的流水线cache结构。依据局部性原理与LRU替换算法相结合设计专用的伪LRU替换算法,与通用的轮询、LFU、LRU替换算法共同完成cache... 为了满足机器学习中大数据、并行计算及降低处理器与主存之间的差距等要求,设计基于自主研发的SIMT处理器的流水线cache结构。依据局部性原理与LRU替换算法相结合设计专用的伪LRU替换算法,与通用的轮询、LFU、LRU替换算法共同完成cache替换算法的可配置要求,实现处理器与主存之间的快速交互。采用Xilinx公司virtex ultrascale系列的xcvu440-flga2892-2-e FPGA芯片对设计进行综合。结果表明该结构指令cache最大时延为2.923 ns,数据cache最大时延为3.258 ns,满足SIMT处理器性能要求。 展开更多
关键词 SIMT处理器 流水线cache结构 替换算法
下载PDF
网格Cache若干问题分析 被引量:7
8
作者 陈梅 都志辉 《计算机科学》 CSCD 北大核心 2004年第5期15-17,共3页
网格中资源能力的不均衡和异构特性会给系统造成瓶颈,引起客户端延迟。网格cache系统能够有效地缓解这一问题。本文分析了网格cache的研究目的、网格cache和传统cache的关系,介绍了目前与网格cache相关的研究和网格cache系统设计的若干... 网格中资源能力的不均衡和异构特性会给系统造成瓶颈,引起客户端延迟。网格cache系统能够有效地缓解这一问题。本文分析了网格cache的研究目的、网格cache和传统cache的关系,介绍了目前与网格cache相关的研究和网格cache系统设计的若干问题。 展开更多
关键词 网格cache 异构特性 网格系统 资源共享 网络 分布式cache系统结构
下载PDF
基于NUCA结构的同构单芯片多处理器 被引量:1
9
作者 陈宏铭 林昶志 陈麒安 《中国集成电路》 2011年第11期32-38,54,共8页
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量Cache的发展方向。本文指出同构单芯片多处理器的设计主要有多级Cache设计的数据一致性问题,核间通信问题与外部总线效率问题,我们也说明多处理器设计上的相应解决办法。最后给出... 非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量Cache的发展方向。本文指出同构单芯片多处理器的设计主要有多级Cache设计的数据一致性问题,核间通信问题与外部总线效率问题,我们也说明多处理器设计上的相应解决办法。最后给出单核与双核在性能、功耗的比较,以及双核处理器的布局规划图。利用双核处理器,二级Cache控制器与AXI总线控制器等IP提出一个可供设计AXI总线SoC的非一致Cache体系结构平台。 展开更多
关键词 非一致cache体系结构 同构单芯片多处理器 FMP626 缓存 AXI SOC
下载PDF
面向虚拟共享域划分的自适应迁移与复制机制
10
作者 黄安文 石文强 +1 位作者 高军 张民选 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1583-1591,共9页
传统数据管理机制无法感知分布式cache布局的非一致访问延迟特性,导致多核处理器大容量cache失效率和命中延迟之间的矛盾日益加剧.此外,单独依靠数据迁移和盲目复制难以解决共享数据块的竞争访问与长延迟命中问题.基于瓦片式多核处理器... 传统数据管理机制无法感知分布式cache布局的非一致访问延迟特性,导致多核处理器大容量cache失效率和命中延迟之间的矛盾日益加剧.此外,单独依靠数据迁移和盲目复制难以解决共享数据块的竞争访问与长延迟命中问题.基于瓦片式多核处理器分布式cache的虚拟共享域划分机制,提出并实现一种域间数据自适应迁移与复制机制,能够协同感知本地目标bank候选牺牲块状态和远程命中块的局部活跃程度,在多个虚拟共享域间对多核竞争访问的共享数据进行动态迁移和复制决策,综合权衡片上长延迟命中和cache容量有效利用率问题,降低平均存储访问延迟.最后,在全系统模拟器中实现虚拟共享域划分和域间共享数据自适应迁移-复制机制,并采用典型测试程序包SPLASH-2评估性能优化情况.实验表明,与传统固定共享域划分机制和同类优化机制相比,自适应迁移与复制机制在不同共享度下均可获得相应性能提升,面积开销可以忽略不计. 展开更多
关键词 非一致cache体系结构 多核处理器 延迟优化 迁移 复制
下载PDF
采用S-Tag的M-DSP片上存储DMA访问优化
11
作者 鲁建壮 孙书为 +1 位作者 陈胜刚 陆文远 《国防科技大学学报》 EI CAS CSCD 北大核心 2018年第6期112-117,共6页
针对自主设计的M-DSP,提出并设计实现了一种基于Tag副本(S-Tag)的片上SRAM DMA访问数据相关性维护机制,该机制以流水化方式实现,在基本对CPU无打扰的前提下,有效支撑了DMA数据的无阻塞传递。仿真和芯片实测结果表明,该机制硬件开销较小... 针对自主设计的M-DSP,提出并设计实现了一种基于Tag副本(S-Tag)的片上SRAM DMA访问数据相关性维护机制,该机制以流水化方式实现,在基本对CPU无打扰的前提下,有效支撑了DMA数据的无阻塞传递。仿真和芯片实测结果表明,该机制硬件开销较小,并在有效带宽和带宽利用率上均优于已有典型同类芯片。 展开更多
关键词 cache+RAM结构 S-Tag DMA传输 数据一致性
下载PDF
基于状态机控制的硬件Page Walk方案与实现
12
作者 路冬冬 王炳凯 杜鑫 《计算机与数字工程》 2019年第11期2733-2737,共5页
在现代微处理器中,虚实地址代换一般处于Cache访问的关键路径上,旁路转换缓冲(TLB)作为虚实地址代换的专用缓冲,用于提高虚实地址代换的速度。当不命中TLB时,需要逐级查找页表以获取代换后的物理地址。论文提出一种基于状态机控制的硬... 在现代微处理器中,虚实地址代换一般处于Cache访问的关键路径上,旁路转换缓冲(TLB)作为虚实地址代换的专用缓冲,用于提高虚实地址代换的速度。当不命中TLB时,需要逐级查找页表以获取代换后的物理地址。论文提出一种基于状态机控制的硬件自动查找页表并装填TLB的方案,并给出具体实现;同时,结合页表结构Cache,对状态机进行优化,进一步提升硬件查找页表的速度,降低TLB Miss的处理开销。 展开更多
关键词 虚实地址代换 旁路转换缓冲 页表 页表查找 页表结构cache
下载PDF
高速缓冲存储器应用研究
13
作者 晁颖 《重庆通信学院学报》 1996年第2期1-5,共5页
本文在讨论高速缓冲存储器(cache)工作原理的基础上探索了具有cache特征的高档微机的cache层次结构问题。
关键词 高速缓冲存储器 工作原理 cache层次结构 CPU
全文增补中
上一页 1 下一页 到第
使用帮助 返回顶部