期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于动态压缩的高存储效率末级分支目标缓冲
1
作者 谭弘泽 王剑 《高技术通讯》 CAS 北大核心 2024年第7期671-680,共10页
随着软件系统规模及复杂度的增长,数量庞大的指令使指令高速缓存和分支目标缓冲(BTB)频繁地发生缺失,导致中央处理器(CPU)性能下降。现代工业CPU设计在分离式前端中使用充分大的多级BTB以减少缺失导致的性能损失。由于实际芯片的存储资... 随着软件系统规模及复杂度的增长,数量庞大的指令使指令高速缓存和分支目标缓冲(BTB)频繁地发生缺失,导致中央处理器(CPU)性能下降。现代工业CPU设计在分离式前端中使用充分大的多级BTB以减少缺失导致的性能损失。由于实际芯片的存储资源有限,大容量的末级BTB需要更高的存储效率。然而,现有压缩BTB采用静态分配目标偏移量存储空间的方法,无法按照分支的实际存储需求进行调整,导致其存储效率较低。针对上述问题,提出一种基于动态压缩的BTB——ZBTB。ZBTB通过可变长编码表示目标偏移量,动态分配目标偏移量存储空间,结合无额外存储的最近最少使用(LRU)和偏斜相联等方法缓解冲突,提升了存储效率。基于以第1届指令预取锦标赛(IPC-1)所发布轨迹数据进行的评估,与现有BTB相比,ZBTB在33.5 kB容量下可将误预测次数降低66%。 展开更多
关键词 分支预测 分支目标缓冲(btb) 压缩 偏斜相联
下载PDF
基于跳跃访问控制的低功耗分支目标缓冲器设计 被引量:4
2
作者 喻明艳 张祥建 杨兵 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第4期695-702,共8页
传统的分支目标缓冲器(BTB)每个取指周期都要进行访问,由于程序中的分支指令只占总指令数的20%左右,使得大约80%的BTB访问都是无效的.为此,利用程序控制流中分支指令间距固定的特性,提出一种对性能影响极小的BTB跳跃访问算法.在BTB中存... 传统的分支目标缓冲器(BTB)每个取指周期都要进行访问,由于程序中的分支指令只占总指令数的20%左右,使得大约80%的BTB访问都是无效的.为此,利用程序控制流中分支指令间距固定的特性,提出一种对性能影响极小的BTB跳跃访问算法.在BTB中存储分支指令到运行路径中下一条分支指令的距离,BTB命中后,根据相应的分支距离来关闭当前分支指令与下一条分支指令之间的BTB访问,以有效地提高访问效率并降低动态功耗.该算法在嵌入式处理器中实现时只控制预测跳转分支指令的BTB跳跃访问,减少了硬件资源的开销.在硬件模型上进行模拟和综合后的结果表明,在128分支项的BTB中,采用文中算法可以降低72%的动态功耗,而性能损失仅为0.013%. 展开更多
关键词 分支目标缓冲 分支预测器 低功耗 嵌入式处理器 硬件模型
下载PDF
嵌入式处理器中分支目标缓冲器的研究与设计 被引量:1
3
作者 王晨旭 张凯峰 +1 位作者 张祥建 喻明艳 《微电子学与计算机》 CSCD 北大核心 2012年第1期27-31,共5页
针对嵌入式应用的特点,设计了一种基于RAM比较TAG的分支目标缓冲器(BTB),并通过硬件模拟方法(BTB控制逻辑用RTL实现,存储体用定制逻辑实现)研究BTB结构参数对BTB的性能、能耗以及对整个处理器系统的性能和能耗的影响,根据仿真结果选取... 针对嵌入式应用的特点,设计了一种基于RAM比较TAG的分支目标缓冲器(BTB),并通过硬件模拟方法(BTB控制逻辑用RTL实现,存储体用定制逻辑实现)研究BTB结构参数对BTB的性能、能耗以及对整个处理器系统的性能和能耗的影响,根据仿真结果选取应用于嵌入式处理器的最优BTB结构参数.根据该参数,进一步设计基于CAM比较TAG的BTB,经SPEC2000评测,相对于基于RAM比较TAG的BTB,基于CAM比较TAG的BTB可使功耗降低37.17%. 展开更多
关键词 分支目标缓冲 分支预测器 嵌入式处理器 硬件模型
下载PDF
基于跳转轨迹的分支目标缓冲研究
4
作者 熊振亚 林正浩 任浩琪 《计算机科学》 CSCD 北大核心 2017年第3期195-201,214,共8页
现代计算机体系结构受两个方面的困扰:性能和能耗。为降低嵌入式处理器日益增长的功耗,提出基于跳转轨迹的分支目标缓冲结构(TG-BTB)。与传统分支目标缓冲每次提取指令时需要查询分支目标缓冲不同,TG-BTB只在执行轨迹预测为跳转时才查... 现代计算机体系结构受两个方面的困扰:性能和能耗。为降低嵌入式处理器日益增长的功耗,提出基于跳转轨迹的分支目标缓冲结构(TG-BTB)。与传统分支目标缓冲每次提取指令时需要查询分支目标缓冲不同,TG-BTB只在执行轨迹预测为跳转时才查询分支目标缓冲。该结构通过在程序执行过程中动态分析跳转轨迹行为,可以实现只在轨迹跳转时查询分支目标缓冲,从而降低功耗。在动态分析过程中首先提取记录两条跳转分支指令之间的指令间隔,然后将提取的指令间隔存储在TG-BTB中,最后根据存储在TG-BTB中的指令间隔决定是否需要查询BTB。基于基准测试向量进行模型验证和性能测试,实验结果表明TG-BTB降低了81%的BTB查询能耗。 展开更多
关键词 跳转轨迹 指令间隔 分支目标缓冲 能耗
下载PDF
嵌入式处理器动态分支预测机制研究与设计 被引量:4
5
作者 黄伟 王玉艳 章建雄 《计算机工程》 CAS CSCD 北大核心 2008年第21期163-165,共3页
针对嵌入式处理器的特定应用环境,通过对传统神经网络算法的改进,结合定制的分支目标缓冲,提出一种复合式动态分支预测机制。该机制基于全局索引方式,对BTB结构进行定制设计,实现对循环逻辑中最后一条分支指令的精确预测。实验结果表明... 针对嵌入式处理器的特定应用环境,通过对传统神经网络算法的改进,结合定制的分支目标缓冲,提出一种复合式动态分支预测机制。该机制基于全局索引方式,对BTB结构进行定制设计,实现对循环逻辑中最后一条分支指令的精确预测。实验结果表明,该动态分支预测机制能降低硬件复杂度,提高预测精度。 展开更多
关键词 复合分支预测 神经网络 分支目标缓冲 嵌入式处理器 SimpleScalar模拟
下载PDF
“龙腾R”微处理器分支处理单元的研究与设计 被引量:2
6
作者 鄢国丰 张盛兵 黄小平 《微电子学与计算机》 CSCD 北大核心 2010年第6期122-127,共6页
"龙腾R"是西北工业大学自主研制的32位高性能微处理器.该处理器的分支处理单元(BPU)能有效降低控制相关带来的延迟.通过分析已有的分支方向预测算法和分支目标地址预测策略,在分支处理单元总体约束下,合理分配分支方向预测和... "龙腾R"是西北工业大学自主研制的32位高性能微处理器.该处理器的分支处理单元(BPU)能有效降低控制相关带来的延迟.通过分析已有的分支方向预测算法和分支目标地址预测策略,在分支处理单元总体约束下,合理分配分支方向预测和目标地址预测的实现代价,提出了一种基于混合分支预测器和经过改进的目标地址缓冲(BTB)结构的分支处理单元结构.该结构不仅比传统的由gshare分支方向预测器构成的分支处理单元预测准确率平均高出1%~2%,并具有面积小、功耗低的特点. 展开更多
关键词 分支预测 分支处理 混合分支预测器 目标地址缓冲
下载PDF
BTB索引散列算法的研究与设计 被引量:3
7
作者 王国澎 胡向东 +1 位作者 尹飞 朱英 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期2003-2011,共9页
分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer,BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充... 分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer,BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充分利用BTB资源,从而造成不必要的冲突缺失,影响分支目标地址的预测精度,采用散列索引方式优化访问映射关系是有效解决方法之一.当前大量文献研究了cache的访问方式,但对BTB的散列索引算法的专门探讨则显不足.为了消除分支指令的分布空洞,离散分支指令和BTB条目的固有映射关系,设计了用于BTB索引的XOR散列算法和优化的bit-select索引算法,使用概率方法对BTB单组最大映射数期望的上界作了估计,并对这两种散列索引算法的效果进行了模拟评估.实验结果表明,散列映射方式能够较好地避免BTB冲突缺失造成的预测失败,XOR散列算法的离散效果更好. 展开更多
关键词 分支目标缓冲 散列索引 XOR散列函数 分支目标地址预测 分支预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部