-
题名基于动态压缩的高存储效率末级分支目标缓冲
- 1
-
-
作者
谭弘泽
王剑
-
机构
处理器芯片全国重点实验室(中国科学院计算技术研究所)
中国科学院大学
-
出处
《高技术通讯》
CAS
北大核心
2024年第7期671-680,共10页
-
基金
国家重点研发计划(2022YFB3105103)资助项目。
-
文摘
随着软件系统规模及复杂度的增长,数量庞大的指令使指令高速缓存和分支目标缓冲(BTB)频繁地发生缺失,导致中央处理器(CPU)性能下降。现代工业CPU设计在分离式前端中使用充分大的多级BTB以减少缺失导致的性能损失。由于实际芯片的存储资源有限,大容量的末级BTB需要更高的存储效率。然而,现有压缩BTB采用静态分配目标偏移量存储空间的方法,无法按照分支的实际存储需求进行调整,导致其存储效率较低。针对上述问题,提出一种基于动态压缩的BTB——ZBTB。ZBTB通过可变长编码表示目标偏移量,动态分配目标偏移量存储空间,结合无额外存储的最近最少使用(LRU)和偏斜相联等方法缓解冲突,提升了存储效率。基于以第1届指令预取锦标赛(IPC-1)所发布轨迹数据进行的评估,与现有BTB相比,ZBTB在33.5 kB容量下可将误预测次数降低66%。
-
关键词
分支预测
分支目标缓冲(BTB)
压缩
偏斜相联
-
Keywords
branch prediction
branch target buffer(BTB)
compression
skewed associativity
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于持久化栈的返回地址预测器
- 2
-
-
作者
谭弘泽
王剑
-
机构
处理器芯片全国重点实验室(中国科学院计算技术研究所)
中国科学院大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第6期1337-1345,共9页
-
基金
中国科学院战略性先导科技专项(C类)(XDC05020100)。
-
文摘
分支预测允许处理器并行执行分支之后的指令,由于其高准确率具有性能和功耗方面的双重好处,是一项重要的处理器优化技术.根据分而治之的策略,返回地址栈(return-address stack,RAS)将过程返回类分支单独分出并予以预测.其中,RAS利用过程调用和返回的后入先出规则,可通过猜测执行中调用栈的模拟准确预测返回地址.但是,由于实际处理器猜测执行带来的错误路径污染,该结构需要通过恢复机制来保障所存储数据的准确性.尤其在对面积资源敏感的嵌入式领域,设计者需要在准确率和恢复机制的开销间进行细致的权衡.针对RAS存储中的冗余,通过溢出检测结合传统栈、持久化栈和后备预测3种预测方式,提出一种基于持久化栈的返回地址预测器——混合返回地址栈(hybrid return-address stack,HRAS),避免错误路径污染和对返回地址的冗余存储,从而有效降低返回误预测率.与此同时,设计解耦传统栈和持久化栈,进一步降低其面积需求.根据SPEC CPU 2000基准测试以及设计编译器的评估结果,HRAS可利用仅1.1×10^(4)μm^(2)的设计面积将过程返回的每千条指令误预测(MPKI)降至2.4×10^(−3),其误预测相比现有RAS可降低96%.
-
关键词
返回地址预测
猜测执行
污染恢复
持久化
后备预测
-
Keywords
return address prediction
speculative execution
corruption recovery
persistence
backup prediction
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-