期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
A Power-Aware Branch Predictor by Accessing the BTB Selectively
1
作者 Cheol Hong Kim Sung Woo Chung Chu Shik Jhon 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第5期607-614,共8页
Microarchitects should consider power consumption, together with accuracy, when designing a branch predictor, especially in embedded processors. This paper proposes a power-aware branch predictor, which is based on th... Microarchitects should consider power consumption, together with accuracy, when designing a branch predictor, especially in embedded processors. This paper proposes a power-aware branch predictor, which is based on the gshare predictor, by accessing the BTB (Branch Target Buffer) selectively. To enable the selective access to the BTB, the PHT (Pattern History Table) in the proposed branch predictor is accessed one cycle earlier than the traditional PHT if the program is executed sequentially without branch instructions. As a side effect, two predictions from the PHT are obtained through one access to the PHT, resulting in more power savings. In the proposed branch predictor, if the previous instruction was not a branch and the prediction from the PHT is untaken, the BTB is not accessed to reduce power consumption. If the previous instruction was a branch, the BTB is always accessed, regardless of the prediction from the PHT, to prevent the additional delay/accuracy decrease. The proposed branch predictor reduces the power consumption with little hardware overhead, not incurring additional delay and never harming prediction accuracy. The simulation results show that the proposed branch predictor reduces the power consumption by 29-47%. 展开更多
关键词 branch predictor BTB embedded processor low power design PHT
原文传递
A Novel Probabilistic Saturating Counter Design for Secure Branch Predictor
2
作者 Lu-Tan Zhao Rui Hou +3 位作者 Kai Wang Yu-Lan Su Pei-Nan Li Dan Meng 《Journal of Computer Science & Technology》 SCIE EI CSCD 2021年第5期1022-1036,共15页
In a modern processor,branch prediction is crucial in effectively exploiting the instruction-level parallelism for high-performance execution.However,recently exposed vulnerabilities reveal the urgency to improve the ... In a modern processor,branch prediction is crucial in effectively exploiting the instruction-level parallelism for high-performance execution.However,recently exposed vulnerabilities reveal the urgency to improve the security of branch predictors.The vital cause of the branch predictor vulnerabilities is that the update strategy of the saturating counter is deterministic.As a fundamental building block in a modern branch predictor,previous studies have paid too much attention to the performance and hardware cost and ignored the security of saturating counter.This leaves attackers with the opportunities to perform side-channel attacks on the branch predictor.This paper focuses on the saturating counter to explore a secure and lightweight design to mitigate branch predictor side-channel attacks.Instead of applying the isolation mechanism to branch predictor resources,we propose a novel probabilistic saturating counter design to confuse the attacker's perception of the victim's behaviour.It changes the conventional deterministic state transition function to a probabilistic state transition function.When a branch is committed,the conventional saturating counter needs to be updated about whether the prediction results are correct or not.While for the probabilistic saturating counter,the branch predictor determines whether the update is performed based on the update probability.The probabilistic saturating counter dramatically reduces the ability of the attacker to spy the saturating counter's state.Our analyses using a cycle-accurate simulator suggest that the proposed mechanism incurs 2.4%performance overhead and hardware cost while providing strong protection. 展开更多
关键词 branch predictor side-channel attack saturating counter
原文传递
基于xorHash的RISC-V分支预测器设计
3
作者 苗恒 曲英杰 《电子设计工程》 2024年第24期58-62,67,共6页
处理器的高速发展对分支预测器准确度要求越来越高,通过研究RISC-V处理器中分支预测器微架构,设计了基于xorHash的分支预测器;在基于xorHash的分支预测器中,使用改进后的xorHash算法对分支跳转指令进行散列处理,降低了别名发生概率,并... 处理器的高速发展对分支预测器准确度要求越来越高,通过研究RISC-V处理器中分支预测器微架构,设计了基于xorHash的分支预测器;在基于xorHash的分支预测器中,使用改进后的xorHash算法对分支跳转指令进行散列处理,降低了别名发生概率,并提高了预测准确率;将分支预测器接入RISC-V五级流水线架构,利用Verilator仿真验证了改进后的分支预测器的准确率,通过板级测试评估了其性能;结果表明,分支预测器在运行CoreMark时准确率达到99.57%,在运行Dhrystone时准确率达到97.57%。 展开更多
关键词 RISC-V 处理器 分支预测器 xorHash BTB
下载PDF
基于跳跃访问控制的低功耗分支目标缓冲器设计 被引量:4
4
作者 喻明艳 张祥建 杨兵 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第4期695-702,共8页
传统的分支目标缓冲器(BTB)每个取指周期都要进行访问,由于程序中的分支指令只占总指令数的20%左右,使得大约80%的BTB访问都是无效的.为此,利用程序控制流中分支指令间距固定的特性,提出一种对性能影响极小的BTB跳跃访问算法.在BTB中存... 传统的分支目标缓冲器(BTB)每个取指周期都要进行访问,由于程序中的分支指令只占总指令数的20%左右,使得大约80%的BTB访问都是无效的.为此,利用程序控制流中分支指令间距固定的特性,提出一种对性能影响极小的BTB跳跃访问算法.在BTB中存储分支指令到运行路径中下一条分支指令的距离,BTB命中后,根据相应的分支距离来关闭当前分支指令与下一条分支指令之间的BTB访问,以有效地提高访问效率并降低动态功耗.该算法在嵌入式处理器中实现时只控制预测跳转分支指令的BTB跳跃访问,减少了硬件资源的开销.在硬件模型上进行模拟和综合后的结果表明,在128分支项的BTB中,采用文中算法可以降低72%的动态功耗,而性能损失仅为0.013%. 展开更多
关键词 分支目标缓冲器 分支预测器 低功耗 嵌入式处理器 硬件模型
下载PDF
一种有效的同时多线程处理器取指控制机制 被引量:4
5
作者 何立强 刘志勇 《计算机学报》 EI CSCD 北大核心 2006年第4期535-543,共9页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合,提出一种新的取指控制机制.该结构的硬件开销较小,实现复杂度较低.实验结果表明,该取指控制机制有效地提高了处理器的性能,其相对于传统取指控制机制的性能加速比为28%且该加速比也高于目前基于流缓冲区和基于分支分类器的取指控制机制. 展开更多
关键词 同时多线程处理器 取指策略 分支预测器 分支分类器 取指控制机制
下载PDF
一种gshare分支预测器的低功耗设计方法 被引量:7
6
作者 武萌 沈海斌 《微电子学与计算机》 CSCD 北大核心 2007年第3期200-202,206,共4页
功耗与性能在高端嵌入式计算系统中都是非常重要的设计指标。基于深度流水处理器中所使用的动态分支预测器的微结构特点,提出了一种利用分页技术来有效的降低gshare分支预测器的功耗的设计方法,详细分析了分支预测器的大小、分页数以及... 功耗与性能在高端嵌入式计算系统中都是非常重要的设计指标。基于深度流水处理器中所使用的动态分支预测器的微结构特点,提出了一种利用分页技术来有效的降低gshare分支预测器的功耗的设计方法,详细分析了分支预测器的大小、分页数以及功耗、面积之间的内在关系。 展开更多
关键词 分支预测器 低功耗 嵌入武处理器
下载PDF
基于类型预测的甚块预测器 被引量:1
7
作者 苟鹏飞 喻明艳 +2 位作者 杨兵 李清波 王诗博 《计算机学报》 EI CSCD 北大核心 2012年第7期1539-1552,共14页
高性能的甚块预测器是保证EDGE体系结构性能的关键手段.为研究性能更好的甚块预测器,文中通过仿真实验发现甚块的出口类型独立于甚块的出口个数和甚块的动态执行结果而存在.以此为据,提出了基于类型预测的甚块预测器.该预测器摈弃了甚... 高性能的甚块预测器是保证EDGE体系结构性能的关键手段.为研究性能更好的甚块预测器,文中通过仿真实验发现甚块的出口类型独立于甚块的出口个数和甚块的动态执行结果而存在.以此为据,提出了基于类型预测的甚块预测器.该预测器摈弃了甚块出口号,直接对甚块出口类型进行预测.随后,根据对甚块出口类型可预测性的分析,通过实验证明甚块出口类型与历史和路径信息相关.仿真结果显示,与经典的基于出口预测的甚块预测器相比,文中提出的基于类型预测的甚块预测器能够将每千条指令误预测次数平均降低约10%. 展开更多
关键词 甚块预测器 分支预测器 EDGE体系结构 出口类型预测 可预测性
下载PDF
改进的基于O-GEHL预测技术的EDGE块预测器 被引量:1
8
作者 苟鹏飞 王诗博 +1 位作者 杨兵 喻明艳 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第2期305-310,共6页
块预测器赋予了EDGE体系结构高效的控制流推测能力。针对基于O-GEHL预测技术的块预测器的缺点,提出了两种改进策略:1)无选择器的O-GEHL出口预测;2)直接使用OGEHL预测器的二值预测能力单独对每个出口进行预测。性能评价结果表明,无选择器... 块预测器赋予了EDGE体系结构高效的控制流推测能力。针对基于O-GEHL预测技术的块预测器的缺点,提出了两种改进策略:1)无选择器的O-GEHL出口预测;2)直接使用OGEHL预测器的二值预测能力单独对每个出口进行预测。性能评价结果表明,无选择器的O-GEHL出口预测方案比文献[4]中的O-GEHL块预测器性能平均提高0.7%;对8个出口分别使用二值O-GEHL预测器进行预测的方案,在硬件资源较多时,性能提高3%;只对前4个出口采用二值O-GEHL预测器的方案,性能平均提高2%。 展开更多
关键词 块预测器 分支预测器 EDGE体系结构 出口预测 O-GEHL预测技术 性能评估
下载PDF
心脏再同步化治疗后心功能恢复正常的预测因素分析 被引量:10
9
作者 李娜 董颖雪 +9 位作者 刘飞 李国草 Chandran Sadees Clarance 于晓红 张荣峰 王楠 肖宪杰 尹晓盟 夏云龙 高连君 《中国循环杂志》 CSCD 北大核心 2019年第8期783-789,共7页
目的:探讨心脏再同步化治疗(CRT)术后患者心功能恢复正常的预测因素。方法:连续入选2013年1月至2016年9月因慢性心力衰竭接受CRT的患者65例,CRT后心功能恢复正常患者6例(9.23%),CRT有应答患者44例(67.69%)。评价患者的临床特征包括合并... 目的:探讨心脏再同步化治疗(CRT)术后患者心功能恢复正常的预测因素。方法:连续入选2013年1月至2016年9月因慢性心力衰竭接受CRT的患者65例,CRT后心功能恢复正常患者6例(9.23%),CRT有应答患者44例(67.69%)。评价患者的临床特征包括合并疾病情况、心电图包括左束支阻滞形态特征、电极位置及电极间距等。随访(37.4±17.6)个月,并于术前及术后每6个月对其进行临床、起搏器程控以及心脏超声等指标进行随访。结果:CRT后心功能恢复正常患者心力衰竭病史短、心电图表现为真性左束支阻滞、左心房增大程度较轻、右心室电极位于非心尖部、且术后QRS缩短明显(P<0.05)。真性完全性左束支阻滞是CRT后心功能恢复正常的预测OR=12.452,95%CI:3.235~36.682,P=0.012)。真性完全性左束支阻滞患者共12例,其中5例患者心功能恢复正常,发生率41.7%。CRT后6个月,合并真性完全性左束支传导阻滞的患者与非真性完全性左束支传导阻滞者比较,左室射血分数提高[(15.50±13.45)%vs(4.19±3.34)%]及QRS时限缩短[(28.15±19.17)msvs(11.92±4.03)ms)更显著(P均<0.05)。平均随访(37.4±17.6)个月时,真性完全性左束支阻滞患者的死亡率低于非真性完全性左束支阻滞患者(0%vs23.7%,P=0.030)。结论:真性完全性左束支阻滞是CRT术后心功能恢复正常最强的预测因子。 展开更多
关键词 心脏再同步化治疗 预测因素 左束支阻滞
下载PDF
嵌入式处理器中分支目标缓冲器的研究与设计 被引量:1
10
作者 王晨旭 张凯峰 +1 位作者 张祥建 喻明艳 《微电子学与计算机》 CSCD 北大核心 2012年第1期27-31,共5页
针对嵌入式应用的特点,设计了一种基于RAM比较TAG的分支目标缓冲器(BTB),并通过硬件模拟方法(BTB控制逻辑用RTL实现,存储体用定制逻辑实现)研究BTB结构参数对BTB的性能、能耗以及对整个处理器系统的性能和能耗的影响,根据仿真结果选取... 针对嵌入式应用的特点,设计了一种基于RAM比较TAG的分支目标缓冲器(BTB),并通过硬件模拟方法(BTB控制逻辑用RTL实现,存储体用定制逻辑实现)研究BTB结构参数对BTB的性能、能耗以及对整个处理器系统的性能和能耗的影响,根据仿真结果选取应用于嵌入式处理器的最优BTB结构参数.根据该参数,进一步设计基于CAM比较TAG的BTB,经SPEC2000评测,相对于基于RAM比较TAG的BTB,基于CAM比较TAG的BTB可使功耗降低37.17%. 展开更多
关键词 分支目标缓冲器 分支预测器 嵌入式处理器 硬件模型
下载PDF
分支指令特性与分支预测器的性能研究 被引量:1
11
作者 喻明艳 张祥建 王晨旭 《微电子学与计算机》 CSCD 北大核心 2010年第6期8-12,共5页
根据分支指令的特性,分析了分支行为与分支预测技术对单发射嵌入式处理器CPI栈(CPI stacks)组成的影响,并在RTL级设计了分支预测器的时序精确模型,通过硬件模拟方法对分支指令特性和分支预测器的性能进行了研究.实验考察了分支指令在分... 根据分支指令的特性,分析了分支行为与分支预测技术对单发射嵌入式处理器CPI栈(CPI stacks)组成的影响,并在RTL级设计了分支预测器的时序精确模型,通过硬件模拟方法对分支指令特性和分支预测器的性能进行了研究.实验考察了分支指令在分支预测器命中或缺失时的不同跳转统计特性,验证了分支预测器对CPI栈影响的理论推导,为单发射嵌入式处理器中分支预测器的设计与优化提供了精确的实验依据. 展开更多
关键词 CPI栈 分支预测器 单发射嵌入式处理器 硬件模型
下载PDF
一种复合分支预测电路的设计与实现 被引量:1
12
作者 马鹏 方晓旻 +1 位作者 王春军 许团辉 《计算机工程》 CAS CSCD 北大核心 2011年第13期243-245,共3页
针对现有预测算法仅能精准预测某类程序的缺陷,设计一种复合分支预测电路。该电路组合多种分支预测算法,可以对各种程序进行精准预测,并应用于自主设计的嵌入式微处理器中。性能仿真结果表明,复合分支预测电路对各种程序可以实现高精准... 针对现有预测算法仅能精准预测某类程序的缺陷,设计一种复合分支预测电路。该电路组合多种分支预测算法,可以对各种程序进行精准预测,并应用于自主设计的嵌入式微处理器中。性能仿真结果表明,复合分支预测电路对各种程序可以实现高精准预测,并且满足处理器设计的时序要求。 展开更多
关键词 分支预测 局部预测器 全局预测器 微处理器设计
下载PDF
基于SimpleScalar的动态分支预测器研究 被引量:1
13
作者 张筱 史战果 吴迪 《微型电脑应用》 2011年第11期19-21,68-69,共5页
分支预测精度是影响当代处理器性能的重要指标,在近十年内一直是学术界和工业界的研究热点。为给不同应用场合的处理器动态分支预测器设计提供性能参考,针对处理器架构设计中应用广泛的几种动态分支预测器,使用SPEC CPU2000在SimpleSca... 分支预测精度是影响当代处理器性能的重要指标,在近十年内一直是学术界和工业界的研究热点。为给不同应用场合的处理器动态分支预测器设计提供性能参考,针对处理器架构设计中应用广泛的几种动态分支预测器,使用SPEC CPU2000在SimpleScalar模拟器中进行仿真及测试分析。测试结果以预测精度和指令/时钟周期作为指标,并结合硬件开销,分析了不同种类分支预测器的适用对象和场合。 展开更多
关键词 动态分支预测器 模拟 指令级并行处理 神经网络预测器
下载PDF
一类两阶段生产系统生产计划与调度的集成优化 被引量:7
14
作者 安玉伟 严洪森 《计算机集成制造系统》 EI CSCD 北大核心 2012年第4期796-806,共11页
针对传统生产计划与调度制定中存在的不足,研究了一类两阶段生产系统的生产计划与调度集成优化问题。建立了能够反映生产计划与调度相互关联特点的离散双层规划模型,提出一种基于混合优化方法的分支定界解法以及有效缩减搜索空间的方法... 针对传统生产计划与调度制定中存在的不足,研究了一类两阶段生产系统的生产计划与调度集成优化问题。建立了能够反映生产计划与调度相互关联特点的离散双层规划模型,提出一种基于混合优化方法的分支定界解法以及有效缩减搜索空间的方法,并构造了有效下界。针对分支定界法的松弛问题,给出采用模拟退火算法与预估校正法交替迭代求解的混合优化方法。通过实验仿真,验证了模型与算法的有效性。 展开更多
关键词 生产计划 调度 离散双层规划 分支定界法 模拟退火 预估校正法
下载PDF
基于同时多线程的TBHBP分支预测器研究
15
作者 李静梅 关海洋 《计算机科学》 CSCD 北大核心 2012年第9期307-311,共5页
针对传统处理器分支预测器存在分支预测信息混乱、分支指令别名冲突和容量冲突率高的缺点,提出基于同时多线程处理器的分支预测器TBHBP。该分支预测器采取线程历史信息与基于地址索引的局部历史信息相结合的综合历史信息作为模式匹配表... 针对传统处理器分支预测器存在分支预测信息混乱、分支指令别名冲突和容量冲突率高的缺点,提出基于同时多线程处理器的分支预测器TBHBP。该分支预测器采取线程历史信息与基于地址索引的局部历史信息相结合的综合历史信息作为模式匹配表PHT的索引,并采取线程独立拥有线程历史寄存器和分支历史寄存器的方式,通过新增分支结果输出表来提高指令的分支预测执行速度。研究结果表明,TBHBP分支预测器有效解决了分支信息过时、分支指令别名和容量冲突的问题。与Gshare分支预测器相比,其指令吞吐率提升了12.5%,分支误预测率和误预测路径取指率分别下降了0.5%和2.1%。 展开更多
关键词 同时多线程 TBHBP分支预测器 SMTSIM仿真器 分支预测信息 别名冲突 容量冲突
下载PDF
支路约束优化下的电网结构脆弱性研究 被引量:6
16
作者 刘群英 刘俊勇 +1 位作者 刘起方 史继莉 《电工技术学报》 EI CSCD 北大核心 2011年第3期148-154,161,共8页
根据发电机出力变化与系统能量裕度变化的关系及其与支路潮流变化之间的关系,在求取发电机出力变化对支路电流变化的影响因子基础上,采用非线性优化的思路,通过预测-校正内点法对系统所有发电机出力变化量进行组合优化,计算了对应不同... 根据发电机出力变化与系统能量裕度变化的关系及其与支路潮流变化之间的关系,在求取发电机出力变化对支路电流变化的影响因子基础上,采用非线性优化的思路,通过预测-校正内点法对系统所有发电机出力变化量进行组合优化,计算了对应不同系统状态的支路电流变化量约束上下限,并根据约束上下限构建了支路脆弱性评估指标。最后在IEEE-30母线系统中比较了本文所提方法与传统最优潮流法两种优化手段下的脆弱性评估,结果证明,根据系统运行条件变化来实时更新支路电流变化量约束上下限是本研究的一大优点;另外,由于多台发电机出力变化的综合效应可能引起支路的脆弱性并不按照通常趋势变化,鉴于此,这里在使用能量裕度获取支路约束时,允许支路潮流变化由不特定的发电机引起,有助于进一步探索电网的支路脆弱性。 展开更多
关键词 电网结构脆弱性 预测-校正内点法 支路约束优化 电流影响因子 能量裕度
下载PDF
基于转移指令特性的动态翻译算法 被引量:2
17
作者 李战辉 孟建熠 +1 位作者 陈志坚 严晓浪 《上海交通大学学报》 EI CAS CSCD 北大核心 2015年第2期173-177,183,共6页
针对传统方法统一转译转移指令导致翻译器效率较低的问题,基于转移目标地址在函数内外的不同特征,提出了直接映射和指令类型转译策略组合的动态翻译方法.对函数内转移指令,直接采用目标架构中对应的分支指令进行映射,通过转移前后指令... 针对传统方法统一转译转移指令导致翻译器效率较低的问题,基于转移目标地址在函数内外的不同特征,提出了直接映射和指令类型转译策略组合的动态翻译方法.对函数内转移指令,直接采用目标架构中对应的分支指令进行映射,通过转移前后指令翻译码的无缝链接,高效转译了条件分支指令,且无需生成源寄存器到内存同步指令;对函数间转移指令,区别对待函数转移和其他转移指令,通过将源程序函数转移指令属性继承给翻译码以提高目标机转移预测器准确率.基于EEMBC(Embedded Microprocessor Benchmark Consortium)测试基准的实验表明,该方法使转移指令翻译码执行指令数平均减少58.9%,转移预测器命中率平均提高80.7%,翻译器整体性能提高12.3%. 展开更多
关键词 动态翻译 转移指令 直接映射 转移预测器
下载PDF
“龙腾R”微处理器分支处理单元的研究与设计 被引量:2
18
作者 鄢国丰 张盛兵 黄小平 《微电子学与计算机》 CSCD 北大核心 2010年第6期122-127,共6页
"龙腾R"是西北工业大学自主研制的32位高性能微处理器.该处理器的分支处理单元(BPU)能有效降低控制相关带来的延迟.通过分析已有的分支方向预测算法和分支目标地址预测策略,在分支处理单元总体约束下,合理分配分支方向预测和... "龙腾R"是西北工业大学自主研制的32位高性能微处理器.该处理器的分支处理单元(BPU)能有效降低控制相关带来的延迟.通过分析已有的分支方向预测算法和分支目标地址预测策略,在分支处理单元总体约束下,合理分配分支方向预测和目标地址预测的实现代价,提出了一种基于混合分支预测器和经过改进的目标地址缓冲(BTB)结构的分支处理单元结构.该结构不仅比传统的由gshare分支方向预测器构成的分支处理单元预测准确率平均高出1%~2%,并具有面积小、功耗低的特点. 展开更多
关键词 分支预测 分支处理 混合分支预测器 目标地址缓冲
下载PDF
分片式处理器上的谓词执行技术优化 被引量:1
19
作者 邓春华 安虹 +1 位作者 路璐 王耀彬 《小型微型计算机系统》 CSCD 北大核心 2012年第2期399-403,共5页
谓词执行能使分片式处理器充分利用众多的执行单元,开发指令级并行性.但因此形成的超块也使得分支误预测代价增大,所以提高分支预测器的性能至关重要.本文提出一种基于剖析信息决策的谓词执行技术,该技术利用剖析信息对谓词执行前后的... 谓词执行能使分片式处理器充分利用众多的执行单元,开发指令级并行性.但因此形成的超块也使得分支误预测代价增大,所以提高分支预测器的性能至关重要.本文提出一种基于剖析信息决策的谓词执行技术,该技术利用剖析信息对谓词执行前后的执行周期进行估算,从而对分支的谓词执行进行决策.该技术使分支预测器的命中率提高了0.68%~3.50%,使系统性能提高了1.67%~8.33%.同时,利用select指令表示谓词化指令也消除了重命名阶段寄存器多定义问题. 展开更多
关键词 谓词执行 分片式处理器 分支预测器 剖析信息
下载PDF
高性能代价比的两层关联间接转移预测器设计 被引量:2
20
作者 袁楠 范东睿 《计算机学报》 EI CSCD 北大核心 2008年第11期1898-1906,共9页
随着面向对象语言程序、动态链接库(DLL)等的普遍应用,间接转移指令的使用越来越频繁.两层关联间接转移预测器预测准确度高,但实现硬件代价较高,因此并不实用.文中深入分析了两层关联间接转移预测器中产生误预测的原因,通过改进索引方... 随着面向对象语言程序、动态链接库(DLL)等的普遍应用,间接转移指令的使用越来越频繁.两层关联间接转移预测器预测准确度高,但实现硬件代价较高,因此并不实用.文中深入分析了两层关联间接转移预测器中产生误预测的原因,通过改进索引方法、压缩存储等实用方法减小硬件实现代价.实验结果表明,通过这些方法的改进,在133K比特硬件存储代价下,使用一组SPEC CPU2000测试程序进行评估,间接转移误预测率为9.6%,仅比两层关联预测器理想误预测率高2.3%,而4路组相联BTB预测器的误预测率为31%. 展开更多
关键词 间接转移 两层预测器 误预测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部