期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于指令回收的低功耗循环分支折合技术 被引量:4
1
作者 孟建熠 严晓浪 +1 位作者 葛海通 徐鸿明 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第4期632-638,共7页
在分析循环分支特性的基础上,提出一种基于过期指令回收的高性能低功耗循环分支折合方法.该方法通过复用指令缓冲区硬件资源实现指令回收区.在循环分支折合过程中,循环体指令直接从回收区送入流水线,降低了分支延时,消除了指令高速缓存... 在分析循环分支特性的基础上,提出一种基于过期指令回收的高性能低功耗循环分支折合方法.该方法通过复用指令缓冲区硬件资源实现指令回收区.在循环分支折合过程中,循环体指令直接从回收区送入流水线,降低了分支延时,消除了指令高速缓存访问.通过自适应调整回收窗口宽度,可使有限的指令缓冲区硬件资源同时满足指令缓冲与指令回收的双重需求.当投机折合进入预测盲区时关闭分支预测存储器,从而降低投机折合的动态功耗.实验数据表明,与传统循环分支折合技术相比,应用本方法的嵌入式处理器总体性能平均提升5.03%,取指单元动态功耗下降22.10%. 展开更多
关键词 循环分支折合 指令回收 低功耗取指
下载PDF
应用于SoC功能验证的快速处理器仿真模型 被引量:2
2
作者 孟建熠 黄凯 +1 位作者 严晓浪 葛海通 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第3期401-405,522,共6页
针对处理器仿真模型在SoC功能验证中效率低下的问题,提出了一种基于时间域和空间域仿真冗余压缩的处理器快速仿真模型.基于时间域的仿真冗余压缩方法通过监测总线工作状态,消除总线空闲下的系统冗余仿真.基于空间域的仿真冗余压缩方法... 针对处理器仿真模型在SoC功能验证中效率低下的问题,提出了一种基于时间域和空间域仿真冗余压缩的处理器快速仿真模型.基于时间域的仿真冗余压缩方法通过监测总线工作状态,消除总线空闲下的系统冗余仿真.基于空间域的仿真冗余压缩方法通过监测程序访问存储器的地址空间,缩减访问本地存储空间时的冗余系统仿真.实验结果表明,该模型在保证仿真精度高于80%的基础上,可有效减少系统冗余的仿真事务;当2种方法联合应用时平均提高仿真速度60.27倍左右,从而提高软硬件协同设计的效率. 展开更多
关键词 处理器仿真模型 时间域压缩 空间域压缩 软硬件协同设计
下载PDF
一种RTL级数据通路ODC低功耗优化算法 被引量:2
3
作者 孟建熠 丁永林 +1 位作者 严晓浪 葛海通 《电子学报》 EI CAS CSCD 北大核心 2010年第7期1654-1659,共6页
本文提出了一种具有高计算效率和低硬件开销的门控时钟低功耗优化算法.该算法在RTL级搜索数据通路的不可观察性(Observability Dont′Care).采用RTL级逻辑信号总线ODC模型和基于路径ODC的有向图遍历模型,减少了ODC计算负荷,提升了计算效... 本文提出了一种具有高计算效率和低硬件开销的门控时钟低功耗优化算法.该算法在RTL级搜索数据通路的不可观察性(Observability Dont′Care).采用RTL级逻辑信号总线ODC模型和基于路径ODC的有向图遍历模型,减少了ODC计算负荷,提升了计算效率,使ODC适用于超大规模集成电路的低功耗优化.引入数据通路ODC条件概率作为门控信号产生的重要依据,对ODC条件概率高的通路优先插入门控逻辑,可以极低硬件开销实现高效门控时钟网络.实验结果显示,本算法与传统ODC算法相比计算负荷平均降低8倍,功耗平均下降12.35%,面积开销平均减少13.44%. 展开更多
关键词 数据通路低功耗 总线ODC模型 路径ODC模型 ODC条件概率
下载PDF
一种面向微处理器验证的分层随机激励方法 被引量:7
4
作者 张欣 黄凯 +3 位作者 孟建熠 殷燎 严晓浪 葛海通 《计算机应用研究》 CSCD 北大核心 2010年第4期1284-1288,共5页
针对日趋复杂的微处理器功能验证,提出一种基于分层思想的受限随机激励产生方法,通过测试层、场景层、功能层和指令层的多层约束,实现随机激励在不同粒度范围的高度可控性,精炼测试空间,加快验证的收敛速度。采用可配置的功能库,将处理... 针对日趋复杂的微处理器功能验证,提出一种基于分层思想的受限随机激励产生方法,通过测试层、场景层、功能层和指令层的多层约束,实现随机激励在不同粒度范围的高度可控性,精炼测试空间,加快验证的收敛速度。采用可配置的功能库,将处理器功能行为单元作为随机激励的构建基础,产生逻辑功能与通信接口结合的随机激励,实现系列处理器的验证复用。CKCore处理器验证的实验结果表明,该方法与受限随机激励相比,在功能覆盖率相同的情况下,激励编写量减少60%;在仿真时间相同的情况下,功能和代码覆盖率分别改善10%和5%以上,有效提高处理器验证的质量和效率。 展开更多
关键词 分层 随机 激励 微处理器 功能 验证 约束
下载PDF
基于虚拟SoC平台的IP正交激励验证方法 被引量:2
5
作者 殷燎 黄凯 +3 位作者 张欣 孟建熠 葛海通 严晓浪 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1399-1405,共7页
针对传统的IP验证方法中模块级验证平台与激励发生机制效率较低且难以重用的问题,提出一种基于虚拟SoC平台的正交激励验证方法,以优化IP验证流程.通过高层抽象建模,对传统IP验证平台进行扩展,构建包括系统级功能模型与外设行为模型在内... 针对传统的IP验证方法中模块级验证平台与激励发生机制效率较低且难以重用的问题,提出一种基于虚拟SoC平台的正交激励验证方法,以优化IP验证流程.通过高层抽象建模,对传统IP验证平台进行扩展,构建包括系统级功能模型与外设行为模型在内的IP验证虚拟SoC平台;基于此平台提出通信与计算分离的正交化激励映射,并分别优化IP通信接口与逻辑功能验证用例生成流程.多个IP的功能验证实例结果表明,该方法可显著地提高IP验证重用性与验证效率,降低验证复杂度. 展开更多
关键词 IP功能验证 SoC仿真平台 正交分类 验证激励生成
下载PDF
基于神经网络的重构指令预取机制及其可扩展架构 被引量:2
6
作者 陈志坚 孟建熠 +1 位作者 严晓浪 沙子岩 《电子学报》 EI CAS CSCD 北大核心 2012年第7期1476-1480,共5页
针对动态可重构处理器的配置信息加载延时,提出了一种基于神经网络的可扩展的重构指令预取机制.增加感受器的历史指令信息,并结合感受器权重构建新型的感受器模型,通过权重与历史指令信息的协同训练学习重构指令调用规律.在处理器运行... 针对动态可重构处理器的配置信息加载延时,提出了一种基于神经网络的可扩展的重构指令预取机制.增加感受器的历史指令信息,并结合感受器权重构建新型的感受器模型,通过权重与历史指令信息的协同训练学习重构指令调用规律.在处理器运行过程中,提前完成对后续重构指令的预测及配置信息的预取,隐藏指令重构成本.进一步提出了本方法的可扩展实现框架,神经网络的学习结果作为重构指令的关联信息,被移至内存并分布式存储.在重构指令预取时,完成对神经网络学习信息的加载.实验结果表明,该方法对重构指令的预测准确率达91%,综合性能平均提升40%. 展开更多
关键词 可重构处理器 配置信息预取 改进神经网络算法 可扩展存储架构
下载PDF
基于历史长度自适应的分支预测方法 被引量:2
7
作者 赵朝君 陈晨 +1 位作者 陈志坚 孟建熠 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第4期764-770,共7页
通过研究处理器动态分支预测器中预测效率与分支历史长度的关系,针对程序中各分支指令存在不同最优历史长度的规律,提出一种搜索各分支指令最佳历史长度的分支预测方法.该方法通过实时监测分支指令的预测准确率,在分支预测表硬件资源不... 通过研究处理器动态分支预测器中预测效率与分支历史长度的关系,针对程序中各分支指令存在不同最优历史长度的规律,提出一种搜索各分支指令最佳历史长度的分支预测方法.该方法通过实时监测分支指令的预测准确率,在分支预测表硬件资源不变的情况下动态调整预测器的历史长度,以适应程序的动态运行特征.实验结果表明,在相同硬件资源下,文中方法相对于Gshare预测器错误率降低15.8%,相对于Bi-mode预测器预测错误率降低10.3%. 展开更多
关键词 分支预测 分支别名 错误率监测 历史长度自适应
下载PDF
基于邻行链接访问的低功耗指令高速缓存 被引量:1
8
作者 项晓燕 陈志坚 +1 位作者 孟建熠 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第7期1213-1217,共5页
通过分析高速缓存访问的局部性原理,提出当前高速缓存访问行与若干紧邻行链接访问的低功耗指令缓存访问方法.该方法能够在发生相对跳转时依托于相邻行之间的访问链接信息,精确获得跳转目标行的路访问信息,减少对高速缓存标志存储器的访... 通过分析高速缓存访问的局部性原理,提出当前高速缓存访问行与若干紧邻行链接访问的低功耗指令缓存访问方法.该方法能够在发生相对跳转时依托于相邻行之间的访问链接信息,精确获得跳转目标行的路访问信息,减少对高速缓存标志存储器的访问,达到降低动态功耗的目的.在高速缓存行发生替换时,仅需检测并清除被替换行相邻范围内的若干缓存行的链接信息,从而实现链接关系的正确性.与基于路记忆访问的高速缓存器相比,应用该方法的高速缓存器的动态功耗可以平均减少6%. 展开更多
关键词 指令高速缓存 低功耗 邻行链接访问
下载PDF
基于四叉树的高速乘法器算法研究
9
作者 刘磊 严晓浪 +1 位作者 孟建熠 葛海通 《计算机应用研究》 CSCD 北大核心 2010年第10期3727-3730,共4页
提出了一种基于四叉树结构的高速乘法器自动综合优化算法以提升乘法器运算速度。首先对延时较大的高位积采用四叉树递归直接构建,取代传统部分积进位链,缩短关键路径时延,进而进行分支折合和合并,相邻乘法结果共享部分四叉树,降低硬件... 提出了一种基于四叉树结构的高速乘法器自动综合优化算法以提升乘法器运算速度。首先对延时较大的高位积采用四叉树递归直接构建,取代传统部分积进位链,缩短关键路径时延,进而进行分支折合和合并,相邻乘法结果共享部分四叉树,降低硬件开销。算法同时支持不同面积约束下的自动综合。依此算法的乘法器相比基于Booth算法和Wallace树的乘法器速度提高了10%。 展开更多
关键词 进位链 延迟 四叉树 分支合并 分支折合 遍历
下载PDF
支持程序无缝切换的高性能硬件堆栈
10
作者 陈志坚 孟建熠 +1 位作者 葛海通 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第9期1587-1592,共6页
针对函数调用中上下文切换产生的性能损失,提出一种支持程序无缝切换的嵌入式处理器高性能硬件堆栈.高性能硬件堆栈包括数据栈和返回栈,采用动态可重构的两级缓存机制,消除程序切换的性能开销.数据栈实现单周期多数据压栈/出栈,隐藏程... 针对函数调用中上下文切换产生的性能损失,提出一种支持程序无缝切换的嵌入式处理器高性能硬件堆栈.高性能硬件堆栈包括数据栈和返回栈,采用动态可重构的两级缓存机制,消除程序切换的性能开销.数据栈实现单周期多数据压栈/出栈,隐藏程序切换中的堆栈操作;返回栈实现指令超前预取,消除程序返回时流水线气泡.数据栈与返回栈分别复用数据和指令高速暂存器,实现用户可重构的二级缓存.实验结果显示:本方法平均提升性能10%以上,功耗降低2%. 展开更多
关键词 硬件堆栈 无缝切换 嵌入式处理器 高速暂存器
下载PDF
利用控制流识别进行二进制翻译代码缓存压缩
11
作者 刘畅 陈志坚 +1 位作者 孟建熠 谭年熊 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第6期999-1006,共8页
为了扩展动态二进制翻译产生的本地翻译块,消除因分支目标重复产生的冗余本地代码和返回代码,降低代码缓存的内存占用,提出一种基于控制流识别的代码缓存压缩策略.通过分析投机与非投机2种扩展方式的利弊,结合嵌入式程序分支指令的特征... 为了扩展动态二进制翻译产生的本地翻译块,消除因分支目标重复产生的冗余本地代码和返回代码,降低代码缓存的内存占用,提出一种基于控制流识别的代码缓存压缩策略.通过分析投机与非投机2种扩展方式的利弊,结合嵌入式程序分支指令的特征,通过分支方向和偏移量识别对应的控制流;根据控制流选择适合本地翻译块的扩展方式,压缩动态二进制翻译的代码缓存.运行嵌入式基准测试程序时的实验数据表明,在实现该策略后,QEMU二进制模拟器代码缓存的内存占用降低了10%~40%. 展开更多
关键词 动态二进制翻译 代码缓存压缩 翻译块扩展 控制流
下载PDF
基于内存页面动态合并的旁路转换缓冲器设计
12
作者 陈志坚 孟建熠 +1 位作者 葛海通 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第1期118-122,共5页
针对内存管理中虚拟页面和物理页面连续分配的特性,提出可对相邻页面进行动态合并的旁路转换缓冲器(TLB)设计方法.该方法的核心思想是在处理器运行过程中,通过对相邻页面的递归合并,动态扩展单个TLB表项的地址映射范围,提高TLB表项的利... 针对内存管理中虚拟页面和物理页面连续分配的特性,提出可对相邻页面进行动态合并的旁路转换缓冲器(TLB)设计方法.该方法的核心思想是在处理器运行过程中,通过对相邻页面的递归合并,动态扩展单个TLB表项的地址映射范围,提高TLB表项的利用率并降低TLB缺失率.在两级TLB架构中,提出基于快速uTLB(fuT-LB)和影子uTLB(suTLB)动态切换的新型uTLB结构,作为两级TLB架构的一级缓存,为页面动态合并提供现场和载体,页面合并过程对软件透明.基于Mibench测试基准的实验结果表明,与filter-TLB架构相比,该页面动态合并方法可以平均降低TLB缺失率达27%. 展开更多
关键词 内存管理 旁路转换缓冲器(TLB) 页面动态合并
下载PDF
一种指令快速完成的ROB退休方案
13
作者 李晓明 杨军 孟建熠 《计算机工程与应用》 CSCD 北大核心 2015年第24期40-44,共5页
针对超标量处理器中长延时的指令长时占用重排序缓存的顶端引起流水线退休缓慢的问题,提出了一种将无异常风险的指令快速退休并将运算结果乱序回写的高效退休机制。该方案将结果缓存器与重排序缓存分离,其中结果缓存器作为运算结果回写... 针对超标量处理器中长延时的指令长时占用重排序缓存的顶端引起流水线退休缓慢的问题,提出了一种将无异常风险的指令快速退休并将运算结果乱序回写的高效退休机制。该方案将结果缓存器与重排序缓存分离,其中结果缓存器作为运算结果回写的缓存器,重排序缓存负责指令按序退休与精确异常的维护。重排序缓存单元在确认指令不会发生异常后,将指令从重排序缓存中快速退休,结果缓存器继续等待结果并进行乱序回写。实验结果表明,在硬件资源相同的情况下,通过提高重排序缓存器的使用效率,基于该方案的处理器相比于传统的按序退休处理器的性能平均提高33%。 展开更多
关键词 按序退休 重排序缓存 快速退休 乱序回写
下载PDF
基于高速缓存负荷均衡的动态二进制翻译研究 被引量:3
14
作者 李战辉 刘畅 +1 位作者 孟建熠 严晓浪 《计算机研究与发展》 EI CSCD 北大核心 2015年第9期2105-2113,共9页
针对动态翻译时指令和数据高速缓存访问负荷大幅增加且增幅不均衡导致翻译器性能下降的问题,提出基于指令高速缓存与数据高速缓存访问负荷动态均衡的软硬件协同翻译方法.该方法为处理器设计高速缓存负荷平衡状态,该状态将数据高速缓存... 针对动态翻译时指令和数据高速缓存访问负荷大幅增加且增幅不均衡导致翻译器性能下降的问题,提出基于指令高速缓存与数据高速缓存访问负荷动态均衡的软硬件协同翻译方法.该方法为处理器设计高速缓存负荷平衡状态,该状态将数据高速缓存分为普通区和负荷平衡区(load balancing area,LBA),普通区缓存正常的程序数据,负荷平衡区通过负荷转化通道(load transforming channel,LTC)吸收动态翻译器调度器地址空间转换操作在指令高速缓存上产生的部分负荷,以提高数据高速缓存利用率.EEMBC(embedded microprocessor benchmark consortium)测试基准实验结果表明,在同等处理器资源的情况下,该方法将指令高速缓存访问次数平均减少35%,数据高速缓存访问次数平均减少58%,动态翻译器综合性能提高171%. 展开更多
关键词 动态二进制翻译 间接转移翻译 高速缓存负荷 负荷平衡区 负荷转换通道
下载PDF
基于预测缓存的低功耗TLB快速访问机制 被引量:2
15
作者 武淑丽 孟建熠 +2 位作者 王荣华 严晓浪 葛海通 《计算机应用研究》 CSCD 北大核心 2011年第8期2964-2966,2996,共4页
基于存储器访问局部性原理,提出了一种基于预测缓存的低功耗转换旁置缓冲器(TLB)快速访问机制。该机制采用单端口静态随机存储器(SRAM)代替传统的内容寻址存储器(CAM)结构,通过匹配搜索实现全相连TLB的快速访问,在两级TLB之间设计可配... 基于存储器访问局部性原理,提出了一种基于预测缓存的低功耗转换旁置缓冲器(TLB)快速访问机制。该机制采用单端口静态随机存储器(SRAM)代替传统的内容寻址存储器(CAM)结构,通过匹配搜索实现全相连TLB的快速访问,在两级TLB之间设计可配置的访问预测缓存,用于动态预测第二级TLB访问顺序,减少第二级TLB搜索匹配的延时,并有效降低第二级TLB访问功耗。采用该机制明显降低了TLB的缺失代价,当第一级TLB缺失时访问第二级TLB的平均访问延时接近1个时钟周期,约为原有平均访问延时的20%,增加的面积开销仅为原内存管理单元的1.81%左右,具有低成本、低功耗的特征。 展开更多
关键词 内存管理单元 两级转换旁置缓冲器 内容寻址存储器 静态随机存储器 预测缓存 快速访问 低功耗
下载PDF
基于历史链接关系的指令高速缓存低功耗方法 被引量:3
16
作者 龚帅帅 吴晓波 +1 位作者 孟建熠 丁永林 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第3期467-471,502,共6页
针对现代嵌入式处理器中指令高速缓存功耗显著的问题,提出一种基于Cache行间访问历史链接关系的指令高速缓存低功耗方法.通过创建独立可配置的顺序及跳转链接表项,利用链接表项中缓存的历史信息,消除Cache行间访问时对标志位存储器和冗... 针对现代嵌入式处理器中指令高速缓存功耗显著的问题,提出一种基于Cache行间访问历史链接关系的指令高速缓存低功耗方法.通过创建独立可配置的顺序及跳转链接表项,利用链接表项中缓存的历史信息,消除Cache行间访问时对标志位存储器和冗余路数据存储器的访问功耗.进一步提出可复用的链接状态单元,克服了传统方法中由于缓存缺失引起的清空和重建链接表项的缺陷,显著降低了指令高速缓存访问功耗.实验表明,与传统指令高速缓存相比,本方法在取指单元面积仅增加1.35%的情况下,可平均减少标志位存储器访问次数96.38%. 展开更多
关键词 Cache行间访问 链接表项 链接状态单元 低功耗
下载PDF
面向宽电压应用的容错时钟门控单元设计 被引量:2
17
作者 朱涛涛 项晓燕 +2 位作者 陈晨 孟建熠 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第9期1796-1803,共8页
为了将时钟门控技术应用于时序容错系统中,提出具备时序错误检测与自纠正能力的时钟门控单元.该单元通过监测内部虚拟节点电压变化,得到数据晚到信息;利用该监测信息可以重新打开时钟树网络,完成时钟被错误关断情形的当前周期自主现场纠... 为了将时钟门控技术应用于时序容错系统中,提出具备时序错误检测与自纠正能力的时钟门控单元.该单元通过监测内部虚拟节点电压变化,得到数据晚到信息;利用该监测信息可以重新打开时钟树网络,完成时钟被错误关断情形的当前周期自主现场纠错.给出容错时钟门控单元在现有的多种时钟门控技术中的适用性分析,讨论与之对应的纠错方案选择策略.基于SMIC 40 nm LL工艺库,仅新增12个额外的晶体管实现该单元,从原理图和版图2个层面,对其在宽电压工作下的容错能力进行分析验证,并给出集成到系统设计时所需的时序检查方法.将该单元应用于一款商用处理器C-SKY CK802物理设计中,实验结果表明系统能效相对于传统设计提高了64.7%,而时钟树功耗相对于现有的容错设计下降了32%. 展开更多
关键词 容错电路 时钟门控 宽电压 低功耗 近阈值计算 现场纠错
下载PDF
基于预测极性动态变换的分支预测框架研究 被引量:2
18
作者 陈晨 陈志坚 +1 位作者 孟建熠 严晓浪 《电子与信息学报》 EI CSCD 北大核心 2013年第4期1001-1006,共6页
针对动态分支预测错误率在时间上分布不均匀且高错误率比较集中的特点,该文提出一种可动态变换预测极性的分支预测方法。该方法对未经极性变换的原始动态分支预测错误率进行自适应监测,筛选出原始动态分支预测错误率高于阈值的预测错误... 针对动态分支预测错误率在时间上分布不均匀且高错误率比较集中的特点,该文提出一种可动态变换预测极性的分支预测方法。该方法对未经极性变换的原始动态分支预测错误率进行自适应监测,筛选出原始动态分支预测错误率高于阈值的预测错误高峰期,进而调整预测错误高峰期内分支预测器的预测极性,使经过极性变换的最终动态分支预测错误率在程序运行过程中始终低于设定的阈值。该文同时研究了全局监测、按组监测和局部监测3种分支预测错误率监测方式。实验结果表明,相同硬件资源下该方法比Gshare和Bi-Mode分支预测方法具有更高的分支预测精度。 展开更多
关键词 大规模集成电路 嵌入式处理器 分支预测 预测错误高峰期 预测极性动态变换
下载PDF
基于转移指令特性的动态翻译算法 被引量:2
19
作者 李战辉 孟建熠 +1 位作者 陈志坚 严晓浪 《上海交通大学学报》 EI CAS CSCD 北大核心 2015年第2期173-177,183,共6页
针对传统方法统一转译转移指令导致翻译器效率较低的问题,基于转移目标地址在函数内外的不同特征,提出了直接映射和指令类型转译策略组合的动态翻译方法.对函数内转移指令,直接采用目标架构中对应的分支指令进行映射,通过转移前后指令... 针对传统方法统一转译转移指令导致翻译器效率较低的问题,基于转移目标地址在函数内外的不同特征,提出了直接映射和指令类型转译策略组合的动态翻译方法.对函数内转移指令,直接采用目标架构中对应的分支指令进行映射,通过转移前后指令翻译码的无缝链接,高效转译了条件分支指令,且无需生成源寄存器到内存同步指令;对函数间转移指令,区别对待函数转移和其他转移指令,通过将源程序函数转移指令属性继承给翻译码以提高目标机转移预测器准确率.基于EEMBC(Embedded Microprocessor Benchmark Consortium)测试基准的实验表明,该方法使转移指令翻译码执行指令数平均减少58.9%,转移预测器命中率平均提高80.7%,翻译器整体性能提高12.3%. 展开更多
关键词 动态翻译 转移指令 直接映射 转移预测器
下载PDF
动态二进制翻译中的标志位优化算法 被引量:1
20
作者 王荣华 孟建熠 +1 位作者 陈志坚 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2014年第1期124-129,共6页
为了提高动态翻译器对标志位的模拟与处理效率,针对程序中比例较高的“比较一条件转移”指令对,提出标志位快速映射方法.该方法通过动态识别与提取源程序翻译块内的“比较一条件转移”指令对,利用目标架构的条件依赖关系特征实现“... 为了提高动态翻译器对标志位的模拟与处理效率,针对程序中比例较高的“比较一条件转移”指令对,提出标志位快速映射方法.该方法通过动态识别与提取源程序翻译块内的“比较一条件转移”指令对,利用目标架构的条件依赖关系特征实现“比较一条件转移”指令的高效映射,避免了对这类特殊的标志位定值与引用实施统一而复杂的处理,从而提高动态翻译与执行的速度.基于QEMU的模拟器运行基准程序显示,基于该方法翻译生成的目标标志位处理指令总数比采用其他主流方法减少约20%~90%. 展开更多
关键词 动态二进制翻译 标志位定值与引用 比较一条件转移指令对
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部