期刊文献+
共找到89篇文章
< 1 2 5 >
每页显示 20 50 100
Reducing Power and Energy Consumption of Nonvolatile Microcontrollers with Transparent On-Chip Instruction Cache 被引量:1
1
作者 Dahoo Kim Itaru Hida +2 位作者 Eric Shun Fukuda Tetsuya Asai Masato Motomura 《Circuits and Systems》 2014年第11期253-264,共12页
Demands for low-energy microcontrollers have been increasing in recent years. Since most microcontrollers achieve user programmability by integrating nonvolatile (NV) memories such as flash memories for storing their ... Demands for low-energy microcontrollers have been increasing in recent years. Since most microcontrollers achieve user programmability by integrating nonvolatile (NV) memories such as flash memories for storing their programs, the large power consumption required in accessing an NV memory has become a major problem. This problem becomes critical when the power supply voltage of NV microcontrollers is decreased. We can solve this problem by introducing an instruction cache, thus reducing the access frequency of the NV memory. Unlike general-purpose microprocessors, microcontrollers used for real-time applications in embedded systems must accurately calculate program execution time prior to its execution. Therefore, we introduce a “transparent” instruction cache, which does not change the existing NV microcontroller’s cycle-level execution time, for reducing power and energy consumption, but not for improving the processing speed. We have conducted detailed microar chitecture design based on the architecture of a major industrial microcontroller, and we evaluated power and energy consumption for several benchmark programs. Our evaluation shows that the proposed instruction cache can successfully reduce energy consumption in a fairly wide range of practical NV microcontroller configurations. 展开更多
关键词 Embedded System MICROCONTROLLER instruction cache NONVOLATILE Low-Power Design
下载PDF
Large-Capacity and High-Speed Instruction Cache Based on Divide-by-2 Memory Banks
2
作者 Qing-Qing Li Zhi-Guo Yu +2 位作者 Yi Sun Jing-He Wei Xiao-Feng Gu 《Journal of Electronic Science and Technology》 CAS CSCD 2021年第4期335-349,共15页
An increase in the cache capacity is usually accompanied by a decrease in access speed.To balance the capacity and performance of caches,this paper proposes an instruction cache(ICache)architecture based on divide-by-... An increase in the cache capacity is usually accompanied by a decrease in access speed.To balance the capacity and performance of caches,this paper proposes an instruction cache(ICache)architecture based on divide-by-2 memory banks(D2MB-ICache).The control circuit and memory banks of D2MB-ICache work at the central processing unit(CPU)frequency and the divide-by-2 CPU frequency,respectively,so that the capacity of D2MB-ICache can be expanded without lowering its frequency.For sequential access,D2MB-ICache can output the required instruction from memory banks per CPU cycle by dividing the memory banks with a partition mechanism and employing an inversed clock technique.For non-sequential access,D2MB-ICache will fetch certain jump instructions one or two more times,so that it can catch the jump of the request address in time and send the correct instruction to the pipeline.Experimental results show that,compared with conventional ICache,D2MB-ICaches with the same and double capacities show a maximum frequency increase by an average of 14.6%and 6.8%,and a performance improvement by an average of 10.3%and 3.8%,respectively.Moreover,energy efficiency of 64-kB D2MB-ICache is improved by 24.3%. 展开更多
关键词 cache capacity expansion divide-by-2 frequency instruction cache(Icache) inversed clock.
下载PDF
基于指令行为的Cache可靠性评估研究 被引量:4
3
作者 周学海 余洁 +1 位作者 李曦 王志刚 《计算机研究与发展》 EI CSCD 北大核心 2007年第4期553-559,共7页
软错误由高能粒子撞击所产生,对处理器的可靠性产生很大的损害.随着处理器设计目标转向低功耗、高性能和低供电电压,软错误的发生日益频繁,处理器的可靠性研究也随之受到越来越多的关注.针对传统的基于注错仿真的可靠性评估方法效率低... 软错误由高能粒子撞击所产生,对处理器的可靠性产生很大的损害.随着处理器设计目标转向低功耗、高性能和低供电电压,软错误的发生日益频繁,处理器的可靠性研究也随之受到越来越多的关注.针对传统的基于注错仿真的可靠性评估方法效率低的缺陷,提出了一套系统的cache可靠性评估方法,以可靠性指标之一---体系结构易受损因子(architectural vulnerability factor,AVF))---为研究对象,一方面,基于指令行为分析应用程序运行过程中对最终结果不产生影响的指令,从而确定对cache的AVF产生作用的指令;另一方面,根据cache的存储类型、所采取的写策略,结合cache中数据/指令阵列和地址标识阵列的特点,对cache上的各种相邻操作组合对AVF的影响进行了研究,从而完成AVF评估所需的信息分析.实验部分对PISA体系结构指令cache中的指令阵列进行了AVF评估,说明了该方法的有效性. 展开更多
关键词 可靠性 体系结构易受损因子 cache 无效指令
下载PDF
指令cache体系结构级功耗控制策略研究 被引量:4
4
作者 周宏伟 张民选 《电子学报》 EI CAS CSCD 北大核心 2008年第11期2107-2112,共6页
随着工艺尺寸缩小及处理器频率提高,功耗问题已成为当代微处理器设计面临的主要挑战.传统的指令cache(I-Cache)功耗控制策略一般只单独降低指令cache的动态或者静态功耗.提出的两种改进的功耗控制策略,基于昏睡指令cache体系结构,能够... 随着工艺尺寸缩小及处理器频率提高,功耗问题已成为当代微处理器设计面临的主要挑战.传统的指令cache(I-Cache)功耗控制策略一般只单独降低指令cache的动态或者静态功耗.提出的两种改进的功耗控制策略,基于昏睡指令cache体系结构,能够更有效地同时降低指令cache的动态和静态功耗.一种称作"使用双预测端口路预测器的多路路预测策略",另一种称作"基于分阶段访问cache的按需唤醒预测策略",分别用于处理器前端流水线级数保持不变和可以增加额外前端流水线级数两种情形.实验结果表明:与传统的策略相比,提出的两种策略具有更优的能量效率,可以在不显著影响处理器性能的前提下,更有效地降低指令cache和处理器的功耗. 展开更多
关键词 指令 cache 功耗 体系结构
下载PDF
带Cache和精确中断响应的CPU设计 被引量:5
5
作者 刘秋菊 李飞 刘书伦 《实验室研究与探索》 CAS 北大核心 2012年第3期68-74,95,共8页
提出了带Cache和精确中断响应的CPU设计方案,实现指令集MIPS中选取15条指令作为本CPU的基本指令。采用基本5步流水线CPU设计,给出了指令Cache、数据Cache和精确中断响应的设计与实现。测试结果表明,该方案符合设计要求。
关键词 5步流水线 指令cache 精确中断响应 CPU设计
下载PDF
基于取指执行时序范畴的多核共享Cache干扰分析 被引量:4
6
作者 陈芳园 张冬松 +1 位作者 刘聪 王志英 《计算机研究与发展》 EI CSCD 北大核心 2013年第1期206-217,共12页
在多核结构中,获得并行应用线程的安全、精确的最坏情况执行时间(worst case execution time,WCET)的最大挑战之一在于共享资源的竞争冲突检测.在共享Cache的多核处理器中,线程在共享Cache中的指令可能被其他并行线程的指令替换,从而导... 在多核结构中,获得并行应用线程的安全、精确的最坏情况执行时间(worst case execution time,WCET)的最大挑战之一在于共享资源的竞争冲突检测.在共享Cache的多核处理器中,线程在共享Cache中的指令可能被其他并行线程的指令替换,从而导致了线程间在共享Cache上的干扰,因此多核结构下线程WCET需要考虑并行线程间在共享Cache上的干扰.在现有的简单地址映射干扰分析基础上,考虑了指令取指执行时序因素对干扰的影响,提出了非干扰状态的充分不必要条件,根据指令的取指执行时序范畴判断线程在共享Cache上的干扰状态.通过排除非干扰状态,可以进一步精确多核结构中线程的WCET估值.理论分析证明了该方法的有效性.实验结果表明,与当前现有的考虑执行周期和基于逻辑访问先后顺序的方法相比,基于时序方法下的WCET估值分别可以提高12%和7%的精确度. 展开更多
关键词 多核体系结构 共享cache 干扰 取指执行时序 最坏情况下执行时间
下载PDF
面向能耗优化的自适应可重构指令Cache 被引量:1
7
作者 凌明 武建平 +2 位作者 张阳 梅晨 翟婷婷 《微电子学》 CAS CSCD 北大核心 2012年第1期102-106,129,共6页
可重构Cache架构可根据程序的存储资源需求自动调整Cache结构,对系统能耗优化具有重要意义。设计了一种容量和组关联度可重构的指令Cache架构以及与之对应的高效自适应可重构算法。通过选取MiBench和MediaBench中的8个测试例程进行测试... 可重构Cache架构可根据程序的存储资源需求自动调整Cache结构,对系统能耗优化具有重要意义。设计了一种容量和组关联度可重构的指令Cache架构以及与之对应的高效自适应可重构算法。通过选取MiBench和MediaBench中的8个测试例程进行测试验证,提出的自适应可重构Cache与16kB四路组关联配置固定的指令Cache相比,在性能平均仅下降0.34%的情况下,系统总能耗平均降低10.51%。 展开更多
关键词 指令高速缓存 可重构 自适应算法
下载PDF
基于BWDSP指令Cache的PLRU替换算法研究 被引量:3
8
作者 洪兴勇 洪一 《电子技术应用》 北大核心 2013年第1期27-30,共4页
通过BWDSP模拟器对目前常用的几种替换算法和大小不同的指令Cache块进行仿真实验得出不同缺失率。实验结果表明,所提出的PLRU替换算法性能高于LRU、LFU、FIFO替换算法,并使BWDSP整体性能提高到为其他三种替换算法的1.12倍左右。
关键词 BWDSP 指令cache 替换算法 PLRU
下载PDF
高性能微处理器中采用多种预取技术的指令Cache设计 被引量:2
9
作者 周宏伟 张民选 《计算机工程与科学》 CSCD 2004年第11期103-105,共3页
本文分析了传统的指令预取技术,并结合显性指令并行计算(EPIC)体系结构,研究了基于编译器与处理器通信的新的指令预取技术,提出了一种支持多种预取技术的L1指令Cache设计方案。
关键词 指令预取 高性能微处理器 编译器 并行计算 EPIC 体系结构 通信 技术 支持 显性
下载PDF
一种带Cache的嵌入式CPU的设计与实现 被引量:4
10
作者 东野长磊 戚梅 《微型机与应用》 2010年第14期17-19,22,共4页
基于FPGA平台实现了嵌入式RISC CPU的设计。根据项目要求,实现指令集为MIPSCPU指令集的一个子集,分析指令处理过程,构建了嵌入式CPU的5级数据通路。分析了流水线产生的相关性问题,采用数据前推技术和软件编译结合的解决方案。给出了控... 基于FPGA平台实现了嵌入式RISC CPU的设计。根据项目要求,实现指令集为MIPSCPU指令集的一个子集,分析指令处理过程,构建了嵌入式CPU的5级数据通路。分析了流水线产生的相关性问题,采用数据前推技术和软件编译结合的解决方案。给出了控制单元、运算单元、指令Cache的实现与设计。在FPGA平台上实现并验证了CPU的设计。 展开更多
关键词 嵌入式CPU 流水线 数据相关 指令cache
下载PDF
一种面向超标量处理器的低功耗指令Cache设计
11
作者 肖建青 李伟 +1 位作者 张洵颖 沈绪榜 《微电子学与计算机》 CSCD 北大核心 2015年第7期103-106,111,共5页
针对超标量结构中多体并行的流水化指令Cache提出了三种低功耗优化策略,首先是基于Cache路的条件放大技术,它根据标志匹配结果来关闭无关路中敏感放大器对存储阵列的驱动输出;其次是基于Cache行的动态电压调节技术,它只对当前访问的Cach... 针对超标量结构中多体并行的流水化指令Cache提出了三种低功耗优化策略,首先是基于Cache路的条件放大技术,它根据标志匹配结果来关闭无关路中敏感放大器对存储阵列的驱动输出;其次是基于Cache行的动态电压调节技术,它只对当前访问的Cache行提供正常的操作电压,而其他Cache行都处于低电压休眠状态;最后是基于短循环程序的指令回收技术,它通过重复利用过期指令来减少对Cache的冗余访问.实验表明,这个低功耗设计在SPEC和PowerStone基准程序下可以将指令Cache的总功耗分别降低72.4%和84.3%,而处理器的IPC损失分别只有1.1%和0.8%,并且不会带来任何时序开销. 展开更多
关键词 超标量 流水化指令cache 条件放大 动态电压调节 指令回收
下载PDF
一种改进的针对DSA签名的指令Cache计时攻击
12
作者 周平 寇应展 +1 位作者 冀可可 陈财森 《计算机仿真》 CSCD 北大核心 2013年第5期208-212,共5页
针对公钥密码的指令Cache计时攻击是近年来提出的一种新的旁路攻击方式。现有的两种针对公钥密码的指令Cache计时攻击模型尚存在一些不足,一个是攻击前提过于苛刻而难以实现,另一个是无效信息过多导致数据量偏大及后续分析工作量的增加... 针对公钥密码的指令Cache计时攻击是近年来提出的一种新的旁路攻击方式。现有的两种针对公钥密码的指令Cache计时攻击模型尚存在一些不足,一个是攻击前提过于苛刻而难以实现,另一个是无效信息过多导致数据量偏大及后续分析工作量的增加。在充分研究现有模型的基础上,提出一种改进的基于特征Cache组监测的指令Cache计时攻击模型,克服了现有两种模型的不足,在不降低性能的情况下将计时数据减少了约29%,并以DSA数字签名为攻击对象对改进模型进行了实验。 展开更多
关键词 数字签名算法 公钥签名 指令缓存计时攻击 旁路攻击
下载PDF
针对DSA滑动窗口算法实现的指令Cache计时攻击
13
作者 周平 寇应展 刘会英 《军械工程学院学报》 2013年第2期56-60,共5页
在现有的针对RSA等公钥密码的指令Cache计时攻击的研究基础上,提出了一套可行的针对DSA的指令Cache计时攻击方法,并对计时信息采集、识别、密钥恢复等环节进行了研究,给出了一种随机密钥恢复算法。搭建了攻击实验平台,利用编写的间... 在现有的针对RSA等公钥密码的指令Cache计时攻击的研究基础上,提出了一套可行的针对DSA的指令Cache计时攻击方法,并对计时信息采集、识别、密钥恢复等环节进行了研究,给出了一种随机密钥恢复算法。搭建了攻击实验平台,利用编写的间谍程序对滑动窗口算法实现的DSA签名进行了实际攻击,验证了指令Cache计时攻击方法是可行、有效的. 展开更多
关键词 DSA 数字签名 指令cache计时攻击 旁路攻击
下载PDF
EMSIM模拟嵌入式系统MMU/Cache的研究与扩展
14
作者 朱建 郭兵 沈艳 《电脑知识与技术》 2009年第3X期2453-2454,共2页
EMSIM是一款基于指令集的功耗模拟器,EMSIM模拟了嵌入式体系结构各个硬件单元以及指令的执行。本文重点分析了EMSIM对SA-110的MMU/Cache模拟所采用的数据结构和函数模型,并在借鉴Skyeye模拟MMU/Cache的基础上,提出了一种扩展EMSIM模拟MM... EMSIM是一款基于指令集的功耗模拟器,EMSIM模拟了嵌入式体系结构各个硬件单元以及指令的执行。本文重点分析了EMSIM对SA-110的MMU/Cache模拟所采用的数据结构和函数模型,并在借鉴Skyeye模拟MMU/Cache的基础上,提出了一种扩展EMSIM模拟MMU/Cache的方法,实现了EMSIM对ARM7100的MMU/Cache的模拟。扩展后的EMSIM能同时模拟SA-110和ARM7100的MMU/Cache。 展开更多
关键词 EMSIM MMU/cache 嵌入式系统 指令级模拟器
下载PDF
一种基于流水线的指令CACHE优化设计 被引量:3
15
作者 田芳芳 樊晓桠 +1 位作者 靖朝鹏 靳战鹏 《微电子学与计算机》 CSCD 北大核心 2006年第1期93-96,共4页
在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到... 在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到了预期的效果。 展开更多
关键词 指令cache 流水线 存储子系统
下载PDF
基于记录缓冲的低功耗指令Cache方案 被引量:5
16
作者 马志强 季振洲 胡铭曾 《计算机研究与发展》 EI CSCD 北大核心 2006年第4期744-751,共8页
现代微处理器大多采用片上Cache来缓解主存储器与中央处理器(CPU)之间速度的巨大差异,但Cache也成为处理器功耗的主要来源,尤其是其中大部分功耗来自于指令Cache.采用缓冲器可以过滤掉大部分的指令Cache访问,从而降低功耗,但仍存在相当... 现代微处理器大多采用片上Cache来缓解主存储器与中央处理器(CPU)之间速度的巨大差异,但Cache也成为处理器功耗的主要来源,尤其是其中大部分功耗来自于指令Cache.采用缓冲器可以过滤掉大部分的指令Cache访问,从而降低功耗,但仍存在相当程度不必要的存储体访问,据此提出了一种基于记录缓冲的低功耗指令Cache结构RBC.通过记录缓冲器和对存储体的改造,RBC能够过滤大部分不必要的存储体访问,有效地降低了Cache的功耗.对10个SPEC2000标准测试程序的仿真结果表明,与传统基于缓冲器的Cache结构相比,在仅牺牲6.01%处理器性能和3.75%面积的基础上,该方案可以节省24.33%的指令Cache功耗. 展开更多
关键词 低功耗 指令cache 缓冲器 CPU
下载PDF
一种并行指令Cache的设计与实现 被引量:2
17
作者 刘宗林 马卓 +1 位作者 鲁建壮 唐涛 《微电子学与计算机》 CSCD 北大核心 2007年第12期147-149,共3页
为提高通用微处理器的执行效率,研究了高性能指令Cache的体系结构和设计方法。设计了高速并行指令Cache的系统架构,将Cache体访问与线形地址到物理地址的地址转换并行操作,成功实现一个时钟周期内完成地址转换和指令读出的设计目标。详... 为提高通用微处理器的执行效率,研究了高性能指令Cache的体系结构和设计方法。设计了高速并行指令Cache的系统架构,将Cache体访问与线形地址到物理地址的地址转换并行操作,成功实现一个时钟周期内完成地址转换和指令读出的设计目标。详细设计了Cache体和TLB的逻辑结构,并对相关设计参数进行了精心规划,并在设计中采用了奇偶校验逻辑增加了芯片的可靠性。此结构应用于JX微处理器流片成功,并工作可靠正确。 展开更多
关键词 X86结构 指令cache TLB 替换策略
下载PDF
指令Cache优化中代码重排技术研究 被引量:2
18
作者 张定飞 赵克佳 黄春 《计算机工程与应用》 CSCD 北大核心 2006年第7期28-30,68,共4页
代码重排技术是提高指令Cache命中率、提升程序性能的一种重要优化方法。文章介绍了代码重排的几种主要技术,并从排序粒度、实现时机、冲突考虑、算法代价等方面对代码重排技术进行了深入的分析与比较。
关键词 指令cache 代码重排 过程分裂
下载PDF
基于预缓冲机制的低功耗指令Cache 被引量:2
19
作者 王冶 张盛兵 王党辉 《计算机工程》 CAS CSCD 2012年第1期268-269,272,共3页
为降低微处理器中片上Cache的能耗,设计一种基于预缓冲机制的指令Cache。通过预缓冲控制部件的预测,使处理器需要的指令尽可能在缓冲区命中,从而避免访问指令Cache所造成的功耗。对7个测试程序的仿真结果表明,预缓冲机制能节省23.23%的... 为降低微处理器中片上Cache的能耗,设计一种基于预缓冲机制的指令Cache。通过预缓冲控制部件的预测,使处理器需要的指令尽可能在缓冲区命中,从而避免访问指令Cache所造成的功耗。对7个测试程序的仿真结果表明,预缓冲机制能节省23.23%的处理器功耗,程序执行性能平均提升7.53%。 展开更多
关键词 微处理器 低功耗 指令cache 预缓冲 SimpleScalar仿真器
下载PDF
基于对称多处理机的指令Cache验证策略研究 被引量:1
20
作者 谭坚 李岱峰 +1 位作者 王俊 王丽一 《计算机应用与软件》 CSCD 北大核心 2013年第11期231-234,共4页
指令Cache作为高性能计算机系统中指令代码的高速缓冲,在整个系统中占有重要地位,其正确性验证工作很有必要。针对对称多处理机结构的一级和二级指令Cache验证提出多种验证策略,对各种验证策略造成指令Cache的颠簸效果进行实验和分析,... 指令Cache作为高性能计算机系统中指令代码的高速缓冲,在整个系统中占有重要地位,其正确性验证工作很有必要。针对对称多处理机结构的一级和二级指令Cache验证提出多种验证策略,对各种验证策略造成指令Cache的颠簸效果进行实验和分析,并且试图将各种验证策略综合成一个完备的验证系统,从而保证指令Cache设计的正确性。 展开更多
关键词 指令cache 验证策略 完备
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部