期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
25
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
带Cache和精确中断响应的CPU设计
被引量:
5
1
作者
刘秋菊
李飞
刘书伦
《实验室研究与探索》
CAS
北大核心
2012年第3期68-74,95,共8页
提出了带Cache和精确中断响应的CPU设计方案,实现指令集MIPS中选取15条指令作为本CPU的基本指令。采用基本5步流水线CPU设计,给出了指令Cache、数据Cache和精确中断响应的设计与实现。测试结果表明,该方案符合设计要求。
关键词
5步流水线
指令
cache
精确中断响应
CPU设计
下载PDF
职称材料
一种带Cache的嵌入式CPU的设计与实现
被引量:
4
2
作者
东野长磊
戚梅
《微型机与应用》
2010年第14期17-19,22,共4页
基于FPGA平台实现了嵌入式RISC CPU的设计。根据项目要求,实现指令集为MIPSCPU指令集的一个子集,分析指令处理过程,构建了嵌入式CPU的5级数据通路。分析了流水线产生的相关性问题,采用数据前推技术和软件编译结合的解决方案。给出了控...
基于FPGA平台实现了嵌入式RISC CPU的设计。根据项目要求,实现指令集为MIPSCPU指令集的一个子集,分析指令处理过程,构建了嵌入式CPU的5级数据通路。分析了流水线产生的相关性问题,采用数据前推技术和软件编译结合的解决方案。给出了控制单元、运算单元、指令Cache的实现与设计。在FPGA平台上实现并验证了CPU的设计。
展开更多
关键词
嵌入式CPU
流水线
数据相关
指令
cache
下载PDF
职称材料
一种面向超标量处理器的低功耗指令Cache设计
3
作者
肖建青
李伟
+1 位作者
张洵颖
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2015年第7期103-106,111,共5页
针对超标量结构中多体并行的流水化指令Cache提出了三种低功耗优化策略,首先是基于Cache路的条件放大技术,它根据标志匹配结果来关闭无关路中敏感放大器对存储阵列的驱动输出;其次是基于Cache行的动态电压调节技术,它只对当前访问的Cach...
针对超标量结构中多体并行的流水化指令Cache提出了三种低功耗优化策略,首先是基于Cache路的条件放大技术,它根据标志匹配结果来关闭无关路中敏感放大器对存储阵列的驱动输出;其次是基于Cache行的动态电压调节技术,它只对当前访问的Cache行提供正常的操作电压,而其他Cache行都处于低电压休眠状态;最后是基于短循环程序的指令回收技术,它通过重复利用过期指令来减少对Cache的冗余访问.实验表明,这个低功耗设计在SPEC和PowerStone基准程序下可以将指令Cache的总功耗分别降低72.4%和84.3%,而处理器的IPC损失分别只有1.1%和0.8%,并且不会带来任何时序开销.
展开更多
关键词
超标量
流水化指令
cache
条件放大
动态电压调节
指令回收
下载PDF
职称材料
一种基于流水线的指令CACHE优化设计
被引量:
3
4
作者
田芳芳
樊晓桠
+1 位作者
靖朝鹏
靳战鹏
《微电子学与计算机》
CSCD
北大核心
2006年第1期93-96,共4页
在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到...
在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到了预期的效果。
展开更多
关键词
指令
cache
流水线
存储子系统
下载PDF
职称材料
基于区间模型的一级指令Cache缺失损失分析
5
作者
穆雅莉
杨兵
喻明艳
《计算机工程》
CAS
CSCD
2012年第7期273-275,278,共4页
一级指令Cache的平均缺失损失被量化为下一级存储系统的访问时间,在进行处理器性能瓶颈分析中简单的量化会引起较大的误差。针对该问题,应用区间模型分析影响一级指令Cache平均缺失损失的前端因素,并用模拟实验进行分析研究,结果表明,...
一级指令Cache的平均缺失损失被量化为下一级存储系统的访问时间,在进行处理器性能瓶颈分析中简单的量化会引起较大的误差。针对该问题,应用区间模型分析影响一级指令Cache平均缺失损失的前端因素,并用模拟实验进行分析研究,结果表明,除下一级存储系统的访问时间外,取指带宽、取指队列的大小、一级指令Cache缺失率及程序特性,会对一级指令Cache平均缺失损失产生影响。
展开更多
关键词
超标量处理器
一级指令
cache
缺失损失
区间模型
下载PDF
职称材料
龙芯2号处理器设计和性能分析
被引量:
37
6
作者
胡伟武
张福新
李祖松
《计算机研究与发展》
EI
CSCD
北大核心
2006年第6期959-966,共8页
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等...
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
展开更多
关键词
超标量流水线
乱序执行
转移猜测
寄存器重命名
动态调度
非阻塞的
cache
load指令猜测执行
性能分析
下载PDF
职称材料
混合架构通用数字信号处理器设计
被引量:
4
7
作者
王旭
付家为
何虎
《计算机工程与设计》
北大核心
2017年第1期70-74,共5页
针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构。充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数...
针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构。充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数字信号处理方面的性能;支持ARM指令集,顺序超标量模式的双发射和超长指令字模式的六发射能够极大提高地指令并行度。利用DSPStone基准测试程序对处理器进行测试验证,测试结果表明,混合架构的处理器性能平均提升了19.4%,最高提升了38.2%。
展开更多
关键词
超标量
超长指令字
混合架构
指令并行度
流水线
下载PDF
职称材料
简单高性能微处理器的设计
被引量:
5
8
作者
朱怡健
吴强
杨全胜
《电气电子教学学报》
2004年第2期67-70,共4页
提高指令级并行度是处理器体系结构发展的重要方向 ,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会 ,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思...
提高指令级并行度是处理器体系结构发展的重要方向 ,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会 ,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思想。针对在指令并行执行过程中出现的数据相关冲突 ,提出了指令相关性检查算法和数据相关性检查算法。论述了如何利用 VHDL语言的特点 ,准确描述硬件的并行性及系统模块的划分 。
展开更多
关键词
微处理器
指令级并行度
体系结构
超标量流水线
数据相关冲突
下载PDF
职称材料
超标量、超流水线定点RISC核设计
被引量:
2
9
作者
韦健
张明
+2 位作者
周琼芳
遇岩
姚庆栋
《电路与系统学报》
CSCD
2001年第4期56-60,共5页
本文从开发指令级并行度ILP的角度出发,分析了超标量、超流水线处理器的体系结构特点,在此基础上给出了一个定点超标量RISC核设计。该设计采用Top-down设计方法,含三个流水执行单元,指令动态调度,实现非阻塞高速缓存non-blocking-cache...
本文从开发指令级并行度ILP的角度出发,分析了超标量、超流水线处理器的体系结构特点,在此基础上给出了一个定点超标量RISC核设计。该设计采用Top-down设计方法,含三个流水执行单元,指令动态调度,实现非阻塞高速缓存non-blocking-caches机制。
展开更多
关键词
RISC核
指令
微处理器
电路设计
下载PDF
职称材料
基于FPGA的数据记录器关键技术优化
被引量:
2
10
作者
文丰
刘佳宁
刘东海
《弹箭与制导学报》
CSCD
北大核心
2017年第5期119-122,共4页
针对存储系统中的指令误判和单片FLASH读写速率慢的问题,设计了一种基于FPGA的高可靠、高速数据记录器。该记录器采用4线指令组合校验机制,配合双计数器消抖的防指令误判技术,最大限度保证指令的可靠识别;采用批次检测的方法管理坏块,...
针对存储系统中的指令误判和单片FLASH读写速率慢的问题,设计了一种基于FPGA的高可靠、高速数据记录器。该记录器采用4线指令组合校验机制,配合双计数器消抖的防指令误判技术,最大限度保证指令的可靠识别;采用批次检测的方法管理坏块,有效缩短校验时间,同时应用交替双平面交叉写入和流水线编程模式,FLASH写入速度达到29.92 MB/s;应用双FIFO交叉缓存,握手读数的机制,有效保证读取速度。经实践验证,该记录器指令判断准确,读写速率快,具有一定的推广价值。
展开更多
关键词
FLASH
组合校验
批次检测
流水线编程
双缓存握手
下载PDF
职称材料
自修改代码在Godson-X上的处理实现
被引量:
1
11
作者
张浩
钱学海
《计算机工程》
CAS
CSCD
北大核心
2008年第3期102-104,共3页
主流处理器中采用的超标量流水线机制及高速缓存使得SMC操作需要特殊处理。该文基于对多种程序的SMC行为的分析和多种SMC冲突的解决方案的对比,设计了一种灵活高效的SMC解决方法。该方法对结构的复杂度及主流水线的性能的影响小,目前已...
主流处理器中采用的超标量流水线机制及高速缓存使得SMC操作需要特殊处理。该文基于对多种程序的SMC行为的分析和多种SMC冲突的解决方案的对比,设计了一种灵活高效的SMC解决方法。该方法对结构的复杂度及主流水线的性能的影响小,目前已被应用在支持CISC指令集的Godsonx处理器模型上。
展开更多
关键词
自修改代码
超标量流水线
指令高速缓存
下载PDF
职称材料
新一代RISC微处理器的技术特征与趋向
被引量:
1
12
作者
郑飞
陆鑫达
《小型微型计算机系统》
CSCD
北大核心
1995年第9期56-60,共5页
从流水线技术、指令调度技术、Cache设计技术及多媒体支持等方面详细讨论新一代RISC微处理器的技术特征,并简要论述RISC微处理器的发展趋向。
关键词
微处理器
超级标量
多媒体
下载PDF
职称材料
PentiumⅡ微处理器的体系结构
13
作者
郑飞
陆鑫达
《微处理机》
1998年第1期15-18,共4页
本文介绍Intel公司x86系列微处理器的最新成员─—PentiumⅡ微处理器的体系结构,包括PentiumⅡ的结构特征、内部功能单元结构、Cache结构设计等,并重点介绍PentiumⅡ的超标量流水线设计以及指令在流水线中的执行过程。
关键词
超标量
流水线
PentiumⅡ
微处理器
体系结构
下载PDF
职称材料
双流水线超标量体系结构Pentium
14
作者
李三立
《小型微型计算机系统》
CSCD
北大核心
1993年第7期1-11,共11页
本文介绍Intel最新产品Pentium体系结构的主要特点,包括它的部件组成、流水线结构、指令配对法则、浮点部件、片上cache与TLB以及支持多机系统的cache一致性协议。
关键词
PENTIUM
双流水线
体系结构
下载PDF
职称材料
一种降低流水化指令缓冲存储器泄漏功耗的设计方法(英文)
被引量:
1
15
作者
孙含欣
王箫音
+1 位作者
佟冬
程旭
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第1期55-61,共7页
流水化的指令缓冲存储器通常被用于高频率处理器中,以提高取指带宽。然而,在以往的研究工作中,对流水化指令缓冲存储器的泄漏功耗问题关注较少。在工作中发现流水化的指令缓冲存储器较之传统的指令缓冲存储器能够更好地提供降低泄漏功...
流水化的指令缓冲存储器通常被用于高频率处理器中,以提高取指带宽。然而,在以往的研究工作中,对流水化指令缓冲存储器的泄漏功耗问题关注较少。在工作中发现流水化的指令缓冲存储器较之传统的指令缓冲存储器能够更好地提供降低泄漏功耗的机会。通过这一观察,提出根据取指地址的要求来动态管理指令缓冲存储器中行的活动——仅仅使需要访问的行处于正常活动状态,而其他行均被控制在低电压模式下,从而大幅度降低这些行的泄漏功耗。通过模拟评测发现,该方法使流水化的指令缓冲存储器的泄漏功耗降低了77.3%,而处理器的性能损失仅为0.32%。
展开更多
关键词
泄漏功耗
流水化指令缓冲存储器
动态电压调节
下载PDF
职称材料
专用指令分组密码微处理器体系结构研究
被引量:
3
16
作者
于学荣
刘元锋
戴紫彬
《微计算机信息》
北大核心
2007年第03X期84-85,99,共3页
本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析现有分组密码算法结构特点,从实现方式的灵活性和高性能角度出发,提出了一种基于专用指令集的分组密码...
本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析现有分组密码算法结构特点,从实现方式的灵活性和高性能角度出发,提出了一种基于专用指令集的分组密码微处理器的设计思路,并给出了分组密码微处理器的运算单元设计方案及整体系统架构。
展开更多
关键词
分组密码
专用指令集密码微处理器
流水线
超标量体系结构
指令级并行
下载PDF
职称材料
一种新颖的双端口数据高速缓冲存储器
17
作者
张卫新
单睿
侯朝焕
《微电子学》
CAS
CSCD
北大核心
2003年第6期537-540,共4页
VLIW体系结构是媒体处理器的首选技术。解决处理器内核与访存之间的数据瓶颈,可以采用双Load/Store单元。为此,需要开发具有双端口访问能力的数据高速缓冲存储器。通过分析双端口情况下的系统工作时序、缺失(miss)处理和替换算法,设...
VLIW体系结构是媒体处理器的首选技术。解决处理器内核与访存之间的数据瓶颈,可以采用双Load/Store单元。为此,需要开发具有双端口访问能力的数据高速缓冲存储器。通过分析双端口情况下的系统工作时序、缺失(miss)处理和替换算法,设计并实现了一个4路组相连、容量为16kB的双端口数据高速缓冲存储器。通过在高速缓冲存储器内使用双端口SRAM,使其具有真正双端口并行访问能力,提高了处理器内核的数据吞吐能力。
展开更多
关键词
高速缓冲存储器
双端口
超长指令字
微处理器
SRAM
Load/Store
下载PDF
职称材料
计算机系统结构研究的新方向
被引量:
2
18
作者
汪小涓
续敏
《重庆邮电学院学报(自然科学版)》
2001年第4期1-6,共6页
以 RISC技术和分层存贮器为主要特征的计算机系统在科学计算与交易处理领域获得了成功 ,但是新的应用需求和技术困难使得这种现有的体系结构不能适应未来的计算需要。分析了现有的体系结构与以多媒体处理和个人移动计算为主要内容的应...
以 RISC技术和分层存贮器为主要特征的计算机系统在科学计算与交易处理领域获得了成功 ,但是新的应用需求和技术困难使得这种现有的体系结构不能适应未来的计算需要。分析了现有的体系结构与以多媒体处理和个人移动计算为主要内容的应用趋势的不协调性 ,并介绍一种新的计算机系统结构Vector IRAM,为计算机系统结构研究提供参考。
展开更多
关键词
RISC
分层存储器
计算机
系统结构
下载PDF
职称材料
高性能处理系统中自修改代码的高效检测技术
19
作者
谢菲
张浩
《计算机工程与科学》
CSCD
北大核心
2009年第11期30-32,61,共4页
在主流通用处理系统中,超标量机制及高速缓存使得自修改代码(SMC)成为一种需要特殊处理的情况,为了继续支持使用自修改代码的程序并兼容原有程序,在处理系统设计中需要对SMC的情况进行支持。本文分析并对比了多种程序的SMC行为及解决方...
在主流通用处理系统中,超标量机制及高速缓存使得自修改代码(SMC)成为一种需要特殊处理的情况,为了继续支持使用自修改代码的程序并兼容原有程序,在处理系统设计中需要对SMC的情况进行支持。本文分析并对比了多种程序的SMC行为及解决方案,设计了一种利用FIFO队列在流水线外检测SMC的方案,避免了对主流水线的干扰;并通过复用访存通路来检测SMC导致的缓存一致性问题,由于优化后的设计不需要额外的端口,避免了在数据缓存使用多端口设计,使得整体面积下降了1.16%。同零开销的理想方案相比,该方案对性能的影响小于0.1%。
展开更多
关键词
自修改代码
超标量流水线
高速缓存
乱序执行
下载PDF
职称材料
基于RISC-V参数化超标量处理器的优化设计
被引量:
1
20
作者
刘有耀
潘宇晨
《计算机工程与应用》
CSCD
北大核心
2022年第5期66-74,共9页
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将...
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
展开更多
关键词
流水线缓存
RISC-V指令集
超标量
参数化
指令划分
下载PDF
职称材料
题名
带Cache和精确中断响应的CPU设计
被引量:
5
1
作者
刘秋菊
李飞
刘书伦
机构
重庆大学自动化学院
济源职业技术学院信息工程系
出处
《实验室研究与探索》
CAS
北大核心
2012年第3期68-74,95,共8页
基金
国家自然科学基金项目(11001075)
河南省科技厅科技攻关项目(092102210327)
文摘
提出了带Cache和精确中断响应的CPU设计方案,实现指令集MIPS中选取15条指令作为本CPU的基本指令。采用基本5步流水线CPU设计,给出了指令Cache、数据Cache和精确中断响应的设计与实现。测试结果表明,该方案符合设计要求。
关键词
5步流水线
指令
cache
精确中断响应
CPU设计
Keywords
5 stage pipeline
instruction
cache
precise interruption response
design of CPU
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种带Cache的嵌入式CPU的设计与实现
被引量:
4
2
作者
东野长磊
戚梅
机构
山东科技大学信息科学与工程学院
出处
《微型机与应用》
2010年第14期17-19,22,共4页
基金
国家863课题重点项目(2009AA0627018)
山东科技大学"春蕾计划"(2008BZC016)
文摘
基于FPGA平台实现了嵌入式RISC CPU的设计。根据项目要求,实现指令集为MIPSCPU指令集的一个子集,分析指令处理过程,构建了嵌入式CPU的5级数据通路。分析了流水线产生的相关性问题,采用数据前推技术和软件编译结合的解决方案。给出了控制单元、运算单元、指令Cache的实现与设计。在FPGA平台上实现并验证了CPU的设计。
关键词
嵌入式CPU
流水线
数据相关
指令
cache
Keywords
embedded CPU
pipeline
data hazard
instruction
cache
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种面向超标量处理器的低功耗指令Cache设计
3
作者
肖建青
李伟
张洵颖
沈绪榜
机构
西安微电子技术研究所
出处
《微电子学与计算机》
CSCD
北大核心
2015年第7期103-106,111,共5页
基金
国家"八六三"计划项目(2011AA120204)
"十二五"民用航天某预研项目(YY2011-012(D020201))
文摘
针对超标量结构中多体并行的流水化指令Cache提出了三种低功耗优化策略,首先是基于Cache路的条件放大技术,它根据标志匹配结果来关闭无关路中敏感放大器对存储阵列的驱动输出;其次是基于Cache行的动态电压调节技术,它只对当前访问的Cache行提供正常的操作电压,而其他Cache行都处于低电压休眠状态;最后是基于短循环程序的指令回收技术,它通过重复利用过期指令来减少对Cache的冗余访问.实验表明,这个低功耗设计在SPEC和PowerStone基准程序下可以将指令Cache的总功耗分别降低72.4%和84.3%,而处理器的IPC损失分别只有1.1%和0.8%,并且不会带来任何时序开销.
关键词
超标量
流水化指令
cache
条件放大
动态电压调节
指令回收
Keywords
superscalar
,
pipelined instruction cache
conditional amplifying
dynamic voltage scaling
instruction
re-cycling
分类号
TP302.2 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种基于流水线的指令CACHE优化设计
被引量:
3
4
作者
田芳芳
樊晓桠
靖朝鹏
靳战鹏
机构
西北工业大学航空微电子中心
出处
《微电子学与计算机》
CSCD
北大核心
2006年第1期93-96,共4页
基金
国防"十五"预研基金资助(41308010108)
文摘
在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到了预期的效果。
关键词
指令
cache
流水线
存储子系统
Keywords
instruction
cache
, Pipeline, Prefetch, Memory subsystem
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于区间模型的一级指令Cache缺失损失分析
5
作者
穆雅莉
杨兵
喻明艳
机构
哈尔滨工业大学微电子中心
出处
《计算机工程》
CAS
CSCD
2012年第7期273-275,278,共4页
文摘
一级指令Cache的平均缺失损失被量化为下一级存储系统的访问时间,在进行处理器性能瓶颈分析中简单的量化会引起较大的误差。针对该问题,应用区间模型分析影响一级指令Cache平均缺失损失的前端因素,并用模拟实验进行分析研究,结果表明,除下一级存储系统的访问时间外,取指带宽、取指队列的大小、一级指令Cache缺失率及程序特性,会对一级指令Cache平均缺失损失产生影响。
关键词
超标量处理器
一级指令
cache
缺失损失
区间模型
Keywords
superscalar
processor
Level 1
instruction
cache
(L1 I-
cache
)
miss penalty
interval model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
龙芯2号处理器设计和性能分析
被引量:
37
6
作者
胡伟武
张福新
李祖松
机构
中国科学院计算技术研究所计算机系统结构重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第6期959-966,共8页
基金
国家自然科学基金杰出青年基金项目(60325205)
国家"八六三"高技术研究发展计划重点基金项目(2002AA110010
+4 种基金
2005AA110010
2005AA119020)
国家"九七三"重点基础研究发展规划基金项目(2005CB321600)
中国科学院计算技术研究所基础研究基金项目(20056020)
中国科学院计算技术研究所知识创新课题(20056240)~~
文摘
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
关键词
超标量流水线
乱序执行
转移猜测
寄存器重命名
动态调度
非阻塞的
cache
load指令猜测执行
性能分析
Keywords
superscalar
pipeline
out-of-order execution
branch prediction
register renaming
dynamical scheduling
non blocking
cache
load speculation
performance analysis
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
混合架构通用数字信号处理器设计
被引量:
4
7
作者
王旭
付家为
何虎
机构
清华大学微电子学研究所
出处
《计算机工程与设计》
北大核心
2017年第1期70-74,共5页
基金
核高基重大专项基金项目(2012ZX01034001-002)
文摘
针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构。充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数字信号处理方面的性能;支持ARM指令集,顺序超标量模式的双发射和超长指令字模式的六发射能够极大提高地指令并行度。利用DSPStone基准测试程序对处理器进行测试验证,测试结果表明,混合架构的处理器性能平均提升了19.4%,最高提升了38.2%。
关键词
超标量
超长指令字
混合架构
指令并行度
流水线
Keywords
superscalar
VLIW
hybrid microarchitecture
instruction
parallelisms pipeline
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
简单高性能微处理器的设计
被引量:
5
8
作者
朱怡健
吴强
杨全胜
机构
东南大学计算机科学与工程系
出处
《电气电子教学学报》
2004年第2期67-70,共4页
文摘
提高指令级并行度是处理器体系结构发展的重要方向 ,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会 ,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思想。针对在指令并行执行过程中出现的数据相关冲突 ,提出了指令相关性检查算法和数据相关性检查算法。论述了如何利用 VHDL语言的特点 ,准确描述硬件的并行性及系统模块的划分 。
关键词
微处理器
指令级并行度
体系结构
超标量流水线
数据相关冲突
Keywords
instruction
level parallelism
superscalar
pipeline
data dependen
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
超标量、超流水线定点RISC核设计
被引量:
2
9
作者
韦健
张明
周琼芳
遇岩
姚庆栋
机构
浙江大学信息与通信工程研究所ASIC设计研究室
出处
《电路与系统学报》
CSCD
2001年第4期56-60,共5页
基金
国家自然科学基金(69872033)
浙江省综合信息网技术重点实验室
教育部骨干教师计划资助项目
文摘
本文从开发指令级并行度ILP的角度出发,分析了超标量、超流水线处理器的体系结构特点,在此基础上给出了一个定点超标量RISC核设计。该设计采用Top-down设计方法,含三个流水执行单元,指令动态调度,实现非阻塞高速缓存non-blocking-caches机制。
关键词
RISC核
指令
微处理器
电路设计
Keywords
instruction
-level parallelism
super-scalar
super-
pipelined
non-blocking-
cache
reservation station.
分类号
TP362 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于FPGA的数据记录器关键技术优化
被引量:
2
10
作者
文丰
刘佳宁
刘东海
机构
中北大学电子测试技术国家重点实验室
出处
《弹箭与制导学报》
CSCD
北大核心
2017年第5期119-122,共4页
基金
国家自然科学基金(51225504)资助
文摘
针对存储系统中的指令误判和单片FLASH读写速率慢的问题,设计了一种基于FPGA的高可靠、高速数据记录器。该记录器采用4线指令组合校验机制,配合双计数器消抖的防指令误判技术,最大限度保证指令的可靠识别;采用批次检测的方法管理坏块,有效缩短校验时间,同时应用交替双平面交叉写入和流水线编程模式,FLASH写入速度达到29.92 MB/s;应用双FIFO交叉缓存,握手读数的机制,有效保证读取速度。经实践验证,该记录器指令判断准确,读写速率快,具有一定的推广价值。
关键词
FLASH
组合校验
批次检测
流水线编程
双缓存握手
Keywords
FLASH
combinational
instruction
batch check
pipeline program
double-
cache
shake-hands
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
自修改代码在Godson-X上的处理实现
被引量:
1
11
作者
张浩
钱学海
机构
中国科学院计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第3期102-104,共3页
文摘
主流处理器中采用的超标量流水线机制及高速缓存使得SMC操作需要特殊处理。该文基于对多种程序的SMC行为的分析和多种SMC冲突的解决方案的对比,设计了一种灵活高效的SMC解决方法。该方法对结构的复杂度及主流水线的性能的影响小,目前已被应用在支持CISC指令集的Godsonx处理器模型上。
关键词
自修改代码
超标量流水线
指令高速缓存
Keywords
self modifying code
superscalar
pipeline
instruction
high speed
cache
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
新一代RISC微处理器的技术特征与趋向
被引量:
1
12
作者
郑飞
陆鑫达
机构
上海交通大学计算机系
出处
《小型微型计算机系统》
CSCD
北大核心
1995年第9期56-60,共5页
文摘
从流水线技术、指令调度技术、Cache设计技术及多媒体支持等方面详细讨论新一代RISC微处理器的技术特征,并简要论述RISC微处理器的发展趋向。
关键词
微处理器
超级标量
多媒体
Keywords
Microprocessor, RISC,
superscalar
,
instruction
scheduling,
cache
design, Multimedia, VLIW
分类号
TP362 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
PentiumⅡ微处理器的体系结构
13
作者
郑飞
陆鑫达
机构
上海交通大学计算机系
出处
《微处理机》
1998年第1期15-18,共4页
文摘
本文介绍Intel公司x86系列微处理器的最新成员─—PentiumⅡ微处理器的体系结构,包括PentiumⅡ的结构特征、内部功能单元结构、Cache结构设计等,并重点介绍PentiumⅡ的超标量流水线设计以及指令在流水线中的执行过程。
关键词
超标量
流水线
PentiumⅡ
微处理器
体系结构
Keywords
Microprocessor,
superscalar
,
cache
, Pipeline,Pentium
分类号
TP362 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
双流水线超标量体系结构Pentium
14
作者
李三立
机构
清华大学
出处
《小型微型计算机系统》
CSCD
北大核心
1993年第7期1-11,共11页
文摘
本文介绍Intel最新产品Pentium体系结构的主要特点,包括它的部件组成、流水线结构、指令配对法则、浮点部件、片上cache与TLB以及支持多机系统的cache一致性协议。
关键词
PENTIUM
双流水线
体系结构
Keywords
Pentium Double pipeline pipes
instruction
pair
superscalar
architecture
分类号
TP362 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种降低流水化指令缓冲存储器泄漏功耗的设计方法(英文)
被引量:
1
15
作者
孙含欣
王箫音
佟冬
程旭
机构
北京大学微处理器研究开发中心
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第1期55-61,共7页
基金
国家"863"计划(2004AA1Z1010)资助项目
文摘
流水化的指令缓冲存储器通常被用于高频率处理器中,以提高取指带宽。然而,在以往的研究工作中,对流水化指令缓冲存储器的泄漏功耗问题关注较少。在工作中发现流水化的指令缓冲存储器较之传统的指令缓冲存储器能够更好地提供降低泄漏功耗的机会。通过这一观察,提出根据取指地址的要求来动态管理指令缓冲存储器中行的活动——仅仅使需要访问的行处于正常活动状态,而其他行均被控制在低电压模式下,从而大幅度降低这些行的泄漏功耗。通过模拟评测发现,该方法使流水化的指令缓冲存储器的泄漏功耗降低了77.3%,而处理器的性能损失仅为0.32%。
关键词
泄漏功耗
流水化指令缓冲存储器
动态电压调节
Keywords
leakage power
pipelined instruction cache
dynamic voltage scaling
分类号
TP333 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
专用指令分组密码微处理器体系结构研究
被引量:
3
16
作者
于学荣
刘元锋
戴紫彬
机构
信息工程大学电子技术学院
出处
《微计算机信息》
北大核心
2007年第03X期84-85,99,共3页
基金
公安部金盾工程资助项目(编号不公开)
文摘
本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析现有分组密码算法结构特点,从实现方式的灵活性和高性能角度出发,提出了一种基于专用指令集的分组密码微处理器的设计思路,并给出了分组密码微处理器的运算单元设计方案及整体系统架构。
关键词
分组密码
专用指令集密码微处理器
流水线
超标量体系结构
指令级并行
Keywords
Block Cipher
Application-Specific
instruction
-Set Cipher Processor
Pipeline
superscalar
ILP
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种新颖的双端口数据高速缓冲存储器
17
作者
张卫新
单睿
侯朝焕
机构
中国科学院研究生院 中国科学院声学研究所
出处
《微电子学》
CAS
CSCD
北大核心
2003年第6期537-540,共4页
基金
国家"九七三"重点基础研究发展规划项目(G1999032904)
中国科学院知识创新工程先期启动项目资助
文摘
VLIW体系结构是媒体处理器的首选技术。解决处理器内核与访存之间的数据瓶颈,可以采用双Load/Store单元。为此,需要开发具有双端口访问能力的数据高速缓冲存储器。通过分析双端口情况下的系统工作时序、缺失(miss)处理和替换算法,设计并实现了一个4路组相连、容量为16kB的双端口数据高速缓冲存储器。通过在高速缓冲存储器内使用双端口SRAM,使其具有真正双端口并行访问能力,提高了处理器内核的数据吞吐能力。
关键词
高速缓冲存储器
双端口
超长指令字
微处理器
SRAM
Load/Store
Keywords
Very long
instruction
word (VLIW)
Microprocessor
Load/Store
Pipeline
cache
分类号
TP333.8 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
计算机系统结构研究的新方向
被引量:
2
18
作者
汪小涓
续敏
机构
Electrical Engineering Dept
曲阜师范大学电教系
出处
《重庆邮电学院学报(自然科学版)》
2001年第4期1-6,共6页
文摘
以 RISC技术和分层存贮器为主要特征的计算机系统在科学计算与交易处理领域获得了成功 ,但是新的应用需求和技术困难使得这种现有的体系结构不能适应未来的计算需要。分析了现有的体系结构与以多媒体处理和个人移动计算为主要内容的应用趋势的不协调性 ,并介绍一种新的计算机系统结构Vector IRAM,为计算机系统结构研究提供参考。
关键词
RISC
分层存储器
计算机
系统结构
Keywords
superscalar
pipelining
ILP
cache
DRAM
compiling
multimedia
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
高性能处理系统中自修改代码的高效检测技术
19
作者
谢菲
张浩
机构
中国科学院计算技术研究所前瞻研究实验室
出处
《计算机工程与科学》
CSCD
北大核心
2009年第11期30-32,61,共4页
文摘
在主流通用处理系统中,超标量机制及高速缓存使得自修改代码(SMC)成为一种需要特殊处理的情况,为了继续支持使用自修改代码的程序并兼容原有程序,在处理系统设计中需要对SMC的情况进行支持。本文分析并对比了多种程序的SMC行为及解决方案,设计了一种利用FIFO队列在流水线外检测SMC的方案,避免了对主流水线的干扰;并通过复用访存通路来检测SMC导致的缓存一致性问题,由于优化后的设计不需要额外的端口,避免了在数据缓存使用多端口设计,使得整体面积下降了1.16%。同零开销的理想方案相比,该方案对性能的影响小于0.1%。
关键词
自修改代码
超标量流水线
高速缓存
乱序执行
Keywords
self modification code
superscalar
pipeline
cache
out-of-order execution
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于RISC-V参数化超标量处理器的优化设计
被引量:
1
20
作者
刘有耀
潘宇晨
机构
西安邮电大学电子工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2022年第5期66-74,共9页
基金
国家自然科学基金(61834005,61874087,61772417,61802304,61634004)。
文摘
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
关键词
流水线缓存
RISC-V指令集
超标量
参数化
指令划分
Keywords
pipeline buffer
RISC-V
instruction
set
superscalar
parameterization
instruction
partition
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
带Cache和精确中断响应的CPU设计
刘秋菊
李飞
刘书伦
《实验室研究与探索》
CAS
北大核心
2012
5
下载PDF
职称材料
2
一种带Cache的嵌入式CPU的设计与实现
东野长磊
戚梅
《微型机与应用》
2010
4
下载PDF
职称材料
3
一种面向超标量处理器的低功耗指令Cache设计
肖建青
李伟
张洵颖
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2015
0
下载PDF
职称材料
4
一种基于流水线的指令CACHE优化设计
田芳芳
樊晓桠
靖朝鹏
靳战鹏
《微电子学与计算机》
CSCD
北大核心
2006
3
下载PDF
职称材料
5
基于区间模型的一级指令Cache缺失损失分析
穆雅莉
杨兵
喻明艳
《计算机工程》
CAS
CSCD
2012
0
下载PDF
职称材料
6
龙芯2号处理器设计和性能分析
胡伟武
张福新
李祖松
《计算机研究与发展》
EI
CSCD
北大核心
2006
37
下载PDF
职称材料
7
混合架构通用数字信号处理器设计
王旭
付家为
何虎
《计算机工程与设计》
北大核心
2017
4
下载PDF
职称材料
8
简单高性能微处理器的设计
朱怡健
吴强
杨全胜
《电气电子教学学报》
2004
5
下载PDF
职称材料
9
超标量、超流水线定点RISC核设计
韦健
张明
周琼芳
遇岩
姚庆栋
《电路与系统学报》
CSCD
2001
2
下载PDF
职称材料
10
基于FPGA的数据记录器关键技术优化
文丰
刘佳宁
刘东海
《弹箭与制导学报》
CSCD
北大核心
2017
2
下载PDF
职称材料
11
自修改代码在Godson-X上的处理实现
张浩
钱学海
《计算机工程》
CAS
CSCD
北大核心
2008
1
下载PDF
职称材料
12
新一代RISC微处理器的技术特征与趋向
郑飞
陆鑫达
《小型微型计算机系统》
CSCD
北大核心
1995
1
下载PDF
职称材料
13
PentiumⅡ微处理器的体系结构
郑飞
陆鑫达
《微处理机》
1998
0
下载PDF
职称材料
14
双流水线超标量体系结构Pentium
李三立
《小型微型计算机系统》
CSCD
北大核心
1993
0
下载PDF
职称材料
15
一种降低流水化指令缓冲存储器泄漏功耗的设计方法(英文)
孙含欣
王箫音
佟冬
程旭
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008
1
下载PDF
职称材料
16
专用指令分组密码微处理器体系结构研究
于学荣
刘元锋
戴紫彬
《微计算机信息》
北大核心
2007
3
下载PDF
职称材料
17
一种新颖的双端口数据高速缓冲存储器
张卫新
单睿
侯朝焕
《微电子学》
CAS
CSCD
北大核心
2003
0
下载PDF
职称材料
18
计算机系统结构研究的新方向
汪小涓
续敏
《重庆邮电学院学报(自然科学版)》
2001
2
下载PDF
职称材料
19
高性能处理系统中自修改代码的高效检测技术
谢菲
张浩
《计算机工程与科学》
CSCD
北大核心
2009
0
下载PDF
职称材料
20
基于RISC-V参数化超标量处理器的优化设计
刘有耀
潘宇晨
《计算机工程与应用》
CSCD
北大核心
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部