期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE 被引量:3
1
作者 Fu Zhongchuan Chen Hongsong Cui Gang 《Journal of Electronics(China)》 2006年第3期461-466,共6页
Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance archit... Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance architectures have been proposed. But little attention is paid to the thread level superscalar fault tolerance. This letter introduces microthread concept into superscalar processor fault tolerance domain, and puts forward a novel fault tolerance architecture, namely, MicroThread Based (MTB) coarse grained transient fault tolerance superscalar processor architecture, then discusses some detailed implementations. 展开更多
关键词 微线程 基础块码 故障容差 超标量处理器 可靠性
下载PDF
Research on Superscalar Digital Signal Processor
2
作者 DengZhenghong ZhengWei DengLei HuZhengguo 《医学信息(医学与计算机应用)》 2004年第2期64-67,共4页
Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermo... Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermore,in this paper we discuss the validity of instruction prefetch,the branch prediction,the depth of instruction window and other issues that can affect the performance of superscalar DSP. 展开更多
关键词 超标量结构数字信号处理器 结构空间理论 流水线作业 数字信号
下载PDF
基于RISC-V的超标量处理器的ROB压缩方法
3
作者 王洁 付丹阳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1185-1192,共8页
RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量... RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量,影响处理器性能。基于指令与微指令在ROB中的存储解耦方法,使用一个新的队列(RAB)存储每条微指令的目的寄存器的重命名映射关系等信息,每项ROB只存储其对应指令拆分的微指令的公共信息,ROB与RAB分别控制指令与微指令的提交与回滚,减少了存储信息冗余,缓解了由向量指令拆分的微指令过多导致的in-flight指令数量减少问题。在上述方法的基础上,同时实现了标量指令的ROB压缩,在ROB项数不变的情况下,增加了in-flight指令的最大数量。最终的仿真结果表明,此方法有效提高了处理器性能。 展开更多
关键词 RISC-V 超标量 处理器 ROB压缩
下载PDF
VLIW-Superscalar混合结构处理器分支预测结构设计 被引量:1
4
作者 杜勇 李秦华 +3 位作者 陈峰扬 郭德源 李笑天 何虎 《计算机应用与软件》 CSCD 北大核心 2014年第8期25-27,78,共4页
在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的D... 在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的Dhrystone、Coremark基准测试程序。实验结果表明,在添加分支预测功能后,处理器的性能提高30%~35%。 展开更多
关键词 超标量 超长指令字 数字信号处理器 分支预测
下载PDF
一种支持Superscalar-VLIW混合架构处理器的混合分支预测设计
5
作者 付家为 王旭 何虎 《计算机应用与软件》 2017年第2期106-111,共6页
描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSP... 描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSPstone程序。实验结果表明,添加分支预测结构使得处理器性能平均提升23%,并且混合型预测结构相比单一预测结构在准确度方面优势明显。 展开更多
关键词 数字信号处理器 超标量 超长指令字 分支预测 双峰预测 PAP
下载PDF
处理器值预测技术研究
6
作者 黄立波 杨凌 +5 位作者 杨乾明 马胜 王永文 隋兵才 沈立 徐炜遐 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3591-3618,共28页
当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能... 当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能的计算系统.处理器值预测技术是一种能在无需改变存储系统情况下有效缓解存储墙问题的解决方案,其通过预测性地打破数据真相关进而让更多的指令可以在乱序处理器中并行执行,而无需等待由于访存等操作造成的长周期指令执行.近年来,值预测在各个方面都有了实质性的进步,但现如今还没有商用处理器使用这一技术,这主要是由于值预测技术的使用还面临许多挑战:现有的处理器的流水线架构不能直接使用值预测技术;值预测所需的预测值传递机制需要额外的硬件资源开销;值预测器巨大的存储开销让其很难在片上实现;由于值预测错误时的性能惩罚大,因此预测准确率较低的值预测器会降低处理器性能.针对这些问题,本文以值预测技术为中心,围绕值预测技术相关的流水线架构、值预测器结构和错误恢复机制三个方面分别详细论述了国内外研究成果以及其对于各个问题挑战的解决策略.最后,本文对当今的处理器值预测技术进行了总结并对未来的研究方向进行了展望. 展开更多
关键词 值预测 数据依赖 处理器 流水线 存储墙 超标量
下载PDF
高效多分支预测器设计与实现
7
作者 杨凌 周锦文 +5 位作者 王京 兰孟桥 丁梓坚 杨实 王永文 黄立波 《计算机科学与探索》 CSCD 北大核心 2023年第8期1842-1851,共10页
分支预测是保证处理器性能的重要技术,尤其在当今广泛应用的超标量处理器中,分支预测器的各项属性极大地影响着处理器的整体性能、功耗和面积。为了在超标量处理器中获得具有较高性价比的分支预测器,尝试使用了TAGE预测器对取指宽度内... 分支预测是保证处理器性能的重要技术,尤其在当今广泛应用的超标量处理器中,分支预测器的各项属性极大地影响着处理器的整体性能、功耗和面积。为了在超标量处理器中获得具有较高性价比的分支预测器,尝试使用了TAGE预测器对取指宽度内的所有分支进行预测,并利用分支预测竞赛平台对预测器的理想性能进行了评估,发现其预测能力是足以满足预测条件的。但在实践过程中发现多分支取指时分支预测器和分支目标缓存内均会存在冲突的情况,这严重影响了预测器的性能。为了解决以上问题,在单个TAGE分支预测器的基础上增加了额外的预测通路,独立地保存和预测额外的分支指令信息。并利用硬件描述语言在超标量处理器中实现了这一预测器,同时将其与单个TAGE分支预测器进行了嵌入式处理器常用基准程序dhrystone、coremark和embench的性能对比实验。实验结果表明,优化后的分支预测器性能提高了14.1个百分点,而存储开销只增加了9.06%。最后通过实验数据分析,发现这一方案不仅有利于额外的分支指令预测,而且可以通过更加准确的分支历史信息获取实现更加准确的单分支取指预测。 展开更多
关键词 分支预测 TAGE 嵌入式 超标量 处理器
下载PDF
基于超标量处理器的高效FFT映射方法 被引量:2
8
作者 高立宁 朱亮 +1 位作者 刘腾飞 刘峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第9期940-946,共7页
针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化... 针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 展开更多
关键词 快速傅里叶变化(FFT) 高速缓存(cache) 超标量处理器
下载PDF
一种硬件预取机构及其对系统影响的研究 被引量:3
9
作者 邓让钰 谢伦国 肖立权 《计算机工程与科学》 CSCD 2001年第6期70-72,共3页
存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬... 存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬件预取方法 ,即在存储控制器中设计一个VPFB机构用来隐藏访存延迟 。 展开更多
关键词 微处理器 硬件预取机构 存储控制器 CPU
下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
10
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理器 同时多线程 每周期完成的指令数(IPC)
下载PDF
超标量技术及结构研究与应用 被引量:2
11
作者 赵庆敏 邱岚 +1 位作者 杜宏露 熊镝 《微计算机应用》 2007年第2期208-210,共3页
超标量处理机采用ILP技术,在Scoroboard或Tomasulo算法的基础上,使用动态和静态相结合的调度算法,使多条执行流水线并行执行多条指令。讨论超标量处理机采用的技术以及结构,并举例PowerPC620。
关键词 超标量处理机 指令级并行度 Scoroboard算法 Tomasulo算法
下载PDF
超标量处理器的转移预测方案研究 被引量:1
12
作者 陈智勇 《微电子学与计算机》 CSCD 北大核心 2006年第11期118-120,125,共4页
随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给... 随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给出了一种新的转移预测方案,称为LGshare,它同时使用全局和局部转移历史信息来改进超标量微处理器的转移预测准确度。当模式历史表(PHT)的大小固定时,与常规的两级预测器相比,LGshare能获得更高的转移预测准确度。 展开更多
关键词 超标量处理器 转移预测 转移历史寄存器 模式历史表
下载PDF
现代RISC处理器的流水线技术 被引量:1
13
作者 郑飞 《微电子学与计算机》 CSCD 北大核心 1993年第9期28-31,35,共5页
在阐明现代RISC处理器采用的超级标量技术与超级流水线技术的基础上,介绍超级标量处理器IBM RISC Systcm/6000、超级流水线处理器MIPS R4000及RISC/CISC混合处理器Intcl 486的流水线设计,论述了其实现中的问题与技术,包括流水线的数据... 在阐明现代RISC处理器采用的超级标量技术与超级流水线技术的基础上,介绍超级标量处理器IBM RISC Systcm/6000、超级流水线处理器MIPS R4000及RISC/CISC混合处理器Intcl 486的流水线设计,论述了其实现中的问题与技术,包括流水线的数据依赖性、分支预测、存储器障碍、代码重排等.最后指出发展趋向。 展开更多
关键词 流水线 处理器 RISC
下载PDF
一种双端口发射队列及其性能优化
14
作者 隋兵才 孙彩霞 +1 位作者 王永文 郭辉 《计算机工程与科学》 CSCD 北大核心 2021年第7期1168-1172,共5页
发射队列是超标量处理器的乱序控制部件,也是处理器中的关键部件,对整个处理器的性能起着决定性的作用。提出了一种能够有效提高乱序超标量处理器性能的双端口发射队列结构。该队列能够根据指令之间的相关性,估算指令的发射时机,将指令... 发射队列是超标量处理器的乱序控制部件,也是处理器中的关键部件,对整个处理器的性能起着决定性的作用。提出了一种能够有效提高乱序超标量处理器性能的双端口发射队列结构。该队列能够根据指令之间的相关性,估算指令的发射时机,将指令分配到不同的队列中。对比了2种不同的发射策略对性能的影响,输入端标记执行流水线的策略能够获得较高的IPC性能,最大能提高10.68%。同时对比了采用相同发射策略时,发射队列项数对性能的影响,相比于24项发射队列,32项发射队列能够平均提升2%的IPC性能,最大可以提升8.59%。 展开更多
关键词 微处理器 乱序超标量 发射队列
下载PDF
基于MIPS指令集的超标量和超长指令字混合架构处理器设计 被引量:2
15
作者 李源 马海林 何虎 《计算机应用研究》 CSCD 北大核心 2016年第6期1723-1726,共4页
针对嵌入式和移动设备对处理器高性能低功耗日趋强烈的要求,提出一种基于MIPS指令集的顺序超标量和超长指令字混合架构处理器设计方案,便于以同构多核架构代替目前业界普遍采用的CPU与DSP异构结构,降低功耗面积,同时以VLIW模式获得较好... 针对嵌入式和移动设备对处理器高性能低功耗日趋强烈的要求,提出一种基于MIPS指令集的顺序超标量和超长指令字混合架构处理器设计方案,便于以同构多核架构代替目前业界普遍采用的CPU与DSP异构结构,降低功耗面积,同时以VLIW模式获得较好的DSP性能。在PD(processor designer)平台下以LISA语言建立处理器的周期精度软件模拟器,通用性能和DSP性能分别由dhrystone、coremark基准测试程序及EEMBC的telecom测试程序进行验证。测试结果表明,该设计以较低的硬件开销通过混合架构获得较高的数字信号处理性能,在高性能低功耗的处理器应用场景中拥有良好的适用性。 展开更多
关键词 混合架构 超标量 超长指令字 处理器
下载PDF
现代高性能处理器PowerPC620与Alpha21164的核心技术分析 被引量:2
16
作者 胡良校 方滨兴 +1 位作者 胡铭曾 陈耀强 《小型微型计算机系统》 EI CSCD 北大核心 1997年第6期38-45,共8页
PowerPC620和Alpha21164是当今世界上两种高性能的处理器,它们的实现体现了两种截然不同的高性能处理器设计思想,故从体系结构、指令流水线、指令调度规则、转移处理、存储系统等角度对他们作一详细分析。
关键词 超标量 微处理器 高性能处理器 结构
下载PDF
专用指令分组密码微处理器体系结构研究 被引量:3
17
作者 于学荣 刘元锋 戴紫彬 《微计算机信息》 北大核心 2007年第03X期84-85,99,共3页
本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析现有分组密码算法结构特点,从实现方式的灵活性和高性能角度出发,提出了一种基于专用指令集的分组密码... 本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析现有分组密码算法结构特点,从实现方式的灵活性和高性能角度出发,提出了一种基于专用指令集的分组密码微处理器的设计思路,并给出了分组密码微处理器的运算单元设计方案及整体系统架构。 展开更多
关键词 分组密码 专用指令集密码微处理器 流水线 超标量体系结构 指令级并行
下载PDF
静态超标量MCU-DSP内核的Load先行访存调度 被引量:2
18
作者 刘博 张盛兵 黄嵩人 《计算机应用研究》 CSCD 北大核心 2013年第2期450-453,共4页
针对嵌入式控制与数字信号处理混合应用领域,建立了一种基于MCU-DSP融合架构处理器的Load先行机制。该内核使用静态超标量技术,拥有整数、存取、循环三条流水线,并采用特殊的四级流水。在存取流水线中,Load先行机制通过动态调度指令的... 针对嵌入式控制与数字信号处理混合应用领域,建立了一种基于MCU-DSP融合架构处理器的Load先行机制。该内核使用静态超标量技术,拥有整数、存取、循环三条流水线,并采用特殊的四级流水。在存取流水线中,Load先行机制通过动态调度指令的访存顺序,实现了Load指令对Store指令的先行,提前了整数流水线中运算操作数的准备,加快了流水线的处理速度。 展开更多
关键词 微控制器(MCU) 数字信号处理器(DSP) Load先行 静态超标量 动态调度
下载PDF
一种静态LoC关键性预测器设计
19
作者 李清波 苟鹏飞 +2 位作者 孙骏 杨兵 王进祥 《计算机工程》 CAS CSCD 2012年第7期253-256,共4页
针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该... 针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该设计时,程序的每周期指令数平均提升5.3%,性能优于动态LoC预测器。 展开更多
关键词 超标量处理器 结构无关性 动态不变性 静态预测 指令调度
下载PDF
一种基于ESVW技术的新型载入存储队列设计
20
作者 马汝亮 谢憬 毛志刚 《微电子学与计算机》 CSCD 北大核心 2013年第7期20-23,共4页
在超标量处理器设计中,SVW技术通过降低重新执行的载入指令数目提高系统性能.本文提出一种基于ESVW技术的新型载入存储队列设计方案,使得SVW结构中的SSBF不仅记录SSN值,同时记录存储地址和数值,重新执行的载入指令就可以从中获取数据而... 在超标量处理器设计中,SVW技术通过降低重新执行的载入指令数目提高系统性能.本文提出一种基于ESVW技术的新型载入存储队列设计方案,使得SVW结构中的SSBF不仅记录SSN值,同时记录存储地址和数值,重新执行的载入指令就可以从中获取数据而不必访问缓存,进一步降低指令的重新执行率.实验结果显示,最优情况下,超过99%的载入指令免于二次访问缓存,系统性能提高约2%. 展开更多
关键词 超标量处理器 LSQ SVW SSBF
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部