期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于超标量处理器的高效FFT映射方法 被引量:2
1
作者 高立宁 朱亮 +1 位作者 刘腾飞 刘峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第9期940-946,共7页
针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化... 针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 展开更多
关键词 快速傅里叶变化(FFT) 高速缓存(cache) 超标量处理器
下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
2
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理器 同时多线程 每周期完成的指令数(IPC)
下载PDF
超标量处理器的转移预测方案研究 被引量:1
3
作者 陈智勇 《微电子学与计算机》 CSCD 北大核心 2006年第11期118-120,125,共4页
随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给... 随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给出了一种新的转移预测方案,称为LGshare,它同时使用全局和局部转移历史信息来改进超标量微处理器的转移预测准确度。当模式历史表(PHT)的大小固定时,与常规的两级预测器相比,LGshare能获得更高的转移预测准确度。 展开更多
关键词 超标量处理器 转移预测 转移历史寄存器 模式历史表
下载PDF
一种面向超标量处理器的高能效指令缓存路选择技术 被引量:1
4
作者 谢子超 陆俊林 +2 位作者 佟冬 王箫音 程旭 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2473-2479,共7页
路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(Combining Way Selective ... 路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(Combining Way Selective Cache,CWS-Cache).基于对路预测和路历史技术适用条件的分析,CWS-Cache在不同的取指场景中选择使用最佳路选择策略,有效降低了指令缓存的取指能耗,并通过缩短非对齐取指组的访问延迟提升处理器性能.实验表明,CWS-Cache将拥有8路组相联指令缓存的基础处理器取指能耗降低了84.98%,性能提升了3.50%.与已有的三种方法相比,CWS-Cache能效性分别提升了15.48%,14.13%和8.76%. 展开更多
关键词 超标量处理器 路预测 路历史
下载PDF
超标量处理器乱序提交机制的研究与设计 被引量:1
5
作者 李昭 刘有耀 +1 位作者 焦继业 潘树朋 《计算机工程》 CAS CSCD 北大核心 2021年第4期180-186,共7页
针对超标量处理器中长周期执行指令延迟退休及持续译码导致的重排序缓存(ROB)阻塞问题,提出一种指令乱序提交机制。通过设计容量可配置的多缓存指令提交结构,实现存储器操作指令和ALU类型指令的分类退休,根据超标量处理器架构及性能需... 针对超标量处理器中长周期执行指令延迟退休及持续译码导致的重排序缓存(ROB)阻塞问题,提出一种指令乱序提交机制。通过设计容量可配置的多缓存指令提交结构,实现存储器操作指令和ALU类型指令的分类退休,根据超标量处理器架构及性能需求对目标缓存和存储缓存容量进行参数化配置降低流水线阻塞风险,同时利用指令目的寄存器编码提交模式加快指令提交速率。实验结果表明,该机制提高了单次指令提交数量,基于该机制的超标量处理器相比传统基于ROB顺序提交机制的超标量处理器在减少硬件开销的情况下平均IPC指数提升46%,相比基于值预测、乱序退休和组提交的超标量处理器平均IPC指数增益为19%,综合性能更优。 展开更多
关键词 超标量处理器 重排序缓存 指令分类退休 乱序提交 目的寄存器编码
下载PDF
XLP832系列:2GHz内核超标量处理器
6
《世界电子元器件》 2009年第7期28-28,共1页
XLP832系列是一个高度可升级的超级系统级芯片(SuperSoC),集成了高端通信系统的主要性能,包括无线和有线安全、网络、存储、数据中心加速、负载平衡,以及应用在各种市场的加速引擎。XLP系列采用RMI多核XLR处理系列的第三代增强架构。
关键词 超标量处理器 2GHz 内核 系统级芯片 通信系统 数据中心 负载平衡 第三代
下载PDF
推断与推测技术在现代高性能微处理器设计中的应用研究 被引量:5
7
作者 单睿 洪缨 侯朝焕 《计算机学报》 EI CSCD 北大核心 2003年第11期1575-1580,共6页
在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超... 在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超块 .推测执行是为打破分支或访存引起的相关问题而进行的操作 ,进一步分为控制推测和数据推测 .控制推测的目的是打破分支和其他操作间的相关性 ,进而由编译器在一个超块内识别并行性 ,减小控制相关的高度 .数据推测则是消去访存相关 ,提高指令级并行度 .该文首先对推断和推测本身进行分析 ,然后在此基础上进一步将推断、推测技术相结合 ,并应用于高性能媒体处理器的设计中 .性能评价和比较结果显示 ,两种技术相结合将比任何一种技术都更加行之有效 . 展开更多
关键词 处理器 设计 推断技术 推测技术 超标量处理器
下载PDF
一种用于容错处理器的指令复制方法
8
作者 李红兵 尚利宏 +1 位作者 周密 金惠华 《计算机科学》 CSCD 北大核心 2010年第5期278-281,共4页
介绍一种在容错处理器中实现指令复制的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。指令复制是容错机制的一种重要功能。详细描述了其实现方法,同时论述了结合指令复制方法对程序控制流的正确性进行检测... 介绍一种在容错处理器中实现指令复制的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。指令复制是容错机制的一种重要功能。详细描述了其实现方法,同时论述了结合指令复制方法对程序控制流的正确性进行检测的问题。 展开更多
关键词 容错机制 时间冗余技术 超标量处理器 控制流故障
下载PDF
超标量DSP的片上调试与实时跟踪支持
9
作者 王刚 张盛兵 黄嵩人 《计算机应用研究》 CSCD 北大核心 2012年第1期207-210,共4页
针对嵌入式系统日益严峻的调试挑战,提出并实现了一种基于32 bit超标量DSP内核的片上调试与实时跟踪架构。该架构通过设计专用的跟踪接口与其他硬件资源,并扩展JTAG端口、存储器保护逻辑与流水线控制逻辑,以较低的硬件开销实现对内核的... 针对嵌入式系统日益严峻的调试挑战,提出并实现了一种基于32 bit超标量DSP内核的片上调试与实时跟踪架构。该架构通过设计专用的跟踪接口与其他硬件资源,并扩展JTAG端口、存储器保护逻辑与流水线控制逻辑,以较低的硬件开销实现对内核的实时运行控制、内部寄存器与存储器的非侵入访问、带复杂触发条件的断点与观察点设置、硬件单步以及程序流的实时跟踪等典型特征的支持,可满足绝大部分嵌入式系统的开发与调试需求。 展开更多
关键词 超标数字信号处理器 片上调试 实时程序跟踪 运行控制 单步调试
下载PDF
一种检测程序控制流故障的方法
10
作者 李红兵 尚利宏 +1 位作者 周密 金惠华 《微计算机信息》 2010年第16期1-3,共3页
本文介绍一种在容错处理器中实现控制流故障检测的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。处理器支持两个指令流并发执行,本文提出的控制流检测算法是通过比较两个时间冗余的指令流的执行结果实现的... 本文介绍一种在容错处理器中实现控制流故障检测的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。处理器支持两个指令流并发执行,本文提出的控制流检测算法是通过比较两个时间冗余的指令流的执行结果实现的,与同类实现方案相比,此方法可以进一步节省硬件资源以及额外的处理器执行时间。 展开更多
关键词 容错机制 时间冗余技术 超标量处理器 控制流故障
下载PDF
ADSP-TS101S的自动引导方式分析与设计实现 被引量:3
11
作者 申军建 张勐 卓智海 《电子设计应用》 2004年第5期64-66,共3页
本文详细分析了美国ADI公司最新推出的TigerSHARC系列数字信号处理器ADSP-TS101S的引导方式,并在最后给出了已成功实现的、基于该DSP处理器的某雷达信号处理机的自动引导设计方案。
关键词 ADSP-TS101S数字信号处理器 静态超标量处理器 信号处理 双运算模块 引导方式 软件设计 雷达信号处理
下载PDF
一种静态LoC关键性预测器设计
12
作者 李清波 苟鹏飞 +2 位作者 孙骏 杨兵 王进祥 《计算机工程》 CAS CSCD 2012年第7期253-256,共4页
针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该... 针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该设计时,程序的每周期指令数平均提升5.3%,性能优于动态LoC预测器。 展开更多
关键词 超标量处理器 结构无关性 动态不变性 静态预测 指令调度
下载PDF
基于区间模型的一级指令Cache缺失损失分析
13
作者 穆雅莉 杨兵 喻明艳 《计算机工程》 CAS CSCD 2012年第7期273-275,278,共4页
一级指令Cache的平均缺失损失被量化为下一级存储系统的访问时间,在进行处理器性能瓶颈分析中简单的量化会引起较大的误差。针对该问题,应用区间模型分析影响一级指令Cache平均缺失损失的前端因素,并用模拟实验进行分析研究,结果表明,... 一级指令Cache的平均缺失损失被量化为下一级存储系统的访问时间,在进行处理器性能瓶颈分析中简单的量化会引起较大的误差。针对该问题,应用区间模型分析影响一级指令Cache平均缺失损失的前端因素,并用模拟实验进行分析研究,结果表明,除下一级存储系统的访问时间外,取指带宽、取指队列的大小、一级指令Cache缺失率及程序特性,会对一级指令Cache平均缺失损失产生影响。 展开更多
关键词 超标量处理器 一级指令Cache 缺失损失 区间模型
下载PDF
一种基于ESVW技术的新型载入存储队列设计
14
作者 马汝亮 谢憬 毛志刚 《微电子学与计算机》 CSCD 北大核心 2013年第7期20-23,共4页
在超标量处理器设计中,SVW技术通过降低重新执行的载入指令数目提高系统性能.本文提出一种基于ESVW技术的新型载入存储队列设计方案,使得SVW结构中的SSBF不仅记录SSN值,同时记录存储地址和数值,重新执行的载入指令就可以从中获取数据而... 在超标量处理器设计中,SVW技术通过降低重新执行的载入指令数目提高系统性能.本文提出一种基于ESVW技术的新型载入存储队列设计方案,使得SVW结构中的SSBF不仅记录SSN值,同时记录存储地址和数值,重新执行的载入指令就可以从中获取数据而不必访问缓存,进一步降低指令的重新执行率.实验结果显示,最优情况下,超过99%的载入指令免于二次访问缓存,系统性能提高约2%. 展开更多
关键词 超标量处理器 LSQ SVW SSBF
下载PDF
Perceptron-Based分支预测SimpleScalar中的实现
15
作者 叶新栋 唐志强 涂时亮 《计算机系统应用》 2010年第1期51-54,94,共5页
SimpIeScaIar是目前国际上常用的一种超标量处理器的性能模拟器。首先分析了SimpleScaIar模拟器的内部体系结构,并在此基础上深入剖析了其分支预测部件的实现机制。针对SimpIeScaIar模拟器分支预测部件只支持基于计数器预测器的局限性,... SimpIeScaIar是目前国际上常用的一种超标量处理器的性能模拟器。首先分析了SimpleScaIar模拟器的内部体系结构,并在此基础上深入剖析了其分支预测部件的实现机制。针对SimpIeScaIar模拟器分支预测部件只支持基于计数器预测器的局限性,通过深入研究Perceptron-based分支预测器的实现机制,提出并设计了如何在SimpleScaIar模拟器中实现Perceptron-based分支预测器的方案。对超标量处理器的性能模拟和研究有着实际的意义。 展开更多
关键词 超标量处理器 模拟器 分支预测 乱序执行
下载PDF
MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE 被引量:3
16
作者 Fu Zhongchuan Chen Hongsong Cui Gang 《Journal of Electronics(China)》 2006年第3期461-466,共6页
Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance archit... Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance architectures have been proposed. But little attention is paid to the thread level superscalar fault tolerance. This letter introduces microthread concept into superscalar processor fault tolerance domain, and puts forward a novel fault tolerance architecture, namely, MicroThread Based (MTB) coarse grained transient fault tolerance superscalar processor architecture, then discusses some detailed implementations. 展开更多
关键词 微线程 基础块码 故障容差 超标量处理器 可靠性
下载PDF
一种基于人工神经元网络的条件分支预测算法 被引量:3
17
作者 张宇 潘国腾 谢伦国 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第z1期101-103,共3页
针对人工神经元网络学习速度较慢的缺点,提出了改进学习算法的基于人工神经元网络的条件分支预测算法.基于SmpleScalar模拟器,用SPEC95基准程序对改进的方案进行了性能评估.模拟测试表明,在学习初期,相比传统人工神经元网络预测算法,改... 针对人工神经元网络学习速度较慢的缺点,提出了改进学习算法的基于人工神经元网络的条件分支预测算法.基于SmpleScalar模拟器,用SPEC95基准程序对改进的方案进行了性能评估.模拟测试表明,在学习初期,相比传统人工神经元网络预测算法,改进的分支预测算法能使预测失效率降低1%~2%,而在稳定期,可获得同等的预测精度. 展开更多
关键词 超标处理器 条件分支预测算法 人工神经元网络
下载PDF
Research on Superscalar Digital Signal Processor
18
作者 DengZhenghong ZhengWei DengLei HuZhengguo 《医学信息(医学与计算机应用)》 2004年第2期64-67,共4页
Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermo... Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermore,in this paper we discuss the validity of instruction prefetch,the branch prediction,the depth of instruction window and other issues that can affect the performance of superscalar DSP. 展开更多
关键词 超标结构数字信号处理器 结构空间理论 流水线作业 数字信号
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部