期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE 被引量:3
1
作者 Fu Zhongchuan Chen Hongsong Cui Gang 《Journal of Electronics(China)》 2006年第3期461-466,共6页
Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance archit... Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance architectures have been proposed. But little attention is paid to the thread level superscalar fault tolerance. This letter introduces microthread concept into superscalar processor fault tolerance domain, and puts forward a novel fault tolerance architecture, namely, MicroThread Based (MTB) coarse grained transient fault tolerance superscalar processor architecture, then discusses some detailed implementations. 展开更多
关键词 Microthread Basic block Coarse grained fault tolerance superscalar processor
下载PDF
A Programmable High Speed Vision System with Superscalar PE and Its Parallel Computing Language
2
作者 Jie Yang Cong Shi +1 位作者 Xitian Long Nanjian Wu 《Open Journal of Applied Sciences》 2013年第1期65-67,共3页
Pixel-parallel PE and SIMD architectures are widely used in high-speed image processing to enhance computing power. With fully exploiting the data level parallelism of low- and middle-level image processing, SIMD arch... Pixel-parallel PE and SIMD architectures are widely used in high-speed image processing to enhance computing power. With fully exploiting the data level parallelism of low- and middle-level image processing, SIMD architecture is able to finish great amount of computation with much less instruction cycle thus satisfy the high-speed system requirement. The main computation parts in those SIMD image processing hardware is known as PE (processing element) and it is responsible for transferring, storing and processing the image data. This paper describes a high-speed vision system with superscalar PE to enhance system performance and its dedicated parallel computing language specifically devel-oped for this vision system. The vision system can achieve motion detection at more than 2000fps and face detection at more than 100 fps which overwhelms some general serial CPUs in the same applications. 展开更多
关键词 High-Speed Vision System SIMD superscalar PE
下载PDF
一种VLIW-Superscalar混合微处理器结构 被引量:2
3
作者 陈峰扬 杜勇 +1 位作者 郭德源 何虎 《微电子学与计算机》 CSCD 北大核心 2013年第11期1-5,共5页
描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理... 描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理器上的设计实现.对该处理器结构的性能评测由一款基于Open64的Lily2编译器提供支持.评测结果表明该处理器在信号处理领域和通用处理领域都有较强的性能优势. 展开更多
关键词 超长指令字 超标量 混合结构 微处理器 指令级并行
下载PDF
VLIW-Superscalar混合结构处理器分支预测结构设计 被引量:1
4
作者 杜勇 李秦华 +3 位作者 陈峰扬 郭德源 李笑天 何虎 《计算机应用与软件》 CSCD 北大核心 2014年第8期25-27,78,共4页
在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的D... 在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的Dhrystone、Coremark基准测试程序。实验结果表明,在添加分支预测功能后,处理器的性能提高30%~35%。 展开更多
关键词 超标量 超长指令字 数字信号处理器 分支预测
下载PDF
面向Superscalar与VLIW混合架构处理器的调试器设计 被引量:1
5
作者 杨群 李笑天 何虎 《计算机应用与软件》 CSCD 2015年第5期84-87,163,共5页
描述基于GDB的支持超标量(Superscalar)和超长指令字(VLIW)双模式混合架构的调试器设计。该调试器设计分为代理调试端和客户端两部分,代理调试端实现基于RSP协议的基本调试代理功能,客户端实现目标处理器的添加,调试器初始化,寄存器数... 描述基于GDB的支持超标量(Superscalar)和超长指令字(VLIW)双模式混合架构的调试器设计。该调试器设计分为代理调试端和客户端两部分,代理调试端实现基于RSP协议的基本调试代理功能,客户端实现目标处理器的添加,调试器初始化,寄存器数据、操作码等的处理。测试结果表明调试器实现了远程调试,查看、修改寄存器及内存值,添加、删除断点,反汇编,查看栈信息及单步等程序调试功能。 展开更多
关键词 GDB 超标量 超长指令字 Gem5 混合架构 调试器
下载PDF
一种支持Superscalar-VLIW混合架构处理器的混合分支预测设计
6
作者 付家为 王旭 何虎 《计算机应用与软件》 2017年第2期106-111,共6页
描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSP... 描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSPstone程序。实验结果表明,添加分支预测结构使得处理器性能平均提升23%,并且混合型预测结构相比单一预测结构在准确度方面优势明显。 展开更多
关键词 数字信号处理器 超标量 超长指令字 分支预测 双峰预测 PAP
下载PDF
Research on Superscalar Digital Signal Processor
7
作者 DengZhenghong ZhengWei DengLei HuZhengguo 《医学信息(医学与计算机应用)》 2004年第2期64-67,共4页
Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermo... Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermore,in this paper we discuss the validity of instruction prefetch,the branch prediction,the depth of instruction window and other issues that can affect the performance of superscalar DSP. 展开更多
关键词 超标量结构数字信号处理器 结构空间理论 流水线作业 数字信号
下载PDF
基于RISC-V的超标量处理器的ROB压缩方法
8
作者 王洁 付丹阳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1185-1192,共8页
RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量... RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量,影响处理器性能。基于指令与微指令在ROB中的存储解耦方法,使用一个新的队列(RAB)存储每条微指令的目的寄存器的重命名映射关系等信息,每项ROB只存储其对应指令拆分的微指令的公共信息,ROB与RAB分别控制指令与微指令的提交与回滚,减少了存储信息冗余,缓解了由向量指令拆分的微指令过多导致的in-flight指令数量减少问题。在上述方法的基础上,同时实现了标量指令的ROB压缩,在ROB项数不变的情况下,增加了in-flight指令的最大数量。最终的仿真结果表明,此方法有效提高了处理器性能。 展开更多
关键词 RISC-V 超标量 处理器 ROB压缩
下载PDF
我国水产品中农药扑草净残留超标的警示分析 被引量:29
9
作者 李庆鹏 秦达 +4 位作者 崔文慧 郭芹 项丽霞 靳婧 哈益明 《食品安全质量检测学报》 CAS 2014年第1期108-112,共5页
由于我国水产品中扑草净频频超标,日本加强对我国水产品的命令检查,出现了严重的贸易壁垒。本文通过对国内外扑草净残留限量标准的现状、扑草净在我国的使用情况、日本对扑草净残留的研究进行分析,综合评价了扑草净超标对我国水产品出... 由于我国水产品中扑草净频频超标,日本加强对我国水产品的命令检查,出现了严重的贸易壁垒。本文通过对国内外扑草净残留限量标准的现状、扑草净在我国的使用情况、日本对扑草净残留的研究进行分析,综合评价了扑草净超标对我国水产品出口的影响。通过分析,本文建议重点开展对鱼类、贝类及虾类等产品中扑草净含量的风险评估,为制定水产品中扑草净限量标准提供科学依据;同时强化对鱼类、贝类、虾类等产品中农药扑草净含量的监测,避免高残留产品冲击国内市场。 展开更多
关键词 水产品 扑草净残留 限量标准 超标
下载PDF
龙芯2号处理器设计和性能分析 被引量:37
10
作者 胡伟武 张福新 李祖松 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期959-966,共8页
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等... 介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求. 展开更多
关键词 超标量流水线 乱序执行 转移猜测 寄存器重命名 动态调度 非阻塞的cache load指令猜测执行 性能分析
下载PDF
SMA:前瞻性多线程体系结构 被引量:4
11
作者 肖刚 周兴铭 +1 位作者 徐明 邓鹍 《计算机学报》 EI CSCD 北大核心 1999年第6期582-590,共9页
提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的... 提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的指令窗口形成一个大的动态指令窗口,开发出程序中更大的ILP,又利用多线程执行机制屏蔽各种长延迟操作,达到较高的资源利用率;介绍了SMA执行模型,并讨论了SMA处理器的实现和其中的关键技术.这些关键技术包括:线程控制、分布式寄存器重命名、指令发射执行、中断处理和处理器对编译优化的要求.性能分析结果表明SMA处理器可以适应各种不同类型的程序,以达到高性能,如果采用较好的编译支持和线程预测算法。 展开更多
关键词 前瞻性执行 多线程 SMA 体系结构 微处理器
下载PDF
超细粉煤灰配制碎砖骨料混凝土试验研究 被引量:11
12
作者 赵玉青 邢振贤 《混凝土》 CAS CSCD 北大核心 2011年第10期142-144,共3页
采用粉煤灰超量取代法配制再生混凝土,利用正交试验法分析了影响再生混凝土强度的主要因素。并选择了配制粉煤灰再生混凝土的较佳配合比。试验结果表明:在再生骨料掺量、粉煤灰取代水泥量、超代系数和水灰比4个因素中,对再生混凝土不同... 采用粉煤灰超量取代法配制再生混凝土,利用正交试验法分析了影响再生混凝土强度的主要因素。并选择了配制粉煤灰再生混凝土的较佳配合比。试验结果表明:在再生骨料掺量、粉煤灰取代水泥量、超代系数和水灰比4个因素中,对再生混凝土不同龄期抗压强度的影响顺序是不一样的,但是最主要的影响因素都是水灰比。经正交试验确定的较优配合比设计的混凝土和易性和强度均能满足一般工程的质量要求。 展开更多
关键词 粉煤灰超量取代法 再生混凝土 正交试验 影响因素
下载PDF
单芯片多处理器的性能优势 被引量:11
13
作者 黄光奇 周兴铭 《计算机工程与科学》 CSCD 2001年第1期35-38,64,共5页
本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行... 本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行性的开发更加有效。 展开更多
关键词 单芯片多处理器 超标量 执行时间 集成电路 微处理器
下载PDF
32位嵌入式CPU的微体系结构设计 被引量:3
14
作者 马鹏 卢景芬 龚令侃 《计算机工程》 CAS CSCD 北大核心 2008年第B09期136-138,共3页
介绍一款自主设计的嵌入式CPU的微体系结构,给出流水线的设计、分支预测的策略、乱序执行指令的顺序提交、精确异常等议题。提出了CPU内5个执行单元的功能,以及CPU的存储子系统。目前该CPU的前端设计已经完成并通过了FPGA验证。
关键词 微体系结构 超标量技术 分支预测 精确异常
下载PDF
基于超标量处理器的高效FFT映射方法 被引量:2
15
作者 高立宁 朱亮 +1 位作者 刘腾飞 刘峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第9期940-946,共7页
针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化... 针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 展开更多
关键词 快速傅里叶变化(FFT) 高速缓存(cache) 超标量处理器
下载PDF
超标量微处理器研究与应用 被引量:4
16
作者 邓正宏 康慕宁 罗旻 《微电子学与计算机》 CSCD 北大核心 2004年第9期59-63,共5页
首先介绍了超标量体系结构的基础,深入研究了超标量体系结构的基本特点和性能分析,详细地探讨了超标量体系中遇到的数据相关和结构相关的问题以及解决相关问题的Tomasulo算法及计分牌算法。在文章的最后,简单的讨论了动态转移预测和重... 首先介绍了超标量体系结构的基础,深入研究了超标量体系结构的基本特点和性能分析,详细地探讨了超标量体系中遇到的数据相关和结构相关的问题以及解决相关问题的Tomasulo算法及计分牌算法。在文章的最后,简单的讨论了动态转移预测和重排序缓冲机制。 展开更多
关键词 超标量 微处理器
下载PDF
混合架构通用数字信号处理器设计 被引量:4
17
作者 王旭 付家为 何虎 《计算机工程与设计》 北大核心 2017年第1期70-74,共5页
针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构。充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数... 针对嵌入式设备对高性能数字信号处理器低功耗的需求,结合超标量处理器与超长指令字处理器各自的优点,提出一种将两种架构进行融合的单核处理器设计方法,取代ARM+DSP异构架构。充分发挥两者优势,降低处理器的功耗和面积,提高处理器在数字信号处理方面的性能;支持ARM指令集,顺序超标量模式的双发射和超长指令字模式的六发射能够极大提高地指令并行度。利用DSPStone基准测试程序对处理器进行测试验证,测试结果表明,混合架构的处理器性能平均提升了19.4%,最高提升了38.2%。 展开更多
关键词 超标量 超长指令字 混合架构 指令并行度 流水线
下载PDF
多线程体系结构现状及发展 被引量:2
18
作者 肖刚 徐明 周兴铭 《计算机科学》 CSCD 北大核心 1998年第4期70-76,共7页
一、引言多线程体系结构结合了数据流结构和传统的冯氏控制流结构,既保持了指令执行的高性能,又实现了处理器的高效率,是一种通用而高效的延迟隐藏技术。早期的多线程体系结构可以追朔到CI)巳6600和HEP,现今的多线程处理器中的很多技术... 一、引言多线程体系结构结合了数据流结构和传统的冯氏控制流结构,既保持了指令执行的高性能,又实现了处理器的高效率,是一种通用而高效的延迟隐藏技术。早期的多线程体系结构可以追朔到CI)巳6600和HEP,现今的多线程处理器中的很多技术都可以在它们那里找到踪迹。 展开更多
关键词 计算机 体系结构 多线程体系结构
下载PDF
流水线前端资源分配及其性能影响研究 被引量:2
19
作者 潘琢金 郑彩平 杨华 《计算机工程》 CAS CSCD 北大核心 2010年第14期275-277,共3页
动态超标量处理器的性能取决于流水线各段资源的配置情况,通常认为资源越多对性能提升越有利。对流水线前端资源的分配进行研究,发现各类资源的合理搭配更重要,资源配置过多或搭配不当可能产生负面影响。分析各类资源的潜在互相干扰、... 动态超标量处理器的性能取决于流水线各段资源的配置情况,通常认为资源越多对性能提升越有利。对流水线前端资源的分配进行研究,发现各类资源的合理搭配更重要,资源配置过多或搭配不当可能产生负面影响。分析各类资源的潜在互相干扰、影响性能的现象、过程及深层次原因,并给出一些参考建议。 展开更多
关键词 超标量 流水线前端 资源分配
下载PDF
一种硬件预取机构及其对系统影响的研究 被引量:3
20
作者 邓让钰 谢伦国 肖立权 《计算机工程与科学》 CSCD 2001年第6期70-72,共3页
存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬... 存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬件预取方法 ,即在存储控制器中设计一个VPFB机构用来隐藏访存延迟 。 展开更多
关键词 微处理器 硬件预取机构 存储控制器 CPU
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部