期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
High Performance General-Purpose Microprocessors: Past and Future 被引量:5
1
作者 胡伟武 侯锐 +1 位作者 肖俊华 章隆宾 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第5期631-640,共10页
It can be observed from looking backward that processor architecture is improved through spirally shifting from simple to complex and from complex to simple. Nowadays we are facing another shifting from complex to sim... It can be observed from looking backward that processor architecture is improved through spirally shifting from simple to complex and from complex to simple. Nowadays we are facing another shifting from complex to simple, and new innovative architecture will emerge to utilize the continuously increasing transistor budgets. The growing importance of wire delays, changing workloads, power consumption, and design/verification complexity will drive the forthcoming era of Chip Multiprocessors (CMPs). Furthermore, typical CMP projects both from industries and from academics are investigated. Through going into depths for some primary theoretical and implementation problems of CMPs, the great challenges and opportunities to future CMPs are presented and discussed. Finally, the Godson series microprocessors designed in China are introduced. 展开更多
关键词 high performance general-purpose microprocessor instruction level parallelism data level parallelism thread level parallelism chip multiprocessors Godson processor
原文传递
零停顿解决控制冒险的微架构设计
2
作者 付浩东 刘杰 周蔺宁 《长江信息通信》 2023年第8期81-85,共5页
在多级流水架构中,当跳转指令进入译码阶段,跳转地址在译码阶段结束后才能获得,下一条指令在取指阶段并不能及时获得跳转地址,引发控制冒险。针对现有分支预测方法处理控制冒险问题时所需硬件资源较多的情况,提出一种简洁的微架构设计... 在多级流水架构中,当跳转指令进入译码阶段,跳转地址在译码阶段结束后才能获得,下一条指令在取指阶段并不能及时获得跳转地址,引发控制冒险。针对现有分支预测方法处理控制冒险问题时所需硬件资源较多的情况,提出一种简洁的微架构设计方案。微架构首先以管道重组的方式,将所有包含PC的指令前推到译码阶段完成执行。再通过增加寄存器文件写回端口和优化写回逻辑的方式,解决此类指令前推所带来的写回值错乱问题。同时以停顿的方式处理此类指令存在的数据冒险。最后实验表明,微架构能够解决所有控制冒险问题,特别对于无数据相关性的控制冒险问题更是做到零停顿地解决,在硬件资源消耗上低于现有文献提供的同类架构。 展开更多
关键词 risc-V 微架构 跳转指令 控制冒险 指令级并行
下载PDF
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
3
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据级并行 线程级并行
下载PDF
基于TMS320C6201的并行高速实时数字脉冲压缩系统研究 被引量:8
4
作者 李方慧 龙腾 毛二可 《电子学报》 EI CAS CSCD 北大核心 2001年第9期1272-1275,共4页
线性调频脉冲是最经典的大时宽-带宽积信号形式,但是这种信号的数字处理需要极大的处理量.本文研制了一个基于TMS320C6201的高速实时数字脉冲压缩系统,具有1600MIPS处理能力.针对TMS320C6201的特点... 线性调频脉冲是最经典的大时宽-带宽积信号形式,但是这种信号的数字处理需要极大的处理量.本文研制了一个基于TMS320C6201的高速实时数字脉冲压缩系统,具有1600MIPS处理能力.针对TMS320C6201的特点,提出了在VLIW体系结构下,提高FFT并行运算效率的方法,从而使系统完成512点数字脉冲压缩的时间仅为124us,基本达到TMS320C6201的性能极限.针对系统定点运算的问题,提出了定点FFT的改进算法,可以兼顾运算速度和精度的要求;对所提出的定点算法的误差进行了理论分析,并在实际的系统中验证了理论分析的结果.研究并解决了系统实现中高速电路等关键技术问题.目前,该系统已成功应用于某雷达系统中,长期工作稳定可靠. 展开更多
关键词 数字信号处理 线性调频 数字脉冲压缩 TMS320C6201 雷达
下载PDF
LU分解在众核结构仿真器上的指令级调度研究 被引量:5
5
作者 余磊 刘志勇 +1 位作者 宋风龙 叶笑春 《系统仿真学报》 CAS CSCD 北大核心 2011年第12期2603-2610,共8页
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了... 随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了形式化描述,验证了进行指令级调度的必要性。对处理器核内流水线进行详细分析,指出了指令级调度的一般性问题。提出了在众核结构上使用指令级调度和软件流水的方法。针对Splash2程序集里的LU分解算法,使用众核结构的硬件支持,在Scratched Pad Memory(SPM)上给出了调度指令的方案。在众核仿真器Godson-T上仿真了经过指令级调度后的算法,当使用64个线程处理512×512的矩阵时,程序性能达到调度前性能的4倍。 展开更多
关键词 计算机体系结构 众核 加速比 指令级并行 LU分解
下载PDF
VLIW处理器ISA建模与辅助软件优化技术 被引量:3
6
作者 严迎建 叶建森 +1 位作者 刘军伟 徐劲松 《计算机工程与设计》 CSCD 北大核心 2009年第11期2727-2729,2752,共4页
在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模... 在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模拟器、汇编器以及调试器,设计了一个面向VLIW处理器的辅助程序优化环境。利用模拟器和调试器来评估程序的指令级并行度以及资源占用情况,辅助程序开发者优化VLIW处理器程序,从而达到软硬件协作开发VLIW处理器指令级并行性的最终目的。 展开更多
关键词 超长指令字(VLIW) 处理器建模 指令集体系结构 指令集模拟器 指令级并行
下载PDF
高性能微处理器设计技术 被引量:2
7
作者 康宝祥 栾贵兴 《小型微型计算机系统》 CSCD 北大核心 1994年第10期1-10,共10页
最近几年,微处理器设计技术迅速发展,高性能微处理器已经成为当代各类计算机系统的主要支柱。本文首先简要回顾微处理器的发展过程,然后着重介绍微处理器的设计技术,接着概述微处理器的应用,最后介绍国内情况并提出几点看法。
关键词 体系结构 微处理器 设计
下载PDF
一种超椭圆曲线密码处理器并行结构设计 被引量:2
8
作者 方跃坚 沈晴霓 吴中海 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2383-2388,共6页
提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数... 提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数指令A(B+C)+D,并在指令产生过程和执行时对指令进行灵活配置.该设计可以实现核之间的指令级并行处理和不同指令执行阶段的流水线处理.在FPGA上的实验结果表明,与以往研究相比,该设计可以实现对超椭圆曲线密码点乘运算更高的加速. 展开更多
关键词 超椭圆曲线密码系统 并行结构 自定义指令 指令级并行 流水线技术 FPGA
下载PDF
新型体系结构概念──虚拟寄存器与并行的指令处理部件 被引量:3
9
作者 李三立 廖恒 《小型微型计算机系统》 CSCD 北大核心 1995年第6期6-11,共6页
随着程序对地址空间的需求日益提高,研究者提出了虚拟存储器概念,使程序访问的地址空间免受物理存储器的限制、随着面向寄存器的RISC技术发展以及多发射结构中指令调度的日益重要,我们提出了虚拟寄存器的新概念,使寄存器空间不... 随着程序对地址空间的需求日益提高,研究者提出了虚拟存储器概念,使程序访问的地址空间免受物理存储器的限制、随着面向寄存器的RISC技术发展以及多发射结构中指令调度的日益重要,我们提出了虚拟寄存器的新概念,使寄存器空间不受物理寄存器堆大小的束缚,有利于指令调度和寄存器重新命名技术,提高指令级并行性ILP。此外,现代新型RISC处理机都着重于加强数据处理部件中的执行并行度,忽略了放在存储器中指令的处理。我们提出了与数据处理部件能并行工作的指令处理部件设计;经过预处理的指令流提供给处理数据的多执行部件,从而可以进一步显著提高指令级并行性ILP。 展开更多
关键词 虚拟寄存器 指令处理部件 微处理机 体系结构
下载PDF
GCC基于IA-64谓词执行的IF转换技术研究 被引量:1
10
作者 田祖伟 赵克佳 汪小飞 《微电子学与计算机》 CSCD 北大核心 2005年第6期188-192,196,共6页
编译器在提高程序运行速度和发挥处理器性能方面起着非常关键的作用,尤其在IA-64体系结构中,其性能的发挥在很大程序上依赖于相应的编译器。IF转换利用IA-64对谓词执行的支持,删除程序中的某些控制流,将控制依赖转换为数据依赖,以便于... 编译器在提高程序运行速度和发挥处理器性能方面起着非常关键的作用,尤其在IA-64体系结构中,其性能的发挥在很大程序上依赖于相应的编译器。IF转换利用IA-64对谓词执行的支持,删除程序中的某些控制流,将控制依赖转换为数据依赖,以便于优化。文章介绍了IA-64体系结构,并详细分析了GCC中基于IA-64谓词执行的IF转换算法。 展开更多
关键词 IA-64体系结构 指令级并行 GCC 谓词执行 IF转换
下载PDF
一个新的多分支全局软件流水方法 被引量:1
11
作者 汤志忠 张赤红 陈刚 《软件学报》 EI CSCD 北大核心 1996年第1期16-24,共9页
在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销... 在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销和空间开销把我们的方法与其它几种全局软件流水方法进行了比较.模拟实验结果表明:GPMB方法的时间开销和空间开销都比较小,所需要的硬件支持也比较少. 展开更多
关键词 多分支循环 软件流水 指令级 程序 并行性
下载PDF
基于多微处理器主从式核物位监测系统的研制 被引量:1
12
作者 罗向东 赵孝文 +1 位作者 徐晓秋 李北城 《自动化技术与应用》 2011年第5期74-77,共4页
本文介绍了一种基于多微处理器的主从式核物位监测系统的设计。简述了测量原理。从外部结构、硬件电路、通讯协议和软件编制几个方面详细介绍了系统设计。该系统目前在多个发电厂除尘系统得到应用,取得很好的效果。
关键词 并行处理 多微处理器 主从式 核物位
下载PDF
一个支持多分支循环最优执行的VLIW体系结构
13
作者 汤志忠 张赤红 +1 位作者 苏伯珙 赵巍 《计算机研究与发展》 EI CSCD 北大核心 1995年第8期1-9,共9页
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环... 本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环体的多个分支操作可以在一个节拍内同时被执行,因此可以在更大范围内开发指令级并行性。同时还提出了一种叫作流水控制黑板的机制来支持条件分支操作。URPR-2不仅能够以很高的速度执行只含有基本块的循环程序,而且还能够以较低的时间及空间开销来运行含有多个分支的循环程序。 展开更多
关键词 VLIW 体系结构 多分支循环 流水控制黑板
下载PDF
基于CUDA的细粒度并行计算模型研究 被引量:1
14
作者 肖汉 肖波 +1 位作者 冯娜 杨锦锦 《计算机与数字工程》 2013年第5期801-804,共4页
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备... 作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备架构(CUDA)技术,使得通用计算图形处理单元(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。论文从特性、组成和并行架构等几个方面对CUDA并行计算模型进行了研究,充分表明基于GPU进行高性能并行计算,是适应目前大规模计算需求的一个重要发展途径。 展开更多
关键词 图形处理器 图形处理器的通用计算 统一计算设备架构 细粒度并行计算 单指令多数据
下载PDF
Improved Tomasulo algorithm
15
作者 崔光佐 胡铭曾 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 1999年第4期16-19,共4页
Tomasulo algorithm, a dynamic scheduling technique designed for float point unit(FPU) to exploit instruction level parallelism for single thread only is improved into T Tomasulo algorithm to support multiple parallel... Tomasulo algorithm, a dynamic scheduling technique designed for float point unit(FPU) to exploit instruction level parallelism for single thread only is improved into T Tomasulo algorithm to support multiple parallel contexts. FPUs can exploit the parallelisms both within single thread and among multiple threads, and FPUs can be used more effieiently. 展开更多
关键词 multithread SUPERSCALAR architecture Tomasulo ALGORITHM dynamic SCHEDULING instruction level parallelISM
下载PDF
一个VLIW体系结构的单片多处理机
16
作者 汤志忠 张赤红 《计算机研究与发展》 EI CSCD 北大核心 1993年第10期1-8,共8页
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很... 本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。 展开更多
关键词 VLIW 体系结构 单片多处理机
下载PDF
一种VLIW-Superscalar混合微处理器结构 被引量:2
17
作者 陈峰扬 杜勇 +1 位作者 郭德源 何虎 《微电子学与计算机》 CSCD 北大核心 2013年第11期1-5,共5页
描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理... 描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理器上的设计实现.对该处理器结构的性能评测由一款基于Open64的Lily2编译器提供支持.评测结果表明该处理器在信号处理领域和通用处理领域都有较强的性能优势. 展开更多
关键词 超长指令字 超标量 混合结构 微处理器 指令级并行
下载PDF
RISC多发射结构中循环优化的软件流水算法 被引量:1
18
作者 罗玉华 李三立 《计算机学报》 EI CSCD 北大核心 1993年第9期692-700,共9页
软件流水技术是一种很有效的循环优化方法。本文综述了软件流水的基本思想和算法分类;详细描述了三个典型的算法——LAM的算法,完善流水法和增强流水调度法;从时间优化效益,空间效益和计算复杂度等方面对它们作了分析比较;最后,对软件... 软件流水技术是一种很有效的循环优化方法。本文综述了软件流水的基本思想和算法分类;详细描述了三个典型的算法——LAM的算法,完善流水法和增强流水调度法;从时间优化效益,空间效益和计算复杂度等方面对它们作了分析比较;最后,对软件流水技术作了评价。 展开更多
关键词 多发射结构 软件流水 循环优化
下载PDF
数据并行计算机体系结构研究
19
作者 王鹏飞 张发存 段敬红 《计算机工程》 CAS CSCD 北大核心 2011年第15期249-251,共3页
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能... 通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。 展开更多
关键词 PIM技术 数据并行体系结构 可重构总线 处理元阵列 指令集体系结构
下载PDF
一种图形处理用的多格式定点运算器
20
作者 易学渊 李涛 蒲林 《计算机技术与发展》 2014年第10期147-150,共4页
典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超... 典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超标量处理机制,访存采用直接寻址,不含通用寄存器和LD/ST操作。值得一提的是,指令字中设置了阻塞标志位,用于控制互连通信模式,数据字中设置了格式标志位,用于控制多格式定点数据的处理。处理器实现了指令级并行、数据级并行等并行处理方式。 展开更多
关键词 图形处理 超标量 阻塞标志位 指令级并行 数据级并行
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部