期刊文献+

二次检索

题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
共找到253篇文章
< 1 2 13 >
每页显示 20 50 100
MVSim:面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器
1
作者 刘仲 李程 +3 位作者 田希 刘胜 邓让钰 钱程东 《计算机工程与科学》 CSCD 北大核心 2024年第2期191-199,共9页
设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟... 设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟,采用多线程技术实现了多核处理器的高效和可扩展模拟。实验结果表明,MVSim能够准确模拟多核处理器的目标程序执行,模拟结果完全正确,具有良好的可扩展性。MVSim的平均模拟速度分别是RTL模拟和CCS的227倍和5倍,平均性能误差约为2.9%。 展开更多
关键词 体系结构模拟器 vliw 多核向量处理器模型 性能模型 节拍精准模拟器
下载PDF
VLIW处理器的变长指令跨边界派发窗设计
2
作者 王东旭 汪东 万江华 《电讯技术》 北大核心 2024年第12期2038-2043,共6页
针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代... 针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代码体积。同时该派发窗引入指令跨边界派发机制,进一步排出指令间无用气泡。通过搭建派发窗仿真模型,并基于DSP/VoLIB库进行仿真,结果显示,采用新型变长指令跨边界派发窗能够充分发挥指令级并行优势。经编译器调度优化后,库中典型程序体积比传统派发窗平均降低约19.26%,处理器性能提升约15.4%。 展开更多
关键词 超长指令字(vliw) 指令派发 指令压缩 跨边界派发窗
下载PDF
基于流体系结构的VLIW二维压缩及并行解压 被引量:2
3
作者 李功丽 戴紫彬 +3 位作者 徐进辉 王寿成 朱玉飞 李丹 《电子学报》 EI CAS CSCD 北大核心 2017年第9期2256-2262,共7页
VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对... VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对流体系结构上的VLIW指令特点,提出了二维压缩,对VLIW进行垂直与水平两个方向上的压缩,且水平解压可以与代码执行并行,并通过设置堆栈寄存器缓存循环入口地址.实验结果表明二维压缩有效解决了VLIW代码体积膨胀问题,可以使指令存储器的面积减少36.48%,并使得整个CISP系统面积减少了7.85%. 展开更多
关键词 流处理器 vliw 二维压缩 并行解压
下载PDF
VLIW体系CPU仿真器MCS的设计与实现 被引量:2
4
作者 李锋 王雷 +1 位作者 刘又诚 周伯生 《计算机工程与应用》 CSCD 北大核心 2001年第21期165-168,共4页
仿真器是进行硬件设计评估,系统软件设计开发和计算机体系结构研究的有力工具。文章以一款VLIW(超长指令字)结构的CPU仿真器———MCS为实例,讨论了指令集仿真器设计的一般原理和关键技术。在对目标CPU进行仿真的基础上,通过模拟部分操... 仿真器是进行硬件设计评估,系统软件设计开发和计算机体系结构研究的有力工具。文章以一款VLIW(超长指令字)结构的CPU仿真器———MCS为实例,讨论了指令集仿真器设计的一般原理和关键技术。在对目标CPU进行仿真的基础上,通过模拟部分操作系统功能,MCS可以导入并且运行经过目标机编译器编译的目标可执行代码,进行可配置的数据收集和数据分析,从而达到评估CPU设计,分析指令效率,支持编译系统调试的目的。 展开更多
关键词 CPU 仿真器 vliw MCS 设计
下载PDF
基于VLIW体系结构的DSP寄存器堆的设计 被引量:2
5
作者 胡正伟 韩月秋 +1 位作者 陈禾 张晓明 《华北电力大学学报(自然科学版)》 CAS 北大核心 2006年第3期66-69,共4页
在研究了基于VLIW体系结构DSP的特点基础上,通过对寄存器堆的组织结构、组成单元、功能实现等方面的分析,提出了该结构寄存器堆的设计方案。该方案实现了多组数据的正确并行读写操作,满足了VLIW体系结构的CPU对多数据流处理的要求。该... 在研究了基于VLIW体系结构DSP的特点基础上,通过对寄存器堆的组织结构、组成单元、功能实现等方面的分析,提出了该结构寄存器堆的设计方案。该方案实现了多组数据的正确并行读写操作,满足了VLIW体系结构的CPU对多数据流处理的要求。该方案针对VLIW体系结构采用流水线操作、条件执行的特点,通过对写入数据分别采用写控制信号的方法,实现流水线阻塞和指令的条件执行。由于VLIW体系结构具有很多共性,该方案可以根据具体的硬件进行修改,具有很好的可移植性。 展开更多
关键词 vliw 数字信号处理器 寄存器堆 流水线阻塞
下载PDF
VLIW处理器ISA建模与辅助软件优化技术 被引量:3
6
作者 严迎建 叶建森 +1 位作者 刘军伟 徐劲松 《计算机工程与设计》 CSCD 北大核心 2009年第11期2727-2729,2752,共4页
在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模... 在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模拟器、汇编器以及调试器,设计了一个面向VLIW处理器的辅助程序优化环境。利用模拟器和调试器来评估程序的指令级并行度以及资源占用情况,辅助程序开发者优化VLIW处理器程序,从而达到软硬件协作开发VLIW处理器指令级并行性的最终目的。 展开更多
关键词 超长指令字(vliw) 处理器建模 指令集体系结构 指令集模拟器 指令级并行
下载PDF
VLIW DSP体系结构及其性能优化的软件方法 被引量:6
7
作者 章立生 韩承德 《计算机工程与应用》 CSCD 北大核心 2001年第5期25-27,31,共4页
影响DSP系统性能的因素主要有DSP处理器的体系结构、存储器系统、外设接口等硬件技术和程序优化等软件技术,其中软件的优化设计在DSP性能优化中起着越来越重要的作用。文章简要介绍了常见DSP系统的体系结构和存储器组织方法,并通过实... 影响DSP系统性能的因素主要有DSP处理器的体系结构、存储器系统、外设接口等硬件技术和程序优化等软件技术,其中软件的优化设计在DSP性能优化中起着越来越重要的作用。文章简要介绍了常见DSP系统的体系结构和存储器组织方法,并通过实例说明了对VLIW DSP系统进行软件优化的几种技术。 展开更多
关键词 DSP 体系结构 软件流水 vliw 数字信号处理器 性能优化 软件方法
下载PDF
VLIW体系结构微处理器的控制流分析与其模拟软件设计 被引量:2
8
作者 霍玉梅 王沁 《小型微型计算机系统》 CSCD 北大核心 2001年第5期513-516,共4页
本文在研究超长指令字 (VL IW)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构特征和执行特征 ,通过比较 VL IW体系结构微处理器模拟器的两种设计方案 ,选定以结构为基础设计模拟器的方案 ,并解决了模拟器的设计难... 本文在研究超长指令字 (VL IW)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构特征和执行特征 ,通过比较 VL IW体系结构微处理器模拟器的两种设计方案 ,选定以结构为基础设计模拟器的方案 ,并解决了模拟器的设计难点——串并行冲突的问题 . 展开更多
关键词 vliw 体系结构 微处理器 控制流分析 模拟软件 指令部件
下载PDF
VLIW处理器系统级验证平台的设计与实现 被引量:3
9
作者 杨焱 侯朝焕 《电子测量与仪器学报》 CSCD 2007年第2期81-85,共5页
本文提出了一种新的VLIW处理器验证平台的实现方法。采用寄存器跟踪技术,建立了一个与RTL模型一致的抽象功能验证模型,基于VXI总线测试技术,实现了高度集成化的系统芯片验证平台,弥补了单一验证技术的不足,设计期功能仿真满足测试覆盖... 本文提出了一种新的VLIW处理器验证平台的实现方法。采用寄存器跟踪技术,建立了一个与RTL模型一致的抽象功能验证模型,基于VXI总线测试技术,实现了高度集成化的系统芯片验证平台,弥补了单一验证技术的不足,设计期功能仿真满足测试覆盖率的要求,并与板级功能测试仿真保持一致,充分证明了方法的有效性。 展开更多
关键词 功能验证 vliw处理器 寄存器跟踪 测试
下载PDF
VLIW体系结构微处理器的一种设计方法 被引量:2
10
作者 王昭顺 张建林 曹文彬 《计算机科学》 CSCD 北大核心 2000年第8期40-42,共3页
微处理器体系结构的发展经历了三个不同的阶段,以Intel早期X86产品为代表的CISC体系结构微处理器;以MIPS、PA-RISC、SPARC、ALPHA、PowerPC等为代表的RISC体系结构微处理器;以Intel近期产品为代表的CISC—RISC混合型体系结构微处理器。R... 微处理器体系结构的发展经历了三个不同的阶段,以Intel早期X86产品为代表的CISC体系结构微处理器;以MIPS、PA-RISC、SPARC、ALPHA、PowerPC等为代表的RISC体系结构微处理器;以Intel近期产品为代表的CISC—RISC混合型体系结构微处理器。RISC和CISC由于其实现技术的复杂性。 展开更多
关键词 微处理器 体系结构 vliw 设计方法
下载PDF
面向能耗有效高性能嵌入式微处理器的VLIW调度 被引量:1
11
作者 管茂林 杨乾明 +1 位作者 张春元 文梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第6期26-33,共8页
为了降低功耗,目前能耗有效的嵌入式微处理器一般都采用分布式与层次化的寄存器文件结构。第一层的超小寄存器文件(TORF)的极小容量使得很多数据必须存放到第二层的通用寄存器文件(GRF)中,这给编译器带来了新的挑战。通过分析程序特征,... 为了降低功耗,目前能耗有效的嵌入式微处理器一般都采用分布式与层次化的寄存器文件结构。第一层的超小寄存器文件(TORF)的极小容量使得很多数据必须存放到第二层的通用寄存器文件(GRF)中,这给编译器带来了新的挑战。通过分析程序特征,提出了新的VLIW调度算法,通过在编译时对变量进行检测,在恰当的时机插入虚拟的copy操作并进行指令与通信调度,为对寄存器需求较大的全局变量与软流水变量构建了新的包含GRF的数据传输路由,将对TORF的压力转移到GRF中。实验结果表明,新的VLIW调度算法符合处理器的设计初衷。与不使用GRF相比,在程序性能只降低约8%的情况下,降低了约51%的寄存器访问能耗,43%的处理器能耗。最关键的是避免了程序员手工分配优化的难题。 展开更多
关键词 能耗有效 分布式与层次化寄存器文件 vliw调度
下载PDF
分簇VLIW结构下利用数据依赖图优化调度的研究 被引量:1
12
作者 杨旭 何虎 孙义和 《计算机学报》 EI CSCD 北大核心 2011年第1期182-192,共11页
应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非... 应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非常困难的事情,这是因为,当指令级并行度足够高时,在单一寄存器堆情况下,寄存器堆访问端口数目的限制会使得对寄存器堆的访问时间成为制约性能提高的关键因素.为了在利用高的指令级并行度的同时维持高的运行时钟频率,可以将寄存器堆和功能单元划分到不同的簇中.每一个簇中的功能单元可以直接访问簇内的寄存器堆,而簇间的数据交互则需要占用专用的资源来进行.因此,分簇结构下的编译器不仅要通过调度实现最大程序的指令级并行度,还应该对指令的分簇进行细致的安排以限制簇间的数据交互.该文致力于通过对数据依赖图(Data Dependence Graph)分析和划分,从而在最小化簇间的数据交互的同时,平衡各簇的利用情况,提高能够获得的指令级并行度,从而优化分簇式VLIW结构的调度性能.实验结果证明,该文所提出的方法可以极大地减少簇间的数据交互量,提高所能获得的指令级并行度,从而对调度结果的性能加以改善. 展开更多
关键词 分簇 vliw结构 数据依赖图 指令调度 簇间数据交互
下载PDF
VLIW微处理器模拟器仿真实现的几个关键问题 被引量:1
13
作者 王新辉 彭巨 王许书 《计算机工程与应用》 CSCD 北大核心 2000年第10期11-13,共3页
文章就一种VLIW体系微处理器模拟器仿真实现的几个关键问题(如模型建立、串并行的转换和数据相关等)进行了简要讨论,并提出了行之有效的解决方法.
关键词 vliw 模拟器 微处理器 仿真
下载PDF
基于最小操作单元的VLIW微处理器设计 被引量:1
14
作者 王昭顺 王许书 王俊宇 《计算机工程》 CAS CSCD 北大核心 2001年第2期43-44,120,共3页
提出一种微处理器体系结构发展的分析方法—粒度分析方法,并用这种方法分析了微处理器体系结构的发展趋势。在此基础上提出基于最小操作单元MOUB微处理器体系结构的设计思想,并设计实现了一个这种结构的微处理器模型。
关键词 微处理器 vliw 体系结构 设计 粒度分析 操作单元
下载PDF
消除VLIW结构上的循环体间冗余流相关 被引量:1
15
作者 容红波 汤志忠 《软件学报》 EI CSCD 北大核心 2000年第1期126-132,共7页
数据相关是并行处理的基本依据 .该文指出 ,VLIW(very long instruction word)特有的锁步性质使其数据相关性分析具有与众不同的特点 .同一体差上的流相关形成一个线序集合 ,多体差上的特征流相关之间也存在包含关系 .据此 ,提出一种用... 数据相关是并行处理的基本依据 .该文指出 ,VLIW(very long instruction word)特有的锁步性质使其数据相关性分析具有与众不同的特点 .同一体差上的流相关形成一个线序集合 ,多体差上的特征流相关之间也存在包含关系 .据此 ,提出一种用于 VL IW的消除循环体间冗余流相关的方法 .该方法是完备的 ,可以去除所有冗余的体间流相关 ,从而减轻循环调度的负担 .文章给出判定单体差和多体差存在冗余的充分必要条件 ,以及消除冗余的线性复杂度的算法 .这种方法具有普遍意义 ,可作为 VL IW上软件流水和多指令流调度的基础 . 展开更多
关键词 vliw 循环调度 数据相关 冗余 并行处理
下载PDF
VLIW微处理器特征与编译技术支持 被引量:2
16
作者 郑飞 陆鑫达 《微处理机》 1996年第3期1-4,共4页
VLIW是一种早已出现但一直未能广泛使用而现今又被重新重点研究的微处理器设计思想与技术,它跟超标量技术一样支持每周期执行多条指令,但并行度更高。本文将详细介绍VLIW的概念及其发展历程,讨论VLIW微处理器的特征与所需的编译技术... VLIW是一种早已出现但一直未能广泛使用而现今又被重新重点研究的微处理器设计思想与技术,它跟超标量技术一样支持每周期执行多条指令,但并行度更高。本文将详细介绍VLIW的概念及其发展历程,讨论VLIW微处理器的特征与所需的编译技术支持,并与超标量微处理器进行比较分析。 展开更多
关键词 微处理器 vliw 超标量 编译器
下载PDF
VLIW体系结构微处理器设计考虑 被引量:5
17
作者 王沁 《微计算机信息》 1999年第5期6-7,共2页
本文分析VLIW体系结构微处理器的特点和问题,介绍VLIW微处理器体系结构及其相关研究的动态,并提出设计VLIW体系结构微处理器的技术路线,建议将VLIW体系结构作为我国CPU芯片设计采用的体系结构。
关键词 微处理器 vliw CPU 体系结构 设计
下载PDF
面向高性能计算的流VLIW编译技术研究
18
作者 管茂林 伍楠 +3 位作者 文梅 吴伟 柴俊 张春元 《计算机工程与科学》 CSCD 2008年第7期100-104,124,共6页
本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序... 本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序中的并行性,具有较高的效率。 展开更多
关键词 流处理器 vliw 编译 指令合并 寄存器负载
下载PDF
基于指令并行性的VLIW的控制流
19
作者 王晓华 庞春江 孟建良 《计算机工程与应用》 CSCD 北大核心 2002年第15期99-101,共3页
该文简要分析了影响VLIW指令级并行性发挥的控制相关问题,提出了相应的解决方法。
关键词 编译程序 指令并行性 vliw 控制流
下载PDF
一个支持多分支循环最优执行的VLIW体系结构
20
作者 汤志忠 张赤红 +1 位作者 苏伯珙 赵巍 《计算机研究与发展》 EI CSCD 北大核心 1995年第8期1-9,共9页
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环... 本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环体的多个分支操作可以在一个节拍内同时被执行,因此可以在更大范围内开发指令级并行性。同时还提出了一种叫作流水控制黑板的机制来支持条件分支操作。URPR-2不仅能够以很高的速度执行只含有基本块的循环程序,而且还能够以较低的时间及空间开销来运行含有多个分支的循环程序。 展开更多
关键词 vliw 体系结构 多分支循环 流水控制黑板
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部