期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
Interval-Based Out-of-Order Event Processing in Intelligent Manufacturing
1
作者 Chunjie Zhou Pengfei Dai +1 位作者 Zhenxing Zhang Tong Liu 《Journal of Intelligent Learning Systems and Applications》 2018年第2期21-35,共15页
Estimating the cycle time of each job over event streams in intelligent manufacturing is critical. These streams include many long-lasting events which have certain durations. The temporal relationships among those in... Estimating the cycle time of each job over event streams in intelligent manufacturing is critical. These streams include many long-lasting events which have certain durations. The temporal relationships among those interval-based events are often complex. Meanwhile, network latencies and machine failures in intelligent manufacturing may cause events to be out-of-order. This topic has rarely been discussed because most existing methods do not consider both interval-based and out-of-order events. In this work, we analyze the preliminaries of event temporal semantics. A tree-plan model of interval-based out-of-order events is proposed. A hybrid solution is correspondingly introduced. Extensive experimental studies demonstrate the efficiency of our approach. 展开更多
关键词 EVENT STREAMS INTELLIGENT MANUFACTURING Interval-Based EVENTS out-of-order EVENTS
下载PDF
基于RISC-V的超标量处理器的ROB压缩方法
2
作者 王洁 付丹阳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1185-1192,共8页
RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量... RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量,影响处理器性能。基于指令与微指令在ROB中的存储解耦方法,使用一个新的队列(RAB)存储每条微指令的目的寄存器的重命名映射关系等信息,每项ROB只存储其对应指令拆分的微指令的公共信息,ROB与RAB分别控制指令与微指令的提交与回滚,减少了存储信息冗余,缓解了由向量指令拆分的微指令过多导致的in-flight指令数量减少问题。在上述方法的基础上,同时实现了标量指令的ROB压缩,在ROB项数不变的情况下,增加了in-flight指令的最大数量。最终的仿真结果表明,此方法有效提高了处理器性能。 展开更多
关键词 RISC-V 超标量 处理器 ROB压缩
下载PDF
一种VLIW-Superscalar混合微处理器结构 被引量:2
3
作者 陈峰扬 杜勇 +1 位作者 郭德源 何虎 《微电子学与计算机》 CSCD 北大核心 2013年第11期1-5,共5页
描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理... 描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支持在软件层面使用指令控制该流水线在两种结构模式间的切换.详细描述了该混合结构在Lily2处理器上的设计实现.对该处理器结构的性能评测由一款基于Open64的Lily2编译器提供支持.评测结果表明该处理器在信号处理领域和通用处理领域都有较强的性能优势. 展开更多
关键词 超长指令字 超标量 混合结构 微处理器 指令级并行
下载PDF
VLIW-Superscalar混合结构处理器分支预测结构设计 被引量:1
4
作者 杜勇 李秦华 +3 位作者 陈峰扬 郭德源 李笑天 何虎 《计算机应用与软件》 CSCD 北大核心 2014年第8期25-27,78,共4页
在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的D... 在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的Dhrystone、Coremark基准测试程序。实验结果表明,在添加分支预测功能后,处理器的性能提高30%~35%。 展开更多
关键词 超标量 超长指令字 数字信号处理器 分支预测
下载PDF
面向Superscalar与VLIW混合架构处理器的调试器设计 被引量:1
5
作者 杨群 李笑天 何虎 《计算机应用与软件》 CSCD 2015年第5期84-87,163,共5页
描述基于GDB的支持超标量(Superscalar)和超长指令字(VLIW)双模式混合架构的调试器设计。该调试器设计分为代理调试端和客户端两部分,代理调试端实现基于RSP协议的基本调试代理功能,客户端实现目标处理器的添加,调试器初始化,寄存器数... 描述基于GDB的支持超标量(Superscalar)和超长指令字(VLIW)双模式混合架构的调试器设计。该调试器设计分为代理调试端和客户端两部分,代理调试端实现基于RSP协议的基本调试代理功能,客户端实现目标处理器的添加,调试器初始化,寄存器数据、操作码等的处理。测试结果表明调试器实现了远程调试,查看、修改寄存器及内存值,添加、删除断点,反汇编,查看栈信息及单步等程序调试功能。 展开更多
关键词 GDB 超标量 超长指令字 Gem5 混合架构 调试器
下载PDF
MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE 被引量:3
6
作者 Fu Zhongchuan Chen Hongsong Cui Gang 《Journal of Electronics(China)》 2006年第3期461-466,共6页
Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance archit... Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance architectures have been proposed. But little attention is paid to the thread level superscalar fault tolerance. This letter introduces microthread concept into superscalar processor fault tolerance domain, and puts forward a novel fault tolerance architecture, namely, MicroThread Based (MTB) coarse grained transient fault tolerance superscalar processor architecture, then discusses some detailed implementations. 展开更多
关键词 Microthread Basic block Coarse grained fault tolerance superscalar processor
下载PDF
一种支持Superscalar-VLIW混合架构处理器的混合分支预测设计
7
作者 付家为 王旭 何虎 《计算机应用与软件》 2017年第2期106-111,共6页
描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSP... 描述在一款支持超标量与超长指令字结构的混合架构数字信号处理器上设计的分支预测结构。为控制硬件复杂度并充分提高预测准确度,设计双峰预测器与PAp预测器混合型预测结构,充分发挥两种预测器的优点。在设计完成的处理器上,运行标准DSPstone程序。实验结果表明,添加分支预测结构使得处理器性能平均提升23%,并且混合型预测结构相比单一预测结构在准确度方面优势明显。 展开更多
关键词 数字信号处理器 超标量 超长指令字 分支预测 双峰预测 PAP
下载PDF
A Programmable High Speed Vision System with Superscalar PE and Its Parallel Computing Language
8
作者 Jie Yang Cong Shi +1 位作者 Xitian Long Nanjian Wu 《Open Journal of Applied Sciences》 2013年第1期65-67,共3页
Pixel-parallel PE and SIMD architectures are widely used in high-speed image processing to enhance computing power. With fully exploiting the data level parallelism of low- and middle-level image processing, SIMD arch... Pixel-parallel PE and SIMD architectures are widely used in high-speed image processing to enhance computing power. With fully exploiting the data level parallelism of low- and middle-level image processing, SIMD architecture is able to finish great amount of computation with much less instruction cycle thus satisfy the high-speed system requirement. The main computation parts in those SIMD image processing hardware is known as PE (processing element) and it is responsible for transferring, storing and processing the image data. This paper describes a high-speed vision system with superscalar PE to enhance system performance and its dedicated parallel computing language specifically devel-oped for this vision system. The vision system can achieve motion detection at more than 2000fps and face detection at more than 100 fps which overwhelms some general serial CPUs in the same applications. 展开更多
关键词 High-Speed Vision System SIMD superscalar PE
下载PDF
处理器值预测技术研究
9
作者 黄立波 杨凌 +5 位作者 杨乾明 马胜 王永文 隋兵才 沈立 徐炜遐 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3591-3618,共28页
当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能... 当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能的计算系统.处理器值预测技术是一种能在无需改变存储系统情况下有效缓解存储墙问题的解决方案,其通过预测性地打破数据真相关进而让更多的指令可以在乱序处理器中并行执行,而无需等待由于访存等操作造成的长周期指令执行.近年来,值预测在各个方面都有了实质性的进步,但现如今还没有商用处理器使用这一技术,这主要是由于值预测技术的使用还面临许多挑战:现有的处理器的流水线架构不能直接使用值预测技术;值预测所需的预测值传递机制需要额外的硬件资源开销;值预测器巨大的存储开销让其很难在片上实现;由于值预测错误时的性能惩罚大,因此预测准确率较低的值预测器会降低处理器性能.针对这些问题,本文以值预测技术为中心,围绕值预测技术相关的流水线架构、值预测器结构和错误恢复机制三个方面分别详细论述了国内外研究成果以及其对于各个问题挑战的解决策略.最后,本文对当今的处理器值预测技术进行了总结并对未来的研究方向进行了展望. 展开更多
关键词 值预测 数据依赖 处理器 流水线 存储墙 超标量
下载PDF
Research on Superscalar Digital Signal Processor
10
作者 DengZhenghong ZhengWei DengLei HuZhengguo 《医学信息(医学与计算机应用)》 2004年第2期64-67,共4页
Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermo... Under the direction of design space theory,in this paper we discuss the design of a superscalar pipelining using the way of multiple issues,and the implement of a superscalar based RISC DSP architecture,SDSP.Furthermore,in this paper we discuss the validity of instruction prefetch,the branch prediction,the depth of instruction window and other issues that can affect the performance of superscalar DSP. 展开更多
关键词 超标量结构数字信号处理器 结构空间理论 流水线作业 数字信号
下载PDF
DSP体系结构发展综述 被引量:1
11
作者 宋文娜 徐东君 陈亮 《微电子学与计算机》 2023年第4期1-7,共7页
数字信号处理器(Digital Signal Processor,DSP)是一种用于数字信号处理的专用微处理器,在通信、自动化、雷达、航空航天等领域具有重要应用价值.本文系统阐述了DSP体系结构的发展过程和现状,介绍了主要生产厂商的DSP产品及其性能;总结... 数字信号处理器(Digital Signal Processor,DSP)是一种用于数字信号处理的专用微处理器,在通信、自动化、雷达、航空航天等领域具有重要应用价值.本文系统阐述了DSP体系结构的发展过程和现状,介绍了主要生产厂商的DSP产品及其性能;总结了DSP芯片的主要结构特点;分析了现有DSP体系结构设计中提升数据级和指令级并行性的主要技术,包括哈佛结构、硬件乘法器、SIMD、VLIW和超标量等.结合新时代DSP应用需求,本文提出了DSP体系结构研究的三个发展方向:(1)通过增加数据和指令并行性,向超高性能DSP发展,提升矢量、标量并行能力,支持张量计算,集成面向神经网络算子的专用控制通路和功能单元,提升AI计算处理能力;(2)从指令系统入手,将变长指令集与超标量技术结合,在实现指令并行的同时,结合可适应神经网络算法扩展的计算流控制指令,提升AI算法映射能力,同时降低代码密度,减小存储压力和取指带宽,降低成本,提升边缘智能实时处理应用能力;(3)兼容面向稀疏神经网络的压缩和并发访问的分布式存储结构,提升边缘智能片上部署能力和网络层多通道并行计算能力. 展开更多
关键词 哈佛结构 硬件乘法器 SIMD结构 VLIW技术 超标量
下载PDF
高效多分支预测器设计与实现
12
作者 杨凌 周锦文 +5 位作者 王京 兰孟桥 丁梓坚 杨实 王永文 黄立波 《计算机科学与探索》 CSCD 北大核心 2023年第8期1842-1851,共10页
分支预测是保证处理器性能的重要技术,尤其在当今广泛应用的超标量处理器中,分支预测器的各项属性极大地影响着处理器的整体性能、功耗和面积。为了在超标量处理器中获得具有较高性价比的分支预测器,尝试使用了TAGE预测器对取指宽度内... 分支预测是保证处理器性能的重要技术,尤其在当今广泛应用的超标量处理器中,分支预测器的各项属性极大地影响着处理器的整体性能、功耗和面积。为了在超标量处理器中获得具有较高性价比的分支预测器,尝试使用了TAGE预测器对取指宽度内的所有分支进行预测,并利用分支预测竞赛平台对预测器的理想性能进行了评估,发现其预测能力是足以满足预测条件的。但在实践过程中发现多分支取指时分支预测器和分支目标缓存内均会存在冲突的情况,这严重影响了预测器的性能。为了解决以上问题,在单个TAGE分支预测器的基础上增加了额外的预测通路,独立地保存和预测额外的分支指令信息。并利用硬件描述语言在超标量处理器中实现了这一预测器,同时将其与单个TAGE分支预测器进行了嵌入式处理器常用基准程序dhrystone、coremark和embench的性能对比实验。实验结果表明,优化后的分支预测器性能提高了14.1个百分点,而存储开销只增加了9.06%。最后通过实验数据分析,发现这一方案不仅有利于额外的分支指令预测,而且可以通过更加准确的分支历史信息获取实现更加准确的单分支取指预测。 展开更多
关键词 分支预测 TAGE 嵌入式 超标量 处理器
下载PDF
改进的综合水质标识指数法在海安市河流水质评价中的应用研究 被引量:2
13
作者 韦雨婷 黄娟 +1 位作者 鲍琨 顾晓昀 《环境科学与管理》 CAS 2023年第7期177-182,共6页
以海安市境内7条主要河流为研究对象,基于2017年-2021年各河流监测断面逐月水质监测结果,采用基于超标倍数赋权计算的综合水质标识指数法对各河流水质状况进行综合评价,并评估其变化趋势及污染风险。评价结果显示:近年来海安市境内主要... 以海安市境内7条主要河流为研究对象,基于2017年-2021年各河流监测断面逐月水质监测结果,采用基于超标倍数赋权计算的综合水质标识指数法对各河流水质状况进行综合评价,并评估其变化趋势及污染风险。评价结果显示:近年来海安市境内主要河流水质呈现逐年改善趋势,部分河流水质变化显著,2021年整体水质为Ⅱ类-Ⅲ类,但各河流逐月水质波动较大,尤其是汛期7月份和8月份,海安市河流整体水质较差,均出现超标现象,其中总磷超标最严重,存在接近劣Ⅴ类水质的风险,氨氮次之。今后需要进一步加大农业面源污染整治工作。 展开更多
关键词 水质评价 综合水质标识指数 超标倍数赋权 海安市河流
下载PDF
我国水产品中农药扑草净残留超标的警示分析 被引量:29
14
作者 李庆鹏 秦达 +4 位作者 崔文慧 郭芹 项丽霞 靳婧 哈益明 《食品安全质量检测学报》 CAS 2014年第1期108-112,共5页
由于我国水产品中扑草净频频超标,日本加强对我国水产品的命令检查,出现了严重的贸易壁垒。本文通过对国内外扑草净残留限量标准的现状、扑草净在我国的使用情况、日本对扑草净残留的研究进行分析,综合评价了扑草净超标对我国水产品出... 由于我国水产品中扑草净频频超标,日本加强对我国水产品的命令检查,出现了严重的贸易壁垒。本文通过对国内外扑草净残留限量标准的现状、扑草净在我国的使用情况、日本对扑草净残留的研究进行分析,综合评价了扑草净超标对我国水产品出口的影响。通过分析,本文建议重点开展对鱼类、贝类及虾类等产品中扑草净含量的风险评估,为制定水产品中扑草净限量标准提供科学依据;同时强化对鱼类、贝类、虾类等产品中农药扑草净含量的监测,避免高残留产品冲击国内市场。 展开更多
关键词 水产品 扑草净残留 限量标准 超标
下载PDF
SMA:前瞻性多线程体系结构 被引量:4
15
作者 肖刚 周兴铭 +1 位作者 徐明 邓鹍 《计算机学报》 EI CSCD 北大核心 1999年第6期582-590,共9页
提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的... 提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的指令窗口形成一个大的动态指令窗口,开发出程序中更大的ILP,又利用多线程执行机制屏蔽各种长延迟操作,达到较高的资源利用率;介绍了SMA执行模型,并讨论了SMA处理器的实现和其中的关键技术.这些关键技术包括:线程控制、分布式寄存器重命名、指令发射执行、中断处理和处理器对编译优化的要求.性能分析结果表明SMA处理器可以适应各种不同类型的程序,以达到高性能,如果采用较好的编译支持和线程预测算法。 展开更多
关键词 前瞻性执行 多线程 SMA 体系结构 微处理器
下载PDF
超标量微处理器研究与应用 被引量:4
16
作者 邓正宏 康慕宁 罗旻 《微电子学与计算机》 CSCD 北大核心 2004年第9期59-63,共5页
首先介绍了超标量体系结构的基础,深入研究了超标量体系结构的基本特点和性能分析,详细地探讨了超标量体系中遇到的数据相关和结构相关的问题以及解决相关问题的Tomasulo算法及计分牌算法。在文章的最后,简单的讨论了动态转移预测和重... 首先介绍了超标量体系结构的基础,深入研究了超标量体系结构的基本特点和性能分析,详细地探讨了超标量体系中遇到的数据相关和结构相关的问题以及解决相关问题的Tomasulo算法及计分牌算法。在文章的最后,简单的讨论了动态转移预测和重排序缓冲机制。 展开更多
关键词 超标量 微处理器
下载PDF
多线程体系结构现状及发展 被引量:2
17
作者 肖刚 徐明 周兴铭 《计算机科学》 CSCD 北大核心 1998年第4期70-76,共7页
一、引言多线程体系结构结合了数据流结构和传统的冯氏控制流结构,既保持了指令执行的高性能,又实现了处理器的高效率,是一种通用而高效的延迟隐藏技术。早期的多线程体系结构可以追朔到CI)巳6600和HEP,现今的多线程处理器中的很多技术... 一、引言多线程体系结构结合了数据流结构和传统的冯氏控制流结构,既保持了指令执行的高性能,又实现了处理器的高效率,是一种通用而高效的延迟隐藏技术。早期的多线程体系结构可以追朔到CI)巳6600和HEP,现今的多线程处理器中的很多技术都可以在它们那里找到踪迹。 展开更多
关键词 计算机 体系结构 多线程体系结构
下载PDF
龙芯2号处理器设计和性能分析 被引量:37
18
作者 胡伟武 张福新 李祖松 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期959-966,共8页
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等... 介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求. 展开更多
关键词 超标量流水线 乱序执行 转移猜测 寄存器重命名 动态调度 非阻塞的cache load指令猜测执行 性能分析
下载PDF
32位嵌入式CPU的微体系结构设计 被引量:3
19
作者 马鹏 卢景芬 龚令侃 《计算机工程》 CAS CSCD 北大核心 2008年第B09期136-138,共3页
介绍一款自主设计的嵌入式CPU的微体系结构,给出流水线的设计、分支预测的策略、乱序执行指令的顺序提交、精确异常等议题。提出了CPU内5个执行单元的功能,以及CPU的存储子系统。目前该CPU的前端设计已经完成并通过了FPGA验证。
关键词 微体系结构 超标量技术 分支预测 精确异常
下载PDF
单芯片多处理器的性能优势 被引量:11
20
作者 黄光奇 周兴铭 《计算机工程与科学》 CSCD 2001年第1期35-38,64,共5页
本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行... 本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行性的开发更加有效。 展开更多
关键词 单芯片多处理器 超标量 执行时间 集成电路 微处理器
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部