期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
Simultaneous Multithreading Fault Tolerance Processor
1
作者 DONGLan HUMing-zeng +3 位作者 JIZhen-zhou CUIGuang-zuo TANGXin-min HEFeng 《Wuhan University Journal of Natural Sciences》 EI CAS 2005年第1期17-20,共4页
Transient fault detection mechanism is added to simultaneous multithreading architecture. By exploiting both ILP (Instruction Level Parallelism) and TLP (Thread Level Parallelism), Simultaneous Multithreading (SMT) Fa... Transient fault detection mechanism is added to simultaneous multithreading architecture. By exploiting both ILP (Instruction Level Parallelism) and TLP (Thread Level Parallelism), Simultaneous Multithreading (SMT) Fault Tolerance Processor can be expected to achieve better tradeoff between performance and hardware cost than traditional Fault Tolerance Processors. Detailed simulations of 3 of SPEC95 benchmarks show that executing two redundant programs on the fault-tolerant microarchitecture takes only 40%–61%longer than running a single version of the program. The new instruction fetch algorithm enhances the performance by 0.4%~1%to most of the benchmarks we choose randomly. 展开更多
关键词 Key words simultaneous multithreading rault tolerance TLP (Thread Level Parallelism) fetch policy
下载PDF
EDSMT微体系结构研究 被引量:3
2
作者 蒋江 邢座程 张民选 《计算机工程与科学》 CSCD 2005年第4期87-91,共5页
本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处理器性能。
关键词 微处理器 EDsmt 微体系结构 多线程处理器
下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
3
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理器 同时多线程 每周期完成的指令数(IPC)
下载PDF
面向SMT体系结构的片上资源分配策略研究
4
作者 张骏 樊晓桠 刘松鹤 《计算机科学》 CSCD 北大核心 2008年第6期135-138,共4页
SMT处理器通过同时执行来自多个线程中的指令来提高性能,所有线程通过竞争共享的方式来最大化片上资源的利用率。然而,SMT处理器的集中控制结构所固有的线延迟约束和多个线程对片上资源持有的不均衡性使得设计者不得不考虑在线程间进行... SMT处理器通过同时执行来自多个线程中的指令来提高性能,所有线程通过竞争共享的方式来最大化片上资源的利用率。然而,SMT处理器的集中控制结构所固有的线延迟约束和多个线程对片上资源持有的不均衡性使得设计者不得不考虑在线程间进行资源分配,来减少通信延迟和可能出现的线程饥饿。本文介绍了针对SMT体系结构片上资源分配的基本原理、研究内容;分析了片上资源分配对SMT体系结构造成的影响;从显式和隐式两个角度讨论了SMT体系结构片上资源分配策略的运行机制和设计方法;举例分析了POWER5处理器的动态资源平衡策略;最后,展望了SMT处理器片上资源分配的未来发展趋势。 展开更多
关键词 同时多线程 处理器 资源划分
下载PDF
OpenSMT:一个同时多线程处理器模拟器的设计和实现 被引量:4
5
作者 路放 安虹 +1 位作者 梁博 任建 《计算机科学》 CSCD 北大核心 2006年第1期158-163,共6页
同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进... 同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进行适当的抽象,开发了一个 SMT 体系结构模拟器 OpenSMT。本文介绍了该模拟器主要的设计思想和实现方法,包括多个线程上下文结构的表示、超标量流水线各个阶段的模拟,以及模拟器设计和实现时需要解决的几个关键问题等。初步的应用研究表明,与现有可免费获得的研究用 SMT 模拟器相比,该模拟器能够较好地平衡模拟性能、灵活性和精度三个基本设计目标.实现了执行驱动、易于扩展指令集结构、艮好的用户接口、灵活的软件结构、适宜评估更广泛的 SMT、体系结构设计空间等设计要求。 展开更多
关键词 处理器模拟器 同时多线程 软件模型 结构模型 性能评价
下载PDF
基于同时多线程的IFSBSMT取指策略研究
6
作者 李静梅 关海洋 《计算机科学》 CSCD 北大核心 2012年第8期311-315,共5页
取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令... 取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令条数预算的方式分配取指带宽,采取线程IPC值和L2Cache缺失率的双优先级动态资源分配机制分配处理器的系统资源。研究结果表明,IFSBSMT策略有效地解决了取指带宽、指令队列冲突及资源浪费问题,进一步提高了指令吞吐率,且具有较好的取指公平性。 展开更多
关键词 同时多线程 取指策略 IFSBsmt 取指带宽 指令队列冲突 双优先级动态资源分配
下载PDF
浮点与整数资源区别分配的SMT处理器取指策略
7
作者 蒋生健 胡向东 杨剑新 《计算机工程》 CAS CSCD 北大核心 2017年第4期46-51,共6页
在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与IC... 在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与ICOUNT,STALL等策略相比,该策略在算术平均IPC和调和平均IPC方面均取得一定的性能提升,同时其在处理浮点和整数混合型程序时也具有优势。 展开更多
关键词 同时多线程 取指策略 资源分配 线程级并行 浮点 整数
下载PDF
一种改进的SMT模拟器——支持Oracle机制和多种取指策略
8
作者 唐新民 董岚 +2 位作者 季振洲 唐朔飞 崔光佐 《计算机工程与应用》 CSCD 北大核心 2005年第14期57-60,共4页
模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模... 模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模拟器的基础,提供了一种新的支持O racle研究的模拟平台。同时原SM T模拟器只支持ICO UNT这一种取指策略,文章在原模拟器基础上,又增加了BR COU NT和M ISSCO UNT这两种通用的取指策略。 展开更多
关键词 同步多线程 模拟器 Oracle研究 取指策略
下载PDF
TRSTR: A Fault-Tolerant Microprocessor Architecture Based on SMT 被引量:1
9
作者 YANGHua CUIGang YANGXiao-zong 《Wuhan University Journal of Natural Sciences》 CAS 2005年第1期51-55,共5页
Based on Simultancous Multithrtading (SMT), we propose a fault-tola antscheme called Tri-modular Redun-danlly and Simultaneously threaded processor with Recovery (TRSTR),TRSTR features as following: First, we introduc... Based on Simultancous Multithrtading (SMT), we propose a fault-tola antscheme called Tri-modular Redun-danlly and Simultaneously threaded processor with Recovery (TRSTR),TRSTR features as following: First, we introduce an arbitrator context into thtconventional SRT(Simultaneous and Redundantly Threaded), which acts as an arbitrator when results from the other twocontexts disagree, or acts as an ordinary thread generally, thus making full use of SMT'sparallelism. Second, we append reconfigurablefeature to sphere of replication in SRT, making it moreflexible for changing demands and situations Third, TRSFR has two working modes: Tri-Simultancouswith Voling (TSV) and Dual-Simultaneous with Arbitrator CDSA), which can switch at will. Finally, inaddition to transient-fault coverage, TRSTR has on-line self-checking and self-recover ingabilities, so as to shield off some permanent faults and reconfigure itself without stopping thecrucial job. improving its reliability and availability. 展开更多
关键词 FAULT-TOLERANT HIGH-PERFORMANCE simultaneous multithreading ARCHITECTURE
下载PDF
A spatially triggered dissipative resource distribution policy for SMT processors 被引量:1
10
作者 Hong-zhou CHEN Xue-zeng PAN Ling-di PING Kui-jun LU Xiao-ping CHEN 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2008年第8期1070-1082,共13页
Programs take on changing behavior at runtime in a simultaneous multithreading (SMT) environment. How rea-sonably common resources are distributed among the threads significantly determines the throughput and fairness... Programs take on changing behavior at runtime in a simultaneous multithreading (SMT) environment. How rea-sonably common resources are distributed among the threads significantly determines the throughput and fairness performance in SMT processors. Existing resource distribution methods either mainly rely on the front-end fetch policy, or make distribution decisions according to the limited information from the pipeline. It is difficult for them to efficiently catch the various resource requirements of the threads. This work presents a spatially triggered dissipative resource distribution (SDRD) policy for SMT processors. Its two parts, the self-organization mechanism that is driven by the real-time instructions per cycle (IPC) performance and the introduction of chaos that tries to control the diversity of trial resource distributions, work together to supply sustaining resource distribution optimization for changing program behavior. Simulation results show that SDRD with fine-grained diversity controlling is more effective than that with a coarse-grained one. And SDRD benefits much from its two well-coordinated parts, providing potential fairness gains as well as good throughput gains. Meanings and settings of important SDRD parameters are also discussed. 展开更多
关键词 计算机技术 性能分析 动力学 处理器
下载PDF
Characterizing big data analytics workloads on POWER8 SMT processors
11
作者 贾禛 Zhan Jianfeng +1 位作者 Wang Lei Zhang Lixin 《High Technology Letters》 EI CAS 2017年第3期245-251,共7页
Big data analytics is emerging as one kind of the most important workloads in modern data centers. Hence,it is of great interest to identify the method of achieving the best performance for big data analytics workload... Big data analytics is emerging as one kind of the most important workloads in modern data centers. Hence,it is of great interest to identify the method of achieving the best performance for big data analytics workloads running on state-of-the-art SMT( simultaneous multithreading) processors,which needs comprehensive understanding to workload characteristics. This paper chooses the Spark workloads as the representative big data analytics workloads and performs comprehensive measurements on the POWER8 platform,which supports a wide range of multithreading. The research finds that the thread assignment policy and cache contention have significant impacts on application performance. In order to identify the potential optimization method from the experiment results,this study performs micro-architecture level characterizations by means of hardware performance counters and gives implications accordingly. 展开更多
关键词 数据分析 工作负载 处理器 smt 特征 并发多线程 硬件性能计数器 最佳性能
下载PDF
同时多线程技术 被引量:8
12
作者 刘权胜 杨洪斌 吴悦 《计算机工程与设计》 CSCD 北大核心 2008年第4期963-967,共5页
同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成... 同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成果及影响,并探讨了当前同时多线程技术的发展趋势。 展开更多
关键词 模型 处理器 多线程 同时多线程 同时多线程处理器
下载PDF
一种与缓冲区紧耦合的环形循环滑动窗口的数据流抽取算法 被引量:10
13
作者 詹英 吴春明 王宝军 《电子学报》 EI CAS CSCD 北大核心 2011年第4期894-898,共5页
许多应用领域产生数据流的流量不断增大,需要挖掘系统提供更有效的数据流抽取策略来应对数据处理能力与流速之间的矛盾.本文构造了基于环形缓冲区循环的逻辑滑动窗口(环形循环滑动窗口),将环形缓冲区和环形循环滑动窗口紧耦合,提出了基... 许多应用领域产生数据流的流量不断增大,需要挖掘系统提供更有效的数据流抽取策略来应对数据处理能力与流速之间的矛盾.本文构造了基于环形缓冲区循环的逻辑滑动窗口(环形循环滑动窗口),将环形缓冲区和环形循环滑动窗口紧耦合,提出了基于环形循环滑动窗口的数据流抽取算法.实验表明这是适合数据流流动和方便数据流挖掘的数据流抽取模型,能够提升数据流抽取速度和保证数据流的挖掘持续正常实施. 展开更多
关键词 数据流 环形循环滑动窗口 环形缓冲区 多线程
下载PDF
汽车变速箱性能检测系统的设计 被引量:10
14
作者 王志鹏 马孝江 +2 位作者 张志新 蔡悦 李吉 《机械科学与技术》 CSCD 北大核心 2002年第1期45-46,49,共3页
随着汽车工业的迅猛发展 ,变速箱作为汽车的重要传动部件 ,其操作性、传动性与安全性日显重要 ,因此本研究所研制和开发了“汽车变速箱性能检测系统”。本文首先从整体上介绍了该系统的构成 ,其次详细论述了信号测试系统的测试参数和测... 随着汽车工业的迅猛发展 ,变速箱作为汽车的重要传动部件 ,其操作性、传动性与安全性日显重要 ,因此本研究所研制和开发了“汽车变速箱性能检测系统”。本文首先从整体上介绍了该系统的构成 ,其次详细论述了信号测试系统的测试参数和测试原理 ,最后详细介绍了软件系统的体系结构以及各子系统的功能 。 展开更多
关键词 实时性 性能检测系统 体系结构 多线程 并发性 汽车
下载PDF
龙芯2号处理器的同时多线程设计 被引量:10
15
作者 李祖松 许先超 +1 位作者 胡伟武 唐志敏 《计算机学报》 EI CSCD 北大核心 2009年第11期2265-2273,共9页
提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明... 提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%. 展开更多
关键词 龙芯2 同时多线程 微体系结构 LINUX操作系统
下载PDF
同时多线程处理器上的Cache性能分析与优化 被引量:2
16
作者 隋秀峰 吴俊敏 陈国良 《小型微型计算机系统》 CSCD 北大核心 2009年第1期159-163,共5页
同时多线程(SMT)是一种延迟容忍的体系结构,它在每个周期内可以执行多个线程的多条指令.在SMT处理器上,对于片上共享存储这个复杂的结构资源,至今还没有很好的共享和冲突解决方案.本文着重研究了在多个并发执行的线程间划分共享Cache所... 同时多线程(SMT)是一种延迟容忍的体系结构,它在每个周期内可以执行多个线程的多条指令.在SMT处理器上,对于片上共享存储这个复杂的结构资源,至今还没有很好的共享和冲突解决方案.本文着重研究了在多个并发执行的线程间划分共享Cache所存在的问题,指出基于LRU策略的传统Cache会根据需要隐式地划分共享Cache,这在某些情况下会导致全局性能的下降.针对这一问题并且考虑到SMT处理器上对Cache访问带宽的需求,本文提出采用一种多模块多体的Cache结构设计方案.并且在一个修改过的SMT模拟器上对该设计方案进行了性能评价.实验结果显示,相比于基于LRU策略的传统Cache,这一结构可以将一个4路SMT处理器的IPC提高9%. 展开更多
关键词 同时多线程 高速缓存 仿真
下载PDF
基于现代通用处理器的数据库优化综述 被引量:4
17
作者 邓亚丹 景宁 熊伟 《计算机科学》 CSCD 北大核心 2009年第8期17-20,共4页
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种... 随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种研究成果,并展望了未来基于新硬件的数据库优化的发展趋势。 展开更多
关键词 CACHE优化 多线程优化 多核处理器 smt
下载PDF
基于Cache Missing的RSA计时攻击 被引量:4
18
作者 陈财森 王韬 +1 位作者 陈建泗 陈琪 《微电子学与计算机》 CSCD 北大核心 2009年第5期180-182,186,共4页
由于同步多线程允许多个执行线程之间共享处理器的执行单元,为共享Cache存储器提供了线程间一个实现简单、高带宽的隐通道,使得一个恶意线程能够监视其他线程访问的资源.以OpenSSL0.9.7c实现的RSA算法为攻击对象,通过执行一个间谍线程,... 由于同步多线程允许多个执行线程之间共享处理器的执行单元,为共享Cache存储器提供了线程间一个实现简单、高带宽的隐通道,使得一个恶意线程能够监视其他线程访问的资源.以OpenSSL0.9.7c实现的RSA算法为攻击对象,通过执行一个间谍线程,监视密码线程,观测RSA解密时读取Cache数据变化时反应的时间特性,通过分析这些时间信息推论出RSA的解密密钥.最后介绍了如何减轻甚至消除这种攻击的建议. 展开更多
关键词 RSA 同步多线程 CACHE 滑动窗口
下载PDF
一种支持同时多线程的VLIW DSP架构 被引量:11
19
作者 沈钲 孙义和 《电子学报》 EI CAS CSCD 北大核心 2010年第2期352-358,共7页
本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元... 本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元,该DSP架构还支持指令动态分发,由硬件分发单元而不是编译器来完成多线程指令的动态分配.实验结果表明,相比于单线程而言,本文提出的VLIW DSP架构可以提高功能单元利用率,隐藏存储器访问时延,使处理器的指令吞吐率平均提高约26.89%. 展开更多
关键词 同时多线程 超长指令字 数字信号处理器
下载PDF
龙芯2号同时多线程处理器的软硬件接口设计 被引量:2
20
作者 李祖松 许先超 +1 位作者 胡伟武 唐志敏 《软件学报》 EI CSCD 北大核心 2007年第7期1806-1817,共12页
随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件... 随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件接口协同设计解决方案,给出相应的操作系统实现方案.同时,在Linux2.4.20的基础上实现了龙芯2号同时多线程处理器相应的操作系统.通过运行SPEC CPU2000等测试程序进行性能评测,充分说明实现软硬件接口的龙芯2号同时多线程处理器极大地提高了多进程负载的性能.分析和设计方案不仅适用于同时多线程处理器,而且对于片内多核处理器的设计也有借鉴作用. 展开更多
关键词 龙芯2号 同时多线程 微体系结构 LINUX操作系统
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部