期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
使用取指策略控制同时多线程处理器中个体线程的性能 被引量:3
1
作者 孙彩霞 张民选 《计算机学报》 EI CSCD 北大核心 2008年第2期309-317,共9页
当前,对同时多线程(Si multaneous Multithreading,SMT)处理器取指策略的研究大都集中在总体性能的优化上.文中提出一种新颖的SMT处理器取指策略(Controlling Performance of Individual Thread,CPIT),用于控制个体线程的执行.结果表明... 当前,对同时多线程(Si multaneous Multithreading,SMT)处理器取指策略的研究大都集中在总体性能的优化上.文中提出一种新颖的SMT处理器取指策略(Controlling Performance of Individual Thread,CPIT),用于控制个体线程的执行.结果表明,对于模拟的所有负载,CPIT在94%以上的情况下都能保证受控线程获得期望性能.而对于失败的情况,受控线程的平均性能偏差不超过1.25%.此外,CPIT策略对处理器总体性能的影响并不大.与ICOUNT这种以优化性能为目标的取指策略相比,总体性能的平均降低不超过3%,而除受控线程外的其他线程的性能平均只降低了1.75%. 展开更多
关键词 同时多线程 取指策略 性能 资源分配 期望性能
下载PDF
基于多个取指优先级的同时多线程处理器取指策略 被引量:3
2
作者 孙彩霞 张民选 《电子学报》 EI CAS CSCD 北大核心 2006年第5期790-795,共6页
同时多线程(SMT,SimultaneousMultithreading)处理器中,同时运行的线程在共享资源的同时也在竞争资源.如果一个发生L2 cache失效的线程长时间占用共享资源,那么会导致其他线程运行速度减慢,甚至会因为缺少资源而停顿下来,从而降低了SMT... 同时多线程(SMT,SimultaneousMultithreading)处理器中,同时运行的线程在共享资源的同时也在竞争资源.如果一个发生L2 cache失效的线程长时间占用共享资源,那么会导致其他线程运行速度减慢,甚至会因为缺少资源而停顿下来,从而降低了SMT处理器的总体性能.本文提出了一种基于多个取指优先级的同时多线程取指策略MFP(Multiple Fetch Priorities),用于减少L2 cache失效给处理器性能带来的负面影响.模拟结果表明,无论使用IPC作为度量标准还是使用Hmean作为度量标准,对于所有类型的工作负载,尤其是存储器访问密集的工作负载,MFP都要优于现有的其他取指策略.此外,对于不同的取指策略,MFP表现出不同程度的提升.相对于PDG的提升最明显,平均IPC以及平均Hmean分别提高了19.2%和27.7%. 展开更多
关键词 同时多线程 cache失效 取指策略 优先级 资源分配
下载PDF
一种具有QoS特性的同时多线程处理器取指策略 被引量:4
3
作者 何立强 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2006年第11期1980-1984,共5页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线程的取指过程,从而满足线程在执行速度上的QoS需求.与传统的基于纯优先级的取指策略相比,该策略不但具有QoS特性,同时还可以更加有效地分配取指带宽,从而能获得更高的处理器性能.该策略的物理实现非常简单.模拟实验的结果表明,该策略在提供QoS支持的基础上,可以在传统的基于优先级的取指策略ICOUNT的基础上提高15%的系统性能. 展开更多
关键词 同时多线程处理器 取指策略 服务质量
下载PDF
DWarn+:一种改进的同时多线程处理器取指策略 被引量:3
4
作者 孙彩霞 张民选 《小型微型计算机系统》 CSCD 北大核心 2007年第9期1720-1723,共4页
同时多线程(SMT,Simultaneous Multithreading)处理器通过每个周期同时运行来自多个线程的指令来提高性能.同时执行的线程在共享资源的同时也在竞争资源.如果一个发生L2 cache失效的线程长时间占用共享资源,那么会导致其他线程运行速度... 同时多线程(SMT,Simultaneous Multithreading)处理器通过每个周期同时运行来自多个线程的指令来提高性能.同时执行的线程在共享资源的同时也在竞争资源.如果一个发生L2 cache失效的线程长时间占用共享资源,那么会导致其他线程运行速度减慢,甚至会因为缺少资源而停顿下来,从而降低了SMT处理器的总体性能.为了减小L2 cache失效给SMT处理器性能带来的负面影响,许多取指策略被提了出来,DWarn就是其中比较有效的一种.本文在DWarn的基础上进行改进,提出了DWarn+取指策略.模拟结果表明,当同时运行的线程数目不超过4时,无论使用IPC作为度量标准还是使用Hmean作为度量标准,DWarn+都要明显优于DWarn;当同时运行的线程数目大于4时,DWarn+相对于DWarn的提高主要体现在存储器访问密集的工作负载上,而对于所有类型工作负载,DWarn+相对于DWarn的平均提高非常有限. 展开更多
关键词 同时多线程 二级cache失效 DWarn取指策略 资源分配
下载PDF
基于负载瞬时IPC性能的同时多线程处理器取指策略 被引量:1
5
作者 何立强 刘志勇 《计算机学报》 EI CSCD 北大核心 2007年第4期629-637,共9页
同时多线程处理器在每时钟周期从多个线程读取指令执行,极大地提高了指令吞吐率.文中简单介绍了SMT技术,讨论了常用的取指策略,比较了各策略在提高性能方面的优劣.给出特定负载下理论上的最优取指策略,在此基础上提出一种基于负载瞬时IP... 同时多线程处理器在每时钟周期从多个线程读取指令执行,极大地提高了指令吞吐率.文中简单介绍了SMT技术,讨论了常用的取指策略,比较了各策略在提高性能方面的优劣.给出特定负载下理论上的最优取指策略,在此基础上提出一种基于负载瞬时IPC性能的动态取指策略IPCBFP.实验表明,该策略可以有效地提高负载的性能,平均加速比对于两线程负载可以达到17%,对于四线程负载可以达到8%.该策略还具有平均占用指令队列项少,指令队列冲突率低的特点,而且,对降低SMT的Cache失效率和TLB失效率方面也有一定的作用. 展开更多
关键词 同时多线程处理器 取指策略 令队列 IPC 令吞吐率
下载PDF
基于EPIC的同时多线程处理器取指策略
6
作者 贾小敏 孙彩霞 张民选 《计算机工程》 CAS CSCD 北大核心 2007年第4期256-258,262,共4页
EPIC硬件简单,同时多线程易于开发线程级并行,在EPIC上实现同时多线程可以结合二者的优点。取指策略对同时多线程处理器的性能有重要影响。该文介绍了几种有代表性的超标量同时多线程处理器取指策略,分析了这些策略在EPIC同时多线程处... EPIC硬件简单,同时多线程易于开发线程级并行,在EPIC上实现同时多线程可以结合二者的优点。取指策略对同时多线程处理器的性能有重要影响。该文介绍了几种有代表性的超标量同时多线程处理器取指策略,分析了这些策略在EPIC同时多线程处理器上的适用性,提出了一种新的适用于EPIC的取指策略SICOUNT。分析表明SICOUNT策略可以充分利用EPIC软硬件协同的优势,在选择取指线程时使用编译器所提供的停顿信息,能更精确地估计各个线程的流动速度,使取出指令的质量更高。 展开更多
关键词 显式并行令计算 同时多线程 取指策略 ITANIUM SICOUNT
下载PDF
基于同时多线程的IFSBSMT取指策略研究
7
作者 李静梅 关海洋 《计算机科学》 CSCD 北大核心 2012年第8期311-315,共5页
取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令... 取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令条数预算的方式分配取指带宽,采取线程IPC值和L2Cache缺失率的双优先级动态资源分配机制分配处理器的系统资源。研究结果表明,IFSBSMT策略有效地解决了取指带宽、指令队列冲突及资源浪费问题,进一步提高了指令吞吐率,且具有较好的取指公平性。 展开更多
关键词 同时多线程 取指策略 IFSBSMT 带宽 令队列冲突 双优先级动态资源分配
下载PDF
一种改进的SMT模拟器——支持Oracle机制和多种取指策略
8
作者 唐新民 董岚 +2 位作者 季振洲 唐朔飞 崔光佐 《计算机工程与应用》 CSCD 北大核心 2005年第14期57-60,共4页
模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模... 模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模拟器的基础,提供了一种新的支持O racle研究的模拟平台。同时原SM T模拟器只支持ICO UNT这一种取指策略,文章在原模拟器基础上,又增加了BR COU NT和M ISSCO UNT这两种通用的取指策略。 展开更多
关键词 同步多线程 模拟器 Oracle研究 取指策略
下载PDF
浮点与整数资源区别分配的SMT处理器取指策略
9
作者 蒋生健 胡向东 杨剑新 《计算机工程》 CAS CSCD 北大核心 2017年第4期46-51,共6页
在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与IC... 在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与ICOUNT,STALL等策略相比,该策略在算术平均IPC和调和平均IPC方面均取得一定的性能提升,同时其在处理浮点和整数混合型程序时也具有优势。 展开更多
关键词 同时多线程 取指策略 资源分配 线程级并行 浮点 整数
下载PDF
一种有效的同时多线程处理器取指控制机制 被引量:4
10
作者 何立强 刘志勇 《计算机学报》 EI CSCD 北大核心 2006年第4期535-543,共9页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合,提出一种新的取指控制机制.该结构的硬件开销较小,实现复杂度较低.实验结果表明,该取指控制机制有效地提高了处理器的性能,其相对于传统取指控制机制的性能加速比为28%且该加速比也高于目前基于流缓冲区和基于分支分类器的取指控制机制. 展开更多
关键词 同时多线程处理器 取指策略 分支预测器 分支分类器 控制机制
下载PDF
同时多线程结构的线程预构 被引量:2
11
作者 张盛兵 王晶 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第2期159-163,共5页
同时多线程结构中,多个线程共享一个取指单元。要选择最合适的取指线程,需要在调度策略里综合考虑流水线反馈条件或者预测流水线行为,这是非常困难的。提出了线程预构的概念,把线程取指调度分解为线程预构调度和就绪线程取指调度,分别... 同时多线程结构中,多个线程共享一个取指单元。要选择最合适的取指线程,需要在调度策略里综合考虑流水线反馈条件或者预测流水线行为,这是非常困难的。提出了线程预构的概念,把线程取指调度分解为线程预构调度和就绪线程取指调度,分别解决错误路径取指问题和指令队列阻塞问题。提出了线程缓冲的链表结构,实现了线程预构的概念,与国际公认的基准SMT结构相比,IPC平均提高9.39%。 展开更多
关键词 同时多线程处理器 取指策略 线程预构 线程缓冲区 线程调度
下载PDF
公平运行同时多线程处理器中的线程 被引量:1
12
作者 孙彩霞 张民选 《电子学报》 EI CAS CSCD 北大核心 2008年第2期224-229,共6页
同时多线程(SMT,Simultaneous Multithreading)处理器中,取指策略隐式的决定了共享资源在线程之间的分配,进而决定了吞吐量和公平性.然而,前面对取指策略的研究大都集中在吞吐量优化上,对公平性的研究极少.本文把公平性作为优化目标,提... 同时多线程(SMT,Simultaneous Multithreading)处理器中,取指策略隐式的决定了共享资源在线程之间的分配,进而决定了吞吐量和公平性.然而,前面对取指策略的研究大都集中在吞吐量优化上,对公平性的研究极少.本文把公平性作为优化目标,提出了一种新颖的取指策略FAIR.实验结果表明:对于所有类型的负载,FAIR都能获得很好的公平性,RPRrange都不超过5%.而且,FAIR并没有以牺牲吞吐量来获取公平性.与ICOUNT这种典型的以优化吞吐量为目标的取指策略相比,FAIR的吞吐量平均只降低了3.8%. 展开更多
关键词 同时多线程 取指策略 吞吐量 公平性
下载PDF
基于线程级的同时多线程处理器功耗评估
13
作者 张朝中 何立强 徐晓东 《计算机工程》 CAS CSCD 北大核心 2010年第14期259-261,共3页
针对同时多线程处理器中每个线程的功耗评估问题,提出一种同时多线程基于线程级的功耗评估方法。该方法可使系统在运行过程中统计出各线程对各部件的详细功耗情况,方便地衡量在多线程运行时各线程所产生的功耗。为同时多线程处理器进行... 针对同时多线程处理器中每个线程的功耗评估问题,提出一种同时多线程基于线程级的功耗评估方法。该方法可使系统在运行过程中统计出各线程对各部件的详细功耗情况,方便地衡量在多线程运行时各线程所产生的功耗。为同时多线程处理器进行基于功耗已知的线程调度和取指策略研究提供了基础条件。实验结果表明,各线程的功耗之和与总功耗相等。 展开更多
关键词 同时多线程 线程级 功耗 取指策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部