期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
Dynamic Power Dissipation Control Method for Real-Time Processors Based on Hardware Multithreading
1
作者 罗新强 齐悦 +1 位作者 王磊 王沁 《China Communications》 SCIE CSCD 2013年第5期156-166,共11页
In order to eliminate the energy waste caused by the traditional static hardware multithreaded processor used in real-time embedded system working in the low workload situation, the energy efficiency of the hardware m... In order to eliminate the energy waste caused by the traditional static hardware multithreaded processor used in real-time embedded system working in the low workload situation, the energy efficiency of the hardware multithread is discussed and a novel dynamic multithreaded architecture is proposed. The proposed architecture saves the energy wasted by removing idle threads without manipulation on the original architecture, fulfills a seamless switching mechanism which protects active threads and avoids pipeline stall during power mode switching. The report of an implemented dynamic multithreaded processor with 45 nm process from synthesis tool indicates that the area of dynamic multithreaded architecture is only 2.27% higher than the static one in achieving dynamic power dissipation, and consumes 1.3% more power in the same peak performance. 展开更多
关键词 dynamic power dissipation control real-time processor hardware multithread low power design energy efficiency
下载PDF
Redundant Multithreading Architecture Overview
2
作者 YANG Hua CUI Gang LIU Hongwei YANG Xiaozong 《Wuhan University Journal of Natural Sciences》 CAS 2006年第6期1793-1796,共4页
To overcome the ever-increasing susceptibility to transient-fault in processors, various redundant multithreading (RMT) architectures have been proposed, which is becoming a most effective approach for detecting and... To overcome the ever-increasing susceptibility to transient-fault in processors, various redundant multithreading (RMT) architectures have been proposed, which is becoming a most effective approach for detecting and recovering from transient-fault. This paper surveys a wide range of RMT architectures-from the original AR-SMT(A-stream R-stream Simultaneous MultiThreading) to the most-recent SD-SRT (Slack-Decode Simultaneous Redundant Threading), presenting traverse analyses and comparisons among them, and hereby demonstrates its evolution and tendency. Finally, some directions and suggestions are put forward for the further RMT research and development. 展开更多
关键词 redundant multithreading processor RELIABILITY
下载PDF
一种嵌入式硬件多线程处理器的研究 被引量:5
3
作者 尹震宇 赵海 +1 位作者 张文波 王小英 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第9期968-971,共4页
提出了一种基于同时多线程技术的硬件多线程处理器设计.通过处理器内部的硬件机制来完成对多线程的调度管理,实现基于硬件的时间片轮询多线程调度机制.最大程度地减少操作系统中关于线程调度的开销,提高处理器执行多用户线程时的整体效... 提出了一种基于同时多线程技术的硬件多线程处理器设计.通过处理器内部的硬件机制来完成对多线程的调度管理,实现基于硬件的时间片轮询多线程调度机制.最大程度地减少操作系统中关于线程调度的开销,提高处理器执行多用户线程时的整体效率,简化了用户在多线程条件下的编程复杂度,增强了多线程运行环境下处理器对线程的保护. 展开更多
关键词 多线程处理器 多线程处理 FPGA 嵌入式系统 处理器设计
下载PDF
同时多线程技术 被引量:8
4
作者 刘权胜 杨洪斌 吴悦 《计算机工程与设计》 CSCD 北大核心 2008年第4期963-967,共5页
同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成... 同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成果及影响,并探讨了当前同时多线程技术的发展趋势。 展开更多
关键词 模型 处理器 多线程 同时多线程 同时多线程处理器
下载PDF
面向FT1000微处理器的STREAM并行计算与优化 被引量:4
5
作者 迟利华 胡庆丰 +3 位作者 刘杰 甘新标 蒋杰 晏益慧 《计算机工程与科学》 CSCD 北大核心 2014年第12期2267-2271,共5页
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小... STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。 展开更多
关键词 多线程微处理器 STREAM测试程序 性能优化
下载PDF
多态并行处理器中的线程管理器设计 被引量:7
6
作者 钱博文 李涛 +2 位作者 韩俊刚 杨婷 刘玉荣 《电子技术应用》 北大核心 2014年第2期30-32,共3页
基于多态并行处理器提出了一种硬件线程管理器,支持MIMD模式8个线程管理操作和SIMD模式SC控制器统一管理两种工作模式,实现了线程级并行计算;可以监测各个线程的工作情况以及近邻通信寄存器和路由器的状态;能够在通信时停止、切换、启... 基于多态并行处理器提出了一种硬件线程管理器,支持MIMD模式8个线程管理操作和SIMD模式SC控制器统一管理两种工作模式,实现了线程级并行计算;可以监测各个线程的工作情况以及近邻通信寄存器和路由器的状态;能够在通信时停止、切换、启动线程,记录每个线程的工作状态,同时避免了因数据阻塞带来的等待问题,能够最大程度地提高单个处理器的执行效率。 展开更多
关键词 多核 多线程 阵列 并行处理器
下载PDF
一种有效的同时多线程处理器取指控制机制 被引量:4
7
作者 何立强 刘志勇 《计算机学报》 EI CSCD 北大核心 2006年第4期535-543,共9页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,极大地提高了处理器的性能.分支预测器的预测精度和取指策略的效率是影响同时多线程处理器性能的关键.通过将一个基于值的分支预测器和一个基于线程推进速度的取指策略相结合,提出一种新的取指控制机制.该结构的硬件开销较小,实现复杂度较低.实验结果表明,该取指控制机制有效地提高了处理器的性能,其相对于传统取指控制机制的性能加速比为28%且该加速比也高于目前基于流缓冲区和基于分支分类器的取指控制机制. 展开更多
关键词 同时多线程处理器 取指策略 分支预测器 分支分类器 取指控制机制
下载PDF
一种具有QoS特性的同时多线程处理器取指策略 被引量:4
8
作者 何立强 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2006年第11期1980-1984,共5页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线程的取指过程,从而满足线程在执行速度上的QoS需求.与传统的基于纯优先级的取指策略相比,该策略不但具有QoS特性,同时还可以更加有效地分配取指带宽,从而能获得更高的处理器性能.该策略的物理实现非常简单.模拟实验的结果表明,该策略在提供QoS支持的基础上,可以在传统的基于优先级的取指策略ICOUNT的基础上提高15%的系统性能. 展开更多
关键词 同时多线程处理器 取指策略 服务质量
下载PDF
嵌入式多线程处理器的执行控制设计方法的研究 被引量:3
9
作者 张文波 苑凌娇 +1 位作者 谭小波 付立冬 《沈阳理工大学学报》 CAS 2012年第4期1-5,共5页
针对目前单处理器系统利用软件执行多线程时线程切换开销大,编程实现比较复杂的问题,提出了一种用硬件实现的嵌入式多线程处理器,并深入地研究了如何利用硬件完成线程的调度管理、处理现场保护以减少系统进行线程切换和调度的开销等方... 针对目前单处理器系统利用软件执行多线程时线程切换开销大,编程实现比较复杂的问题,提出了一种用硬件实现的嵌入式多线程处理器,并深入地研究了如何利用硬件完成线程的调度管理、处理现场保护以减少系统进行线程切换和调度的开销等方法。为了实现零处理时间切换的目标,采用并行方法对寄存器及线程执行状态等私有资源切换、保存和恢复等。通过该研究实现的处理器与软件实现的多线程调度进行了对比,仿真结果表明,该方法可有效提高系统多线程处理的效率及安全性,降低在多线程环境下程序开发的复杂性。 展开更多
关键词 多线程处理器 多线程处理 现场可编程门阵列 流水线 有限状态机
下载PDF
基于网络处理器的IPv4/IPv6综合防火墙体系结构研究 被引量:2
10
作者 钟婷 刘勇 +1 位作者 李志军 秦志光 《通信学报》 EI CSCD 北大核心 2006年第2期142-146,共5页
分析了研究开发适应IPv4/IPv6共存环境的安全设备的重要意义。利用Intel IXP2400处理器的多线程、多处理器的先进设计结构来优化设计、提高处理速度,提出了基于网络处理器的IPv4/IPv6综合防火墙的硬件体系结构及软件架构。在此架构下的... 分析了研究开发适应IPv4/IPv6共存环境的安全设备的重要意义。利用Intel IXP2400处理器的多线程、多处理器的先进设计结构来优化设计、提高处理速度,提出了基于网络处理器的IPv4/IPv6综合防火墙的硬件体系结构及软件架构。在此架构下的防火墙系统具有完善的功能及优良性能,能够适应下一代互联网环境。 展开更多
关键词 防火墙 网络处理器 微引擎 多线程
下载PDF
一种支持同时多线程的VLIW DSP架构 被引量:11
11
作者 沈钲 孙义和 《电子学报》 EI CAS CSCD 北大核心 2010年第2期352-358,共7页
本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元... 本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元,该DSP架构还支持指令动态分发,由硬件分发单元而不是编译器来完成多线程指令的动态分配.实验结果表明,相比于单线程而言,本文提出的VLIW DSP架构可以提高功能单元利用率,隐藏存储器访问时延,使处理器的指令吞吐率平均提高约26.89%. 展开更多
关键词 同时多线程 超长指令字 数字信号处理器
下载PDF
基于负载瞬时IPC性能的同时多线程处理器取指策略 被引量:1
12
作者 何立强 刘志勇 《计算机学报》 EI CSCD 北大核心 2007年第4期629-637,共9页
同时多线程处理器在每时钟周期从多个线程读取指令执行,极大地提高了指令吞吐率.文中简单介绍了SMT技术,讨论了常用的取指策略,比较了各策略在提高性能方面的优劣.给出特定负载下理论上的最优取指策略,在此基础上提出一种基于负载瞬时IP... 同时多线程处理器在每时钟周期从多个线程读取指令执行,极大地提高了指令吞吐率.文中简单介绍了SMT技术,讨论了常用的取指策略,比较了各策略在提高性能方面的优劣.给出特定负载下理论上的最优取指策略,在此基础上提出一种基于负载瞬时IPC性能的动态取指策略IPCBFP.实验表明,该策略可以有效地提高负载的性能,平均加速比对于两线程负载可以达到17%,对于四线程负载可以达到8%.该策略还具有平均占用指令队列项少,指令队列冲突率低的特点,而且,对降低SMT的Cache失效率和TLB失效率方面也有一定的作用. 展开更多
关键词 同时多线程处理器 取指策略 指令队列 IPC 指令吞吐率
下载PDF
基于共享Cache多核处理器的Hash连接优化 被引量:4
13
作者 邓亚丹 景宁 熊伟 《软件学报》 EI CSCD 北大核心 2010年第6期1220-1232,共13页
针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行... 针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行框架中的各种线程及其访问共享Cache的性能,优化了聚集连接时Hash连接算法的内存访问,并分析了多线程聚集划分的加速比.基于开源数据库INGRES和EaseDB,实现了所提出的连接多线程执行框架,在实验中测试了多线程Hash连接框架的性能.实验结果表明,该算法可以有效解决Hash连接执行时共享Cache在多线程条件下的访问冲突和处理器负载均衡问题,极大地提高了Hash连接性能. 展开更多
关键词 Hash连接 Radix-Join 多核处理器 共享CACHE 多线程性能分析
下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
14
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理器 同时多线程 每周期完成的指令数(IPC)
下载PDF
多核处理器并行程序的确定性重放研究 被引量:10
15
作者 高岚 王锐 钱德沛 《软件学报》 EI CSCD 北大核心 2013年第6期1390-1402,共13页
多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并... 多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并行程序的普及和发展.分析了多核处理器造成并行程序确定性重放难以实现的关键因素,总结了确定性重放的评价指标,综述了近年来学术界对并行程序确定性重放的研究.根据总结的评价指标,从纯软件方式和硬件支持方式对目前的确定性重放方法进行了分析与对比,并在此基础上对多核架构下并行程序的确定性重放未来的研究趋势和应用前景进行了展望. 展开更多
关键词 多核处理器 并行程序 确定性重放 多线程程序 数据竞争 调试
下载PDF
多核处理器中基于Radix-Join的嵌套循环连接优化 被引量:1
16
作者 邓亚丹 景宁 熊伟 《计算机研究与发展》 EI CSCD 北大核心 2010年第6期1079-1087,共9页
针对目前主流的多核处理器,研究了基于共享Cache多核处理器的数据库Nested Loop Join(NINLJ)优化.针对无索引情况下的NLJ,提出了基于Radix-NL-Join算法的NLJ多线程执行框架.从减少Cache访问冲突和提高Cache命中率两个方面优化了NINLJ多... 针对目前主流的多核处理器,研究了基于共享Cache多核处理器的数据库Nested Loop Join(NINLJ)优化.针对无索引情况下的NLJ,提出了基于Radix-NL-Join算法的NLJ多线程执行框架.从减少Cache访问冲突和提高Cache命中率两个方面优化了NINLJ多线程执行框架中的聚集划分和聚集连接线程.主要贡献如下:1.针对多线程访问共享Cache容易出现共享Cache访问冲突的问题,优化了聚集划分阶段的多线程聚集划分线程的启动时机;2.针对聚集连接阶段,聚集连接线程Cache访问性能不佳,利用聚集连接线程顺序访问聚集的优势,采用预取线程提高聚集连接线程的性能;3.在实验中,基于开源数据库EaseDB实现了上述多线程执行框架,测试了多线程NLJ的性能.实验结果表明,提出的NLJ多线程执行框架,可以充分利用多核处理器的计算资源,并有效地解决共享Cache在多线程条件下的Cache访问冲突问题,大大提高了NLJ的性能,相对于未采用Cache优化的多线程Radix-NL-Join算法,其性能提升了26%左右. 展开更多
关键词 嵌套循环连接 Radix-Join 共享Cache多核处理器 多线程优化 Cache访问优化
下载PDF
多线程防火墙过滤模块的设计与实现 被引量:1
17
作者 黄力 谢翠兰 《广西民族大学学报(自然科学版)》 CAS 2008年第1期70-74,共5页
根据包过滤的工作原理,利用网络处理器的优势,设计一种基于Intel IXP2400网络处理器的防火墙安全解决方案,包括过滤模块过滤规则的程序描述、数据结构、设计流程和功能实现.最后,以LINUX的IPCHAIN防火墙为例进行测试,测试结果表明:与传... 根据包过滤的工作原理,利用网络处理器的优势,设计一种基于Intel IXP2400网络处理器的防火墙安全解决方案,包括过滤模块过滤规则的程序描述、数据结构、设计流程和功能实现.最后,以LINUX的IPCHAIN防火墙为例进行测试,测试结果表明:与传统的防火墙相比,该设计方案性能优越,具备较高的吞吐量. 展开更多
关键词 多线程 过滤 IXP2800 网络处理器
下载PDF
基于NP的Dijkstra算法硬件多线程实现与性能分析
18
作者 杨冬 张宏科 +1 位作者 王江林 武勇 《北京交通大学学报》 EI CAS CSCD 北大核心 2005年第5期14-18,共5页
Dijkstra算法是链路状态路由协议使用的主要算法.随着Intenet中加入的路由器数目的不断增加,该算法运行的时间花费越来越大,影响了路由协议的性能,成为链路状态路由协议的一个瓶颈问题.本文将从这一瓶颈问题出发,采用Intel公司的网络处... Dijkstra算法是链路状态路由协议使用的主要算法.随着Intenet中加入的路由器数目的不断增加,该算法运行的时间花费越来越大,影响了路由协议的性能,成为链路状态路由协议的一个瓶颈问题.本文将从这一瓶颈问题出发,采用Intel公司的网络处理器IXP2400为硬件平台,设计Dijkstra算法的硬件多线程实现,从而提高处理器利用率,缓解瓶颈.最后给出一种性能分析和优化的计算方法.通过计算可以看到,在节点比较密集的星形网络拓扑结构中,多线程实现可提高两倍的性能. 展开更多
关键词 DIJKSTRA算法 多线程 网络处理器 可移植性
下载PDF
同时多线程微处理器分布式保留站结构的数据流技术
19
作者 杨洪斌 吴悦 刘权胜 《应用科学学报》 CAS CSCD 北大核心 2008年第2期188-193,共6页
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的... 为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的结果表明数据流指令的并行度得到明显提高.对保留站、重排序缓冲提交机制及寄存器堆协同工作的功能进行验证与仿真,用综合工具完成逻辑综合. 展开更多
关键词 同时多线程微处理器 保留站 重排序缓冲 寄存器 执行部件
下载PDF
32位同时多线程微处理器的ALU设计
20
作者 刘权胜 杨洪斌 吴悦 《计算机工程与设计》 CSCD 北大核心 2008年第11期2831-2833,共3页
针对传统ALU存在较大硬件资源浪费的缺点,提出了一种指令执行并行度宽、资源利用率高的同时多线程ALU。同时多线程ALU由7个并行的部件组成。每个部件高效的执行两个线程的指令。这种由7个部分组成的分布式ALU提高了指令并行执行的宽度,... 针对传统ALU存在较大硬件资源浪费的缺点,提出了一种指令执行并行度宽、资源利用率高的同时多线程ALU。同时多线程ALU由7个并行的部件组成。每个部件高效的执行两个线程的指令。这种由7个部分组成的分布式ALU提高了指令并行执行的宽度,大大降低了水平浪费和垂直浪费。对微处理器ALU进行功能验证与仿真,并用综合工具完成逻辑综合。 展开更多
关键词 同时多线程 微处理器 算术逻辑单元 仿真 验证 综合
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部