期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
低功耗多线程编译优化技术 被引量:16
1
作者 赵荣彩 唐志敏 +1 位作者 张兆庆 GuangR.Gao 《软件学报》 EI CSCD 北大核心 2002年第6期1123-1129,共7页
提出了在多线程体系结构中通过降低执行频率有效减小功耗的理论模型和方法.首先研究识别可降频运行的线程的计算模型和降频因子的计算,然后给出在编译过程中基于对应用程序行为的分析,结合线程划分的低功耗编译优化算法和实现策略.该模... 提出了在多线程体系结构中通过降低执行频率有效减小功耗的理论模型和方法.首先研究识别可降频运行的线程的计算模型和降频因子的计算,然后给出在编译过程中基于对应用程序行为的分析,结合线程划分的低功耗编译优化算法和实现策略.该模型和方法可用于具有执行频率可动态调整的多处理器类多线程体系结构,既可开发TLP(thread level parallelism),又可有效减小功率消耗. 展开更多
关键词 多线程 低功耗 编译优化 并行处理 计算机系统
下载PDF
多态并行处理器中的线程管理器设计 被引量:7
2
作者 钱博文 李涛 +2 位作者 韩俊刚 杨婷 刘玉荣 《电子技术应用》 北大核心 2014年第2期30-32,共3页
基于多态并行处理器提出了一种硬件线程管理器,支持MIMD模式8个线程管理操作和SIMD模式SC控制器统一管理两种工作模式,实现了线程级并行计算;可以监测各个线程的工作情况以及近邻通信寄存器和路由器的状态;能够在通信时停止、切换、启... 基于多态并行处理器提出了一种硬件线程管理器,支持MIMD模式8个线程管理操作和SIMD模式SC控制器统一管理两种工作模式,实现了线程级并行计算;可以监测各个线程的工作情况以及近邻通信寄存器和路由器的状态;能够在通信时停止、切换、启动线程,记录每个线程的工作状态,同时避免了因数据阻塞带来的等待问题,能够最大程度地提高单个处理器的执行效率。 展开更多
关键词 多核 多线程 阵列 并行处理器
下载PDF
多核处理器并行程序的确定性重放研究 被引量:10
3
作者 高岚 王锐 钱德沛 《软件学报》 EI CSCD 北大核心 2013年第6期1390-1402,共13页
多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并... 多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并行程序的普及和发展.分析了多核处理器造成并行程序确定性重放难以实现的关键因素,总结了确定性重放的评价指标,综述了近年来学术界对并行程序确定性重放的研究.根据总结的评价指标,从纯软件方式和硬件支持方式对目前的确定性重放方法进行了分析与对比,并在此基础上对多核架构下并行程序的确定性重放未来的研究趋势和应用前景进行了展望. 展开更多
关键词 多核处理器 并行程序 确定性重放 多线程程序 数据竞争 调试
下载PDF
一种支持同时多线程的VLIW DSP架构 被引量:11
4
作者 沈钲 孙义和 《电子学报》 EI CAS CSCD 北大核心 2010年第2期352-358,共7页
本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元... 本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元,该DSP架构还支持指令动态分发,由硬件分发单元而不是编译器来完成多线程指令的动态分配.实验结果表明,相比于单线程而言,本文提出的VLIW DSP架构可以提高功能单元利用率,隐藏存储器访问时延,使处理器的指令吞吐率平均提高约26.89%. 展开更多
关键词 同时多线程 超长指令字 数字信号处理器
下载PDF
网络处理器并行性能模型及多线程停顿特性
5
作者 时向泉 苏金树 +1 位作者 陈一骄 吴纯青 《通信学报》 EI CSCD 北大核心 2007年第9期53-59,共7页
对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了... 对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了验证,并给出了相关的结论。 展开更多
关键词 网络处理器 并行性能模型 多线程 停顿
下载PDF
一种支持多线索快速切换的上下文机制:多上下文并行机制
6
作者 崔光佐 李晓明 胡铭曾 《计算机研究与发展》 EI CSCD 北大核心 1997年第S1期96-100,共5页
文中通过对目前多线索处理器的分析,指出了影响上下文切换开销的因素.为了减小切换开销,分析了传统执行部件和上下文机制的局限性,提出了面向线索的运算部件和多上下文并行的概念,并由此给出了一个多线索处理器的概念设计.同时,... 文中通过对目前多线索处理器的分析,指出了影响上下文切换开销的因素.为了减小切换开销,分析了传统执行部件和上下文机制的局限性,提出了面向线索的运算部件和多上下文并行的概念,并由此给出了一个多线索处理器的概念设计.同时,对该机制所带来的效益及对机器性能的影响给予了分析和评价. 展开更多
关键词 MPP 上下文切换 多线索处理器 多上下文并行
下载PDF
并行多线程处理机体系结构分析
7
作者 赵庆敏 《微电子学与计算机》 CSCD 北大核心 2005年第5期185-187,共3页
并行多线程体系结构处理机由多个逻辑处理机构成,大量的流水线控制部件由所有的逻辑处理机所共享。在每个周期,处理机从多个线程取出多条指令调度执行。另外一个特点,它同时支持指令级和线程级的并行操作。本文分析了PMA工作原理。并给... 并行多线程体系结构处理机由多个逻辑处理机构成,大量的流水线控制部件由所有的逻辑处理机所共享。在每个周期,处理机从多个线程取出多条指令调度执行。另外一个特点,它同时支持指令级和线程级的并行操作。本文分析了PMA工作原理。并给出一个处理机模型。 展开更多
关键词 并行多线程体系结构 多线程 逻辑处理机
下载PDF
OpenSMT:一个同时多线程处理器模拟器的设计和实现 被引量:4
8
作者 路放 安虹 +1 位作者 梁博 任建 《计算机科学》 CSCD 北大核心 2006年第1期158-163,共6页
同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进... 同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进行适当的抽象,开发了一个 SMT 体系结构模拟器 OpenSMT。本文介绍了该模拟器主要的设计思想和实现方法,包括多个线程上下文结构的表示、超标量流水线各个阶段的模拟,以及模拟器设计和实现时需要解决的几个关键问题等。初步的应用研究表明,与现有可免费获得的研究用 SMT 模拟器相比,该模拟器能够较好地平衡模拟性能、灵活性和精度三个基本设计目标.实现了执行驱动、易于扩展指令集结构、艮好的用户接口、灵活的软件结构、适宜评估更广泛的 SMT、体系结构设计空间等设计要求。 展开更多
关键词 处理器模拟器 同时多线程 软件模型 结构模型 性能评价
下载PDF
Prophet推测多线程系统设计与实现 被引量:2
9
作者 李钟 赵银亮 杜延宁 《计算机科学》 CSCD 北大核心 2011年第2期296-301,共6页
推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执... 推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执行模型。重点描述了Prophet执行模型针对执行模型设计的关键问题的解决方案,包括Prophet的线程状态控制和多版本的Cache系统,Prophet的多版本Cache系统提供了推测数据缓存功能,并使用基于总线监听的Cache协议实现了数据依赖违规检测。还给出了使用Olden基准程序对Prophet执行模型进行功能和性能测试的结果,并分析说明了Prophet系统可以有效地开发应用程序的线程级并行性。 展开更多
关键词 推测多线程 线程级并行 推测多线程执行模型 推测多线程体系结构
下载PDF
细粒度并行与多线程计算 被引量:2
10
作者 洪功冰 《计算机研究与发展》 EI CSCD 北大核心 1996年第6期473-480,共8页
为实现高性能有必要采用细粒度的并行,但必须解决其中增大的通信开销问题。多线程计算不仅用来实现细粒度的并行,合理的调度策略还有助于隐藏通信延迟。但其中存在着线程切换开销的问题。
关键词 细粒度并行 通信开销 多线程 并行计算机
下载PDF
IXP1200网络处理器多层次并行机制研究 被引量:1
11
作者 刘钰 赵荣彩 +1 位作者 张铮 芦阳 《微机发展》 2004年第6期111-114,共4页
主要对千兆通讯的网络处理芯片IXP1200网络处理器进行研究和分析,着重探讨和研究其先进的多级并行设计机制。主要从体系结构和并行设计技术两个角度对IXP1200网络处理器的数控分层和多层次并行等设计机制进行了介绍。突出了其利用多线... 主要对千兆通讯的网络处理芯片IXP1200网络处理器进行研究和分析,着重探讨和研究其先进的多级并行设计机制。主要从体系结构和并行设计技术两个角度对IXP1200网络处理器的数控分层和多层次并行等设计机制进行了介绍。突出了其利用多线程、多处理器的先进设计结构来优化设计、提高处理速度的设计理念和实现过程,并在最后进一步详细讨论了如何利用特定微码指令来实现IXP1200网络处理器的指令并行和多线程并行的程序调度方法和设计技术。 展开更多
关键词 网络处理器 多线程 多级并行 高速处理
下载PDF
基于硬件多线程机制的网络处理器微引擎设计 被引量:1
12
作者 刘思远 任敏华 谷航平 《微型电脑应用》 2022年第2期106-108,共3页
网络处理器(NP)是一种专门处理网络应用数据包的处理器,和特殊应用集成电路(ASIC)相比,网络处理器有着更加灵活的特点,其可以通过编程来实现不同的网络应用。随着网络技术的发展,网络处理器的使用场景也变得越来越广泛,对微引擎(ME)的... 网络处理器(NP)是一种专门处理网络应用数据包的处理器,和特殊应用集成电路(ASIC)相比,网络处理器有着更加灵活的特点,其可以通过编程来实现不同的网络应用。随着网络技术的发展,网络处理器的使用场景也变得越来越广泛,对微引擎(ME)的性能和执行效率也有了更高的要求。为此设计了一种硬件8线程微引擎,利用专用的硬件线程切换微码指令,完成微引擎和外部存储器以及协处理器之间的数据传输,运用硬件信号量机制,实现硬件线程间的切换,节约了微引擎的访存等待时间,提升了微引擎的工作效率,通过多线程共用指令存储器,节省指令储存空间。 展开更多
关键词 硬件多线程 网络处理器 微引擎 协处理器 MIPS架构
下载PDF
申威同时多线程功能模拟器实现与应用 被引量:2
13
作者 陈伟健 郭勇 尹飞 《计算机工程》 CAS CSCD 北大核心 2016年第6期55-59,67,共6页
同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设... 同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设计方法,并实现申威SMT功能模拟器。模拟结果表明了申威SMT功能模拟器设计实现的正确性,并基于申威SMT功能模拟器构建RTL级实时验证平台,在处理器设计验证领域具有较高的应用价值。 展开更多
关键词 申威处理器 功能模拟器 体系结构模拟器 同时多线程 线程级并行
下载PDF
Improved Tomasulo algorithm
14
作者 崔光佐 胡铭曾 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 1999年第4期16-19,共4页
Tomasulo algorithm, a dynamic scheduling technique designed for float point unit(FPU) to exploit instruction level parallelism for single thread only is improved into T Tomasulo algorithm to support multiple parallel... Tomasulo algorithm, a dynamic scheduling technique designed for float point unit(FPU) to exploit instruction level parallelism for single thread only is improved into T Tomasulo algorithm to support multiple parallel contexts. FPUs can exploit the parallelisms both within single thread and among multiple threads, and FPUs can be used more effieiently. 展开更多
关键词 multithread SUPERSCALAR architecture Tomasulo ALGORITHM dynamic SCHEDULING INSTRUCTION level parallelISM
下载PDF
Hardwired Logic and Multithread Design in Network Processors
15
作者 李旭东 徐扬 +1 位作者 刘斌 王小军 《Tsinghua Science and Technology》 SCIE EI CAS 2004年第2期207-212,共6页
High-performance network processors are expected to play an important role in future high-speed routers. This paper focuses on two representative techniques needed for high-performance network processors: hardwired lo... High-performance network processors are expected to play an important role in future high-speed routers. This paper focuses on two representative techniques needed for high-performance network processors: hardwired logic design and multithread design. Using hardwired logic, this paper compares a single-thread design with a multithread design, and proposes general models and principles to analyze the clock frequency and the resource cost for these environments. Then, two IP header processing schemes, one in single-thread mode and the other in double-thread mode, are developed using these principles and the implementation results verified the theoretical calculation. 展开更多
关键词 network processor (NP) hardwired logic multithread IP header processing
原文传递
基于OpenMP的并行遗传算法探讨 被引量:7
16
作者 郑锋 李名世 蔡佳佳 《心智与计算》 2007年第4期396-402,共7页
目前主流CPU厂商都在致力发展多核处理器,增加芯片支持的并行能力,从而突破技术壁垒,提升运算速度。本文主要探讨近来流行的多核计算技术,介绍一种重要的工业标准OpenMP,以及对基于OpenMP的并行编程模式进行剖析。OpenMP编程主要是通过... 目前主流CPU厂商都在致力发展多核处理器,增加芯片支持的并行能力,从而突破技术壁垒,提升运算速度。本文主要探讨近来流行的多核计算技术,介绍一种重要的工业标准OpenMP,以及对基于OpenMP的并行编程模式进行剖析。OpenMP编程主要是通过软件多线程来提升PC应用软件的功能和性能。随后以遗传算法求解TSP问题为例子实现了OpenMP多线程应用程序。 展开更多
关键词 多核处理器 并行计算 多线程 OPENMP
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部