期刊文献+
共找到376篇文章
< 1 2 19 >
每页显示 20 50 100
多核构架下OpenMP多线程应用运行性能的研究 被引量:16
1
作者 徐磊 徐莹 张丹丹 《计算机工程与科学》 CSCD 北大核心 2009年第11期50-53,57,共5页
多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编... 多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编译器绑定接口以及Linux内核API的方式实现OpenMP线程与核之间的绑定,使用STREAM Benchmark和NPB在上海超级计算中心的"魔方"超级计算机刀片上测试、比较绑定前后的应用程序的性能。结果证明,使用绑定方案将有可能提升OpenMP应用程序的性能。 展开更多
关键词 多核openmp线程 绑定STREAM NPB
下载PDF
多线程多核服务器功耗模型及性能监控
2
作者 秦陈 侯雨晴 +1 位作者 邓意方 曾利军 《福建电脑》 2024年第5期38-42,共5页
针对现有服务器的CPU功耗准确性不足和多线程处理功耗负载不平衡问题,本文提出了一种多线程和多核服务器CPU功耗模型。该模型采用前后端分离的整体架构思想,根据服务器功耗模型实时获取CPU的线程数、频率及利用率。通过日志文件进行反... 针对现有服务器的CPU功耗准确性不足和多线程处理功耗负载不平衡问题,本文提出了一种多线程和多核服务器CPU功耗模型。该模型采用前后端分离的整体架构思想,根据服务器功耗模型实时获取CPU的线程数、频率及利用率。通过日志文件进行反馈多线程和多核功耗模型,达到最佳服务器负载平衡。仿真测试的结果表明,改进的服务器功耗模型在CPU利用率方面比传统服务器提高了6%,内存以及I/O通信方面也有明显改善,为多线程和多核服务器提供了一种新的功耗模型思路。 展开更多
关键词 线程 多核服务器 功耗模型 负载平衡
下载PDF
多核多线程技术综述 被引量:46
3
作者 眭俊华 刘慧娜 +1 位作者 王建鑫 秦庆旺 《计算机应用》 CSCD 北大核心 2013年第A01期239-242,261,共5页
分析了多核CPU和操作系统、并行计算以及多线程设计与开发之间的关系,结合一个新的性能评估算法,从线程并行数量、数据竞争、锁竞争、线程安全、数据传输、存储一致性等方面,详细分析了多核多线程开发中开发技术和存在的问题,并给出了... 分析了多核CPU和操作系统、并行计算以及多线程设计与开发之间的关系,结合一个新的性能评估算法,从线程并行数量、数据竞争、锁竞争、线程安全、数据传输、存储一致性等方面,详细分析了多核多线程开发中开发技术和存在的问题,并给出了对应的措施,最后简要论述和分析了多核多线程技术的发展趋势。 展开更多
关键词 多核CPU 线程 任务调度 数据共享 锁竞争 线程安全 cache存储一致性
下载PDF
多核多线程结构线程调度策略研究 被引量:13
4
作者 王晶 樊晓桠 +1 位作者 张盛兵 王海 《计算机科学》 CSCD 北大核心 2007年第9期256-258,289,共4页
片上多校多线程(CMT)结构兼具了片上多处理(CMP)和同时多线程(SMT)结构的优势,支持片上所有处于执行状态的线程每周期并行执行,导致核内与核间硬件资源共享和争用问题。该文在阐述CMT结构的资源共享特征并简要介绍SMT线程调度发展状况... 片上多校多线程(CMT)结构兼具了片上多处理(CMP)和同时多线程(SMT)结构的优势,支持片上所有处于执行状态的线程每周期并行执行,导致核内与核间硬件资源共享和争用问题。该文在阐述CMT结构的资源共享特征并简要介绍SMT线程调度发展状况的基础上,主要围绕以减少资源争用为目标的线程调度策略和资源划分机制等热点,分析其研究现状,论述已有策略在处理这些问题上的优缺点,并探讨了可能的研究发展方向。 展开更多
关键词 同时多线程 片上多处理 片上多核线程 线程调度 资源划分
下载PDF
面向多核多线程的移动对象连续K近邻查询 被引量:11
5
作者 赵亮 景宁 +2 位作者 陈荦 廖巍 钟志农 《软件学报》 EI CSCD 北大核心 2011年第8期1805-1815,共11页
针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框架.将查询处理分为查询预处理阶段和查询执行阶段,分别执行数据更新任务和查询处理任务.每个阶段都设计... 针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框架.将查询处理分为查询预处理阶段和查询执行阶段,分别执行数据更新任务和查询处理任务.每个阶段都设计了优化cache访问命中率,并利用多线程技术提高多用户连续查询处理并行性的方法及数据结构.提出了一种查询执行阶段的查询分组技术,利用查询之间的相关性提高了算法执行时内存访问的时间局部性.基于查询处理框架和移动对象内存格网索引结构提出了K近邻查询处理算法.充分的实验结果表明,采用了多线程和cache优化技术的连续查询处理框架与其他算法相比,在性能上具有较大优势,并且在不同核心数目的CPU平台下具有较好的性能扩展性. 展开更多
关键词 移动对象 连续K近邻查询 多核线程 CACHE优化 查询分组
下载PDF
基于粒子群算法的多核处理器线程调度研究 被引量:8
6
作者 杨洪斌 陈伟 吴悦 《计算机工程与设计》 CSCD 北大核心 2010年第5期1045-1047,共3页
为有效解决多核处理器的线程调度问题,提出了一种基于粒子群算法框架上的线程调度算法。该算法依据设计的调度模型,在线程DAG图上通过复制不在同一处理器上且存在相关性的线程,生成相互独立的子DAG图,并采用改进的粒子群优化算法对其进... 为有效解决多核处理器的线程调度问题,提出了一种基于粒子群算法框架上的线程调度算法。该算法依据设计的调度模型,在线程DAG图上通过复制不在同一处理器上且存在相关性的线程,生成相互独立的子DAG图,并采用改进的粒子群优化算法对其进行合理调度,由此提高线程调度效率。仿真实现了该算法,并通过实验数据验证了该算法的优越性。 展开更多
关键词 多核处理器 线程调度 粒子群算法 搜索效率 线程分配
下载PDF
多核、多线程处理器的低功耗设计技术研究 被引量:15
7
作者 张骏 樊晓桠 刘松鹤 《计算机科学》 CSCD 北大核心 2007年第10期301-305,共5页
随着微处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,超高的功耗密度时系统稳定性造成很大影响,功耗壁垒已经成为提升微处理器性能的最大障碍。本文介绍了低功耗设计的基本原理、研究内容、设计方法,分析了CMP和SM... 随着微处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,超高的功耗密度时系统稳定性造成很大影响,功耗壁垒已经成为提升微处理器性能的最大障碍。本文介绍了低功耗设计的基本原理、研究内容、设计方法,分析了CMP和SMT体系结构的功耗需求和特性,讨论了不同的功耗优化策略在两种体系结构下的适用程度以及对性能造成的影响。针对多核、多线程体系结构,着重从系统级、结构级和电路级等不同抽象层次时典型的功耗优化技术做了讨论。最后,展望了未来微处理器低功耗设计技术的发展趋势。 展开更多
关键词 多核 线程 微处理器 低功耗
下载PDF
多核微机基于OpenMP的并行计算 被引量:44
8
作者 蔡佳佳 李名世 郑锋 《计算机技术与发展》 2007年第10期87-91,共5页
随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。... 随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数,以及Intel C++编译器9.1和Microsoft Visual Studio 2005等对OpenMP的支持;着重探讨了二维离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。 展开更多
关键词 多核计算机 并行计算 线程 OvenMP
下载PDF
用线程级推测技术在多核体系结构上并行化科学计算应用 被引量:2
9
作者 王耀彬 安虹 +2 位作者 郭锐 闫洁 路璐 《小型微型计算机系统》 CSCD 北大核心 2010年第2期264-270,共7页
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS... 线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源. 展开更多
关键词 多核 线程级推测 线程划分 动态剖析
下载PDF
多核多线程处理器存储技术研究进展 被引量:8
10
作者 屈文新 樊晓桠 张盛兵 《计算机科学》 CSCD 北大核心 2007年第4期13-16,23,共5页
多核多线程技术已经成为微处理器发展的趋势,使用多核多线程技术可以使微处理器的性能得到极大的提高,但同时也对存储系统提出了更高的要求。而相对增长的存储器访问延迟已经成为影响多核多线程处理器性能进一步提高的重要因素。本文首... 多核多线程技术已经成为微处理器发展的趋势,使用多核多线程技术可以使微处理器的性能得到极大的提高,但同时也对存储系统提出了更高的要求。而相对增长的存储器访问延迟已经成为影响多核多线程处理器性能进一步提高的重要因素。本文首先介绍了当前常见的几种多核多线程处理器的结构,然后介绍了目前多核多线程处理器存储系统的研究现状,在此基础上讨论了当前多核多线程处理器存储系统研究的热点,并对多核多线程处理器存储系统技术的发展趋势进行了展望。 展开更多
关键词 多核线程 存储系统 访问延迟
下载PDF
异构多核上支持OpenMP3.0的自适应任务粒度策略 被引量:2
11
作者 曹倩 左敏 《小型微型计算机系统》 CSCD 北大核心 2012年第6期1350-1357,共8页
任务粒度是决定任务并行程序性能的关键因素,鉴于不同应用其最优的任务粒度可能不同,提出一种异构多核Cell处理器上支持OpenMP3.0的自适应任务粒度策略.该策略首先广度生成任务,直到所有的线程达到饱和,之后若某个线程执行完自身任务而... 任务粒度是决定任务并行程序性能的关键因素,鉴于不同应用其最优的任务粒度可能不同,提出一种异构多核Cell处理器上支持OpenMP3.0的自适应任务粒度策略.该策略首先广度生成任务,直到所有的线程达到饱和,之后若某个线程执行完自身任务而处于空闲状态时,通过回溯到忙碌线程的任务树中最早可以派生任务的结点处生成新任务,以供空闲线程窃取执行.该策略不仅保证生成的任务粒度最大化,并且有效地解决了负载不均衡问题.实验在一个Cell处理器上进行,结果表明与顺序执行速度相比,自适应任务粒度策略达到了4.1到7.2的加速比,并且该策略优于现有的Tascell和AdaptiveTC方案,同时对于绝大部分应用表现出了良好的可扩展行. 展开更多
关键词 自适应 任务粒度 openmp 多核 异构
下载PDF
基于多核的多线程程序优化研究 被引量:17
12
作者 施惠丰 袁道华 《计算机技术与发展》 2010年第6期70-73,共4页
随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及。以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资源。怎样高效地利用多核处理器的计算性能,已经成为软件开发者面临的新的课题。文中在传统的多线程编程... 随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及。以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资源。怎样高效地利用多核处理器的计算性能,已经成为软件开发者面临的新的课题。文中在传统的多线程编程基础上,根据Intel处理器的微架构(Microarchitecture)特点,以及Linux内核提供的CPU绑定技术,通过采用Cache优化和CPU亲和力(CPU affinity)优化,消除了多核环境下局部多线程Cache行竞争和伪共享,减少了线程的调度开销,提高了多线程程序的运行效率。 展开更多
关键词 多核处理器 线程编程 CACHE优化 CPU亲和力
下载PDF
面向众核系统的线程分组映射方法 被引量:1
13
作者 巨涛 张兴军 +1 位作者 陈衡 董小社 《西安交通大学学报》 EI CAS CSCD 北大核心 2016年第10期57-63,共7页
为了使应用线程更合理地映射到众核处理器具体处理核上,提出一种利用不同线程内部数据局部性及不同线程间数据相关性的特点、结合具体硬件架构特征的线程分组映射方法。通过计算数据重用距离,分析应用程序线程内部数据局部性,用线程相... 为了使应用线程更合理地映射到众核处理器具体处理核上,提出一种利用不同线程内部数据局部性及不同线程间数据相关性的特点、结合具体硬件架构特征的线程分组映射方法。通过计算数据重用距离,分析应用程序线程内部数据局部性,用线程相关性矩阵度量不同线程间的数据相关性;根据应用程序数据相关性及众核处理器硬件架构特点,通过设计数据相关性子树生成算法,将应用线程分为能反映不同线程数据访问特点的逻辑组;在线程逻辑分组的基础上,通过线程到处理核的绑定实现线程到具体处理器不同处理核硬件线程的合理映射。实验结果表明:与传统映射方法相比,该线程分组映射方法在不产生额外运行时开销的基础上,计算性能平均提高了14%,能耗降低了12%。该方法可以根据应用程序不同线程之间的数据相关性,将不同线程合理映射到具体众核处理器不同处理核上,在不引入额外运行时开销的基础上,提升众核系统的计算效能。 展开更多
关键词 系统 线程映射 数据相关性 数据重用距离 线程逻辑分组
下载PDF
多核下一种线程调度算法的研究与实现 被引量:2
14
作者 林英 孟正 +1 位作者 康雁 于倩 《计算机技术与发展》 2013年第10期19-22,26,共5页
随着多核处理器的出现,多核系统线程调度算法成为了一个重要的研究方向,基于DAG表示并行任务在多处理机上进行处理的研究由来已久。文中提出一个基于DAG及Petri网的调度算法,通过把DAG转换为Petri网,希望以直观的方式表达需调度任务的... 随着多核处理器的出现,多核系统线程调度算法成为了一个重要的研究方向,基于DAG表示并行任务在多处理机上进行处理的研究由来已久。文中提出一个基于DAG及Petri网的调度算法,通过把DAG转换为Petri网,希望以直观的方式表达需调度任务的并发、顺序、冲突、同步等关系。该算法充分考虑调度任务之间的并行性,使得并行任务能够并行调度在不同的处理器上,从而有效缩短任务图的调度长度。结果表明,通过有效挖掘Petri网的并行性,能够得到具有较好并行性的任务调度序列,通过合理分配该任务调度序列,可以得到较好的调度性能。 展开更多
关键词 多核 线程调度 有向图环图 PETRI网
下载PDF
面向实时流处理的多核多线程处理器访存队列 被引量:3
15
作者 田杭沛 高德远 +1 位作者 樊晓桠 朱怡安 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1634-1641,共8页
针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策... 针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策略减少访存延迟.实验证明,该访存队列可控制最大访存延迟,与顺序访存相比,存储器具备更高的带宽,与传统的乱序访存相比较,可以充分满足计算的实时性需求,而存储器有效带宽基本不受影响,解决了多核多线程处理器承担实时流计算的基础难题. 展开更多
关键词 计算机体系结构 实时流处理 多核线程处理器 访存队列 窗口优化
下载PDF
基于多核多线程的排序算法优化和实现 被引量:3
16
作者 钱晓捷 李秀芳 《微电子学与计算机》 CSCD 北大核心 2011年第1期116-119,共4页
根据各多线程技术和多核特点,提出了归并排序基于多线程的改进方法.并采用各排序算法组合的方法,使用WIN32 API多线程编程方法实现了新的算法.实验结果表明该算法比传统算法效率有很大提升.
关键词 多核 归并排序 线程 并行排序算法 算法优化
下载PDF
面向多核网络分组处理系统的线程亲和缓冲区管理机制 被引量:1
17
作者 杨惠 陈一骄 +2 位作者 李韬 李世星 戴幻尧 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第5期26-31,共6页
基于通用多核架构的网络分组处理系统性能受到诸如分组IO开销高、多核共享内存及进程调度竞争大、页表缓冲表项失效率高等问题的困扰。为此提出一种基于通用多核网络分组处理系统、面向高速分组转发应用的线程亲和缓冲区硬件管理机制,... 基于通用多核架构的网络分组处理系统性能受到诸如分组IO开销高、多核共享内存及进程调度竞争大、页表缓冲表项失效率高等问题的困扰。为此提出一种基于通用多核网络分组处理系统、面向高速分组转发应用的线程亲和缓冲区硬件管理机制,并在网络专用协处理引擎上实现。该机制采用无中断的线程亲和调度策略,将包含控制信息与缓冲区地址信息的描述符和分组数据按照分组处理的线程号链式地对应加载在多个地址连续的共享缓冲区中。基于通用多核和现场可编程门阵列平台进行报文转发测试,实验结果表明,采用线程亲和缓冲区管理机制能使平均报文转发处理性能提升12.4%,有效地降低IO开销和TLB表项失效率。 展开更多
关键词 分组10 线程亲和 缓冲区管理 分组转发 多核
下载PDF
基于蚁群优化算法的异构多核线程调度方法 被引量:2
18
作者 李静梅 张大虎 +1 位作者 吴艳霞 孙传恒 《计算机工程与设计》 CSCD 北大核心 2014年第6期1946-1950,共5页
针对如何发挥异构多核处理器的优势、提高程序执行效率,提出一种异构多核线程调度的蚁群优化算法—ACOTS(ant colony optimization for thread scheduling)。建立线程调度模型和路径选择规则实现连续搜索空间在离散空间的映射,使蚁群算... 针对如何发挥异构多核处理器的优势、提高程序执行效率,提出一种异构多核线程调度的蚁群优化算法—ACOTS(ant colony optimization for thread scheduling)。建立线程调度模型和路径选择规则实现连续搜索空间在离散空间的映射,使蚁群算法能够适用于异构多核处理器线程调度问题;通过引入遗传算法中的变异因子对局部搜索过程进行优化,克服蚁群算法搜索时间过长和"早熟"收敛现象,降低总的程序执行时间。仿真结果表明,ACOTS算法性能优于现有的遗传算法,能有效降低程序执行时间,适用于异构多核等大规模并行环境的线程调度。 展开更多
关键词 异构多核处理器 线程调度 蚁群算法 遗传算法 调度方法
下载PDF
基于多核处理器的K线程低能耗的任务调度优化算法 被引量:2
19
作者 王科特 王力生 廖新考 《计算机科学》 CSCD 北大核心 2015年第2期18-23,共6页
针对具有独立DVFS的多核处理器系统,提出了一种K线程低能耗模型的并行任务调度优化算法(Tasks Optimization based on Energy-Effectiveness Model,TO-EEM)。与传统的并行任务节能调度相比,该算法的主要目标是不仅通过降低处理器频率来... 针对具有独立DVFS的多核处理器系统,提出了一种K线程低能耗模型的并行任务调度优化算法(Tasks Optimization based on Energy-Effectiveness Model,TO-EEM)。与传统的并行任务节能调度相比,该算法的主要目标是不仅通过降低处理器频率来减少处理器瞬时功耗,而且结合并行任务间的同步互斥所造成的线程阻塞情况,合理分配线程资源来减少线程同步时间,优化并行性能;保证任务在一定的并行加速比性能前提下,提高资源利用率,减少能耗,达到程序能耗和性能之间的折衷。文中进行了大量模拟实验,结果证明提出的任务优化模型算法节能效果明显,能有效降低处理器的功耗,并始终保持线性加速比。 展开更多
关键词 多核 能耗优化模型 线程 多任务并行 资源利用率 同步
下载PDF
多核多线程处理器的发展及其软件系统架构 被引量:22
20
作者 刘近光 梁满贵 《微处理机》 2007年第1期1-3,7,共4页
首先介绍了关于multi-core(多核)、multi-threading(多线程,特指硬件线程)处理器的最新发展情况,然后介绍了基于MIPS体系结构的多核处理器的特点。针对多核处理器,给出了在路由器中软件的架构,并探讨了在发展多核系统软件方面给中国的... 首先介绍了关于multi-core(多核)、multi-threading(多线程,特指硬件线程)处理器的最新发展情况,然后介绍了基于MIPS体系结构的多核处理器的特点。针对多核处理器,给出了在路由器中软件的架构,并探讨了在发展多核系统软件方面给中国的系统软件业带来的机遇。 展开更多
关键词 多核 线程 网络处理器 微内 Neutrino(QNX公司开发的多核操作系统 微内架构)
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部