期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
一种片上众核结构共享Cache动态隐式隔离机制研究 被引量:3
1
作者 宋风龙 刘志勇 +2 位作者 范东睿 张军超 余磊 《计算机学报》 EI CSCD 北大核心 2009年第10期1896-1904,共9页
访存带宽是限制众核处理器性能提升的关键,将片上最后一级Cache设计为所有处理器核共享是必要的.在共享Cache中隔离放置冲突的数据,是提高共享Cache性能的关键.文中提出了缓存块链接的硬件方法,用于隔离共享Cache中不同线程之间的数据.... 访存带宽是限制众核处理器性能提升的关键,将片上最后一级Cache设计为所有处理器核共享是必要的.在共享Cache中隔离放置冲突的数据,是提高共享Cache性能的关键.文中提出了缓存块链接的硬件方法,用于隔离共享Cache中不同线程之间的数据.文中基于时钟精准的片上众核结构模拟器,使用Splash2程序组和生物信息学中的任务,对所提机制进行了评估.实验结果表明,与传统共享Cache相比,使用缓存块链接机制时,使得共享Cache的冲突性缺失率降低约20%,而使得IPC平均提高了约10%. 展开更多
关键词 众核 共享cache 数据冲突 资源隔离 容量划分
下载PDF
基于取指执行时序范畴的多核共享Cache干扰分析 被引量:4
2
作者 陈芳园 张冬松 +1 位作者 刘聪 王志英 《计算机研究与发展》 EI CSCD 北大核心 2013年第1期206-217,共12页
在多核结构中,获得并行应用线程的安全、精确的最坏情况执行时间(worst case execution time,WCET)的最大挑战之一在于共享资源的竞争冲突检测.在共享Cache的多核处理器中,线程在共享Cache中的指令可能被其他并行线程的指令替换,从而导... 在多核结构中,获得并行应用线程的安全、精确的最坏情况执行时间(worst case execution time,WCET)的最大挑战之一在于共享资源的竞争冲突检测.在共享Cache的多核处理器中,线程在共享Cache中的指令可能被其他并行线程的指令替换,从而导致了线程间在共享Cache上的干扰,因此多核结构下线程WCET需要考虑并行线程间在共享Cache上的干扰.在现有的简单地址映射干扰分析基础上,考虑了指令取指执行时序因素对干扰的影响,提出了非干扰状态的充分不必要条件,根据指令的取指执行时序范畴判断线程在共享Cache上的干扰状态.通过排除非干扰状态,可以进一步精确多核结构中线程的WCET估值.理论分析证明了该方法的有效性.实验结果表明,与当前现有的考虑执行周期和基于逻辑访问先后顺序的方法相比,基于时序方法下的WCET估值分别可以提高12%和7%的精确度. 展开更多
关键词 多核体系结构 共享cache 干扰 取指执行时序 最坏情况下执行时间
下载PDF
面向多线程多道程序的加权共享Cache划分 被引量:12
3
作者 所光 杨学军 《计算机学报》 EI CSCD 北大核心 2008年第11期1938-1947,共10页
并行应用在共享Cache结构的多核处理器执行时,会因为对共享Cache的冲突访问而产生性能下降和执行时间不确定的现象.共享Cache划分技术可以把共享Cache互斥地分配给多个进程使用,是解决该问题的有效方法.由于线程间的数据共享,线程数目... 并行应用在共享Cache结构的多核处理器执行时,会因为对共享Cache的冲突访问而产生性能下降和执行时间不确定的现象.共享Cache划分技术可以把共享Cache互斥地分配给多个进程使用,是解决该问题的有效方法.由于线程间的数据共享,线程数目不同的应用对共享Cache的利用率不同,但传统的以失效率最低为目标的共享Cache划分算法(例如UCP)没有区分应用线程数目的不同.文中设计了一种面向多线程多道程序的加权共享Cache划分框架(Weighted Cache Partitioning,WCP),包括面向应用的失效率监控器和加权Cache划分算法.失效率监控器以进程为单位动态监控在不同的Cache容量下应用的失效率;而加权Cache划分算法扩展了传统的失效率最优的Cache划分算法,根据应用线程数目的不同在进行Cache划分时给应用赋予不同的权值,以使具有更多线程的应用获得更多的共享Cache,从而提高系统的整体性能.实验结果表明:加权Cache划分算法虽然失效率有所增高,但却改进了IPC吞吐率、加权加速比和公平性.在由科学和工程计算应用组成的多道程序测试用例中,WCP-1的IPC吞吐率比以失效率最低为目标函数的共享Cache划分算法最高高出10.8%,平均高出5.5%. 展开更多
关键词 多核处理器 多线程多道程序 加权共享cache划分 AMRM
下载PDF
基于共享Cache多核处理器的Hash连接优化 被引量:4
4
作者 邓亚丹 景宁 熊伟 《软件学报》 EI CSCD 北大核心 2010年第6期1220-1232,共13页
针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行... 针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行框架中的各种线程及其访问共享Cache的性能,优化了聚集连接时Hash连接算法的内存访问,并分析了多线程聚集划分的加速比.基于开源数据库INGRES和EaseDB,实现了所提出的连接多线程执行框架,在实验中测试了多线程Hash连接框架的性能.实验结果表明,该算法可以有效解决Hash连接执行时共享Cache在多线程条件下的访问冲突和处理器负载均衡问题,极大地提高了Hash连接性能. 展开更多
关键词 Hash连接 Radix-Join 多核处理器 共享cache 多线程性能分析
下载PDF
多核处理器面向低功耗的共享Cache划分方案 被引量:2
5
作者 熊伟 殷建平 +1 位作者 所光 赵志恒 《计算机工程与科学》 CSCD 北大核心 2010年第10期26-29,79,共5页
随着多核处理器的发展,片上Cache的容量随之增大,其功耗占整个芯片功耗的比率也越来越大。如何减少Cache的功耗,已成为当今Cache设计的一个热点。本文研究了面向低功耗的多核处理器共享Cache的划分技术(LP-CP)。文中提出了Cache划分框架... 随着多核处理器的发展,片上Cache的容量随之增大,其功耗占整个芯片功耗的比率也越来越大。如何减少Cache的功耗,已成为当今Cache设计的一个热点。本文研究了面向低功耗的多核处理器共享Cache的划分技术(LP-CP)。文中提出了Cache划分框架,通过在处理器中加入失效率监控器来动态地收集程序的失效率,然后使用面向低功耗的共享Cache划分算法,计算性能损耗阈值范围内的共享Cache划分策略。我们在一个共享L2 Cache的双核处理器系统中,使用多道程序测试集测试了面向低功耗的Cache划分:在性能损耗阈值为1%和3%的情况中,系统的Cache关闭率分别达到了20.8%和36.9%。 展开更多
关键词 共享cache划分 多核处理器 LOW POWER
下载PDF
基于改进LRU替换策略的共享Cache划分 被引量:2
6
作者 王涛 朱怡安 黄姝娟 《微电子学与计算机》 CSCD 北大核心 2012年第1期80-83,共4页
本文提出了一种基于改进的LRU替换策略划分最后一级共享Cache的算法,隔离了线程间的数据冲突,实现了改进的Cache替换策略,通过划分最后一级共享Cache也减少了访存延迟,提高了系统吞吐率.
关键词 多核 共享cache 划分 替换策略
下载PDF
双核处理器性能最优的共享Cache划分 被引量:4
7
作者 所光 杨学军 《微电子学与计算机》 CSCD 北大核心 2008年第9期28-30,33,共4页
文中使用模拟器模拟的方法,测试IPC-CP对多道程序的吞吐率、加权加速比和公平性的影响.实验结果表明:以IPC最优为目标的Cache划分在三个评估指标中都优于以失效率最优为目标的Cache划分.其中,IPC-CP的吞吐率最高比失效率最优的Cache划... 文中使用模拟器模拟的方法,测试IPC-CP对多道程序的吞吐率、加权加速比和公平性的影响.实验结果表明:以IPC最优为目标的Cache划分在三个评估指标中都优于以失效率最优为目标的Cache划分.其中,IPC-CP的吞吐率最高比失效率最优的Cache划分高出54%,平均高出27%. 展开更多
关键词 多核处理器 共享cache划分 IPC-CP
下载PDF
片上多核处理器共享Cache划分的公平性研究 被引量:1
8
作者 方娟 蒲江 张欣 《计算机工程与设计》 CSCD 北大核心 2010年第15期3413-3415,3517,共4页
公平性是一个关键的优化问题,当系统缺乏公平时,会出现线程饿死和优先级反转等问题。以公平性优化作为研究目标,分析当前共享Cache划分公平性的评价标准,找出了其评价参数和划分策略的不足,提出了一种新的共享Cache划分方案。通过提出... 公平性是一个关键的优化问题,当系统缺乏公平时,会出现线程饿死和优先级反转等问题。以公平性优化作为研究目标,分析当前共享Cache划分公平性的评价标准,找出了其评价参数和划分策略的不足,提出了一种新的共享Cache划分方案。通过提出一个新的多线程公平性评价指标并改进了已有的公平划分策略,从而提高多线程运行的公平性。实验结果表明,该共享Cache划分方案显著提高了系统公平性,并且系统吞吐量也有提高。 展开更多
关键词 片上多核处理器 共享cache划分 公平性 缺失 评价参数
下载PDF
一种基于频率的多核共享Cache替换算法 被引量:1
9
作者 方娟 李成艳 +1 位作者 王帅 姚治成 《电子与信息学报》 EI CSCD 北大核心 2014年第5期1229-1234,共6页
LRU替换算法在单核处理器中得到了广泛应用,而多核环境大都采用多核共享最后一级Cache(LLC)的策略,随着LLC容量和相联度的增加以及多核应用的工作集增大,LRU替换算法和理论最优替换算法之间的差距越来越大。该文提出了一种平均划分下基... LRU替换算法在单核处理器中得到了广泛应用,而多核环境大都采用多核共享最后一级Cache(LLC)的策略,随着LLC容量和相联度的增加以及多核应用的工作集增大,LRU替换算法和理论最优替换算法之间的差距越来越大。该文提出了一种平均划分下基于频率的多核共享Cache替换算法(ALRU-F)。该算法将当前所需要的部分工作集保留在Cache内,逐出无用块,同时还提出了块粒度动态划分下基于频率的替换算法(BLRU-F)。该文提出的ALRU-F算法相比传统的LRU算法缺失率降低了26.59%,CPU每一时钟周期内所执行的指令数IPC(Instruction Per Clock)则提升了13.59%。在此基础上提出的块粒度动态划分下,基于频率的BLUR-F算法相比较传统的LRU算法性能提高更大,缺失率降低了33.72%,而IPC则提升了16.59%。提出的两种算法在性能提升的同时,并没有明显地增加能耗。 展开更多
关键词 多核处理器 共享cache 划分 替换算法
下载PDF
SonD系统中虚拟存储设备共享Cache方法的设计
10
作者 尹洋 冯硕 +1 位作者 刘振军 许鲁 《计算机工程》 CAS CSCD 北大核心 2007年第13期52-55,共4页
蓝鲸服务点播系统(SonD系统)是一个基于网络存储的新型计算环境,为大规模计算环境中计算机的部署和管理提供了有效手段。SonD系统中虚拟存储设备共享cache方法,在文件一级实现了对SonD系统中虚拟存储设备间物理共享数据在内存中cache的... 蓝鲸服务点播系统(SonD系统)是一个基于网络存储的新型计算环境,为大规模计算环境中计算机的部署和管理提供了有效手段。SonD系统中虚拟存储设备共享cache方法,在文件一级实现了对SonD系统中虚拟存储设备间物理共享数据在内存中cache的共享,有效地避免了共享cache后带来的数据的一致性问题。实验数据表明,虚拟存储设备共享cache方法提高了SonD系统的整体性能。 展开更多
关键词 蓝鲸服务点播系统 共享cache 虚拟存储设备
下载PDF
多核共享cache确定性技术
11
作者 虞保忠 周霆 +1 位作者 李运喜 黄凡帆 《计算机工程与设计》 北大核心 2022年第11期3079-3084,共6页
为解决多核共享cache竞争冲突引发的确定性问题,研究多核共享cache确定性缓解技术,提出针对多核实时系统的共享cache确定性缓解方法。通过硬件和软件协同方式,以软件配置方式,利用cache硬件分区和cache软件分区方法,优化存储空间管理,... 为解决多核共享cache竞争冲突引发的确定性问题,研究多核共享cache确定性缓解技术,提出针对多核实时系统的共享cache确定性缓解方法。通过硬件和软件协同方式,以软件配置方式,利用cache硬件分区和cache软件分区方法,优化存储空间管理,避免多核访问同一cache空间,减少多核共享cache竞争。创新点在于设计平台无关的核间cache隔离,在多核实时操作系统中设计和实现,并在国产和国外多核处理器上进行测试验证。实现结果表明,经过确定性缓解后,能够达到共享cache确定性效果,提高多核并行的确定性。 展开更多
关键词 多核 共享cache 确定性 并行 实时系统 竞争冲突 分区
下载PDF
片上多核处理器末级共享Cache可重用数据预测机制 被引量:1
12
作者 韩立敏 高德远 +2 位作者 樊晓桠 史莉雯 安建峰 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第6期1505-1509,共5页
为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问... 为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问信息过滤出会被重复使用的数据,并将其保存在片上专用存储器中。仿真结果表明:本文的可重用数据预测机制将IPC(Instruction per clock)平均提高了2.9%,平均减少了应用程序中22.69%的有害替换,有效地减少了Cache抖动。 展开更多
关键词 计算机系统结构 多核处理器 冲突缺失 cache抖动 末级共享cache
下载PDF
一种基于伪LRU的新型共享Cache划分机制 被引量:3
13
作者 倪亚路 周晓方 《电子学报》 EI CAS CSCD 北大核心 2013年第4期681-684,共4页
本文提出了一种基于伪LRU方法的新型共享Cache动态划分策略PLRU-SCP.本文提出的划分策略在分析电路中给出了基于二叉树的新型分析方法,在划分电路中使用了一种非遍历的划分算法.并提出了一种新型共享Cache结构.本文提出的新型划分策略... 本文提出了一种基于伪LRU方法的新型共享Cache动态划分策略PLRU-SCP.本文提出的划分策略在分析电路中给出了基于二叉树的新型分析方法,在划分电路中使用了一种非遍历的划分算法.并提出了一种新型共享Cache结构.本文提出的新型划分策略比基于LRU方法的不划分共享Cache策略和效用最优的划分策略的性能分别提高了11.05%和8.66%. 展开更多
关键词 共享cache 伪LRU替换方法 二叉树分析 非遍历划分算法
下载PDF
面向多核处理器的共享Cache冲突预测模型
14
作者 董磊 郭锐锋 秦承刚 《小型微型计算机系统》 CSCD 北大核心 2013年第8期1930-1934,共5页
多核处理器的出现给实时系统的设计带来了新挑战,如并发任务通过共享Cache相互干扰的现象严重降低了实时系统的实时性,已有的Cache冲突评价模型没有针对多核处理器体系结构,多角度评价共享Cache对多个并发任务的影响.本文基于广泛应用的... 多核处理器的出现给实时系统的设计带来了新挑战,如并发任务通过共享Cache相互干扰的现象严重降低了实时系统的实时性,已有的Cache冲突评价模型没有针对多核处理器体系结构,多角度评价共享Cache对多个并发任务的影响.本文基于广泛应用的LRU Cache替换策略,根据任务的Cache静态复用距离,提出一种可以预测并发任务的Cache占用率、失效率和任务间冲突概率的Cache冲突预测模型.分析了在多核背景下共享Cache结构对实时性的影响.实验结果表明本模型不但功能比现有模型全面且精度更高. 展开更多
关键词 共享cache 实时操作系统 隐马尔科夫模型 任务间冲突概率
下载PDF
一种新型共享Cache动态划分机制
15
作者 倪亚路 周晓方 《计算机工程》 CAS CSCD 北大核心 2011年第22期231-233,共3页
综合效用最优划分共享Cache方法和传统LRU方法的优点,提出一种新的动态划分共享Cache方法。该方法可消除不同线程在共享Cache中的相互影响,当多核并行执行的程序均对共享Cache中占有的路数敏感时,可解决采用效用最优划分方法时的性能下... 综合效用最优划分共享Cache方法和传统LRU方法的优点,提出一种新的动态划分共享Cache方法。该方法可消除不同线程在共享Cache中的相互影响,当多核并行执行的程序均对共享Cache中占有的路数敏感时,可解决采用效用最优划分方法时的性能下降问题。经SPEC CPU2000测试表明,该方法与传统LRU和效用最优划分方法相比,系统整体性能平均分别提高20.28%和14.37%。 展开更多
关键词 共享cache 动态划分 数据污染 自由路
下载PDF
片上多处理器共享Cache的访存时间最优划分方法
16
作者 李浩 谢伦国 《通信学报》 EI CSCD 北大核心 2012年第4期136-142,共7页
提出的访存时间最优Cache划分(OMTP,optimal memory time Cache partitioning)方法通过特征获取部件来获取不同应用程序的平均失效开销和Cache命中的路分布情况,以此作为划分依据来给竞争程序分配合适的Cache空间,达到优化程序整体执行... 提出的访存时间最优Cache划分(OMTP,optimal memory time Cache partitioning)方法通过特征获取部件来获取不同应用程序的平均失效开销和Cache命中的路分布情况,以此作为划分依据来给竞争程序分配合适的Cache空间,达到优化程序整体执行性能的目的。实验结果表明,OMTP方法相比基于利用率的Cache划分(UCP)方法吞吐率平均提高3.1%,加权加速比平均提高1.3%,整体性能更优。 展开更多
关键词 片上多处理器 共享cache cache划分 访存时间最优划分
下载PDF
共享Cache分区在机载系统中的应用研究
17
作者 白鹭 海钰琳 张黎 《航空计算技术》 2022年第5期119-122,共4页
多核技术以其性能高、功耗低、通信延迟小等优点已成为机载嵌入式领域的新选择。共享Cache作为多核处理器一个重要的共享资源,严重影响着机载系统的确定性。对基于容量划分的共享Cache分区技术和基于Cache行划分的共享Cache技术进行介绍... 多核技术以其性能高、功耗低、通信延迟小等优点已成为机载嵌入式领域的新选择。共享Cache作为多核处理器一个重要的共享资源,严重影响着机载系统的确定性。对基于容量划分的共享Cache分区技术和基于Cache行划分的共享Cache技术进行介绍,以T2081多核处理器为例,对其共享Cache进行基于Cache行划分的分区设计。在应用层模拟了4个分区,每个分区分配相同数量的Cache行,通过不断调整各个分区的访存数据量,测试Cache分区和Cache共享两种模式对系统确定性的影响,并对测试结果进行对比分析。 展开更多
关键词 分区 多核处理器 共享cache 确定性
下载PDF
多核处理器共享Cache的划分算法
18
作者 吕海玉 罗广 +1 位作者 朱嘉炜 张凤登 《电子科技》 2024年第9期27-33,共7页
针对多核处理器性能优化问题,文中深入研究多核处理器上共享Cache的管理策略,提出了基于缓存时间公平性与吞吐率的共享Cache划分算法MT-FTP(Memory Time based Fair and Throughput Partitioning)。以公平性和吞吐率两个评价性指标建立... 针对多核处理器性能优化问题,文中深入研究多核处理器上共享Cache的管理策略,提出了基于缓存时间公平性与吞吐率的共享Cache划分算法MT-FTP(Memory Time based Fair and Throughput Partitioning)。以公平性和吞吐率两个评价性指标建立数学模型,并分析了算法的划分流程。仿真实验结果表明,MT-FTP算法在系统吞吐率方面表现较好,其平均IPC(Instructions Per Cycles)值比UCP(Use Case Point)算法高1.3%,比LRU(Least Recently Used)算法高11.6%。MT-FTP算法对应的系统平均公平性比LRU算法的系统平均公平性高17%,比UCP算法的平均公平性高16.5%。该算法实现了共享Cache划分公平性并兼顾了系统的吞吐率。 展开更多
关键词 片上多核处理器 内存墙 划分 公平性 吞吐率 共享cache 缓存时间 集成计算机
下载PDF
云环境中基于cache共享的虚拟机同驻检测方法 被引量:7
19
作者 余思 桂小林 +2 位作者 张学军 林建财 王君飞 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2651-2660,共10页
云计算是一种新型计算模型,按需提供外包计算和存储服务,具有资源共享、多租户服务等特性.但是,它也面临着新的安全威胁,例如侧通道攻击.通过侧通道攻击,恶意用户可以突破虚拟机隔离性,以一种隐蔽的方式获取其他用户的私密信息.现有侧... 云计算是一种新型计算模型,按需提供外包计算和存储服务,具有资源共享、多租户服务等特性.但是,它也面临着新的安全威胁,例如侧通道攻击.通过侧通道攻击,恶意用户可以突破虚拟机隔离性,以一种隐蔽的方式获取其他用户的私密信息.现有侧通道攻击方法缺乏对其他同驻虚拟机干扰的分析.然而,这种干扰在多租户云环境中是不可避免的.针对该问题,提出一种基于cache侧通道攻击的虚拟机同驻检测方法.该方法基于期望和熵分析了cache负载特征,采用基于聚类的方法提取cache负载特征,通过同驻检测策略实现虚拟机同驻检测.实验结果表明,该方法能够有效地提取cache负载特征,并以较高的成功率实现虚拟机同驻检测.同时进一步表明,侧通道攻击是云计算面临的一种重要安全挑战. 展开更多
关键词 云计算 虚拟机 侧通道攻击 同驻检测 共享cache
下载PDF
共享多端口数据Cache结构:SMPDCA 被引量:1
20
作者 黄光奇 李子木 +1 位作者 周兴铭 窦勇 《计算机学报》 EI CSCD 北大核心 2001年第12期1318-1323,共6页
随着半导体工艺技术的飞速发展 ,单芯片多处理器 (Single- Chip Multiprocessor,SCMP)结构将是一条提高处理器性能的有效途径 .该文在分析 SCMP结构的特点的基础上 ,提出了 SCMP的一种结构实现 :共享多端口数据 Cache结构 (Shared Multi... 随着半导体工艺技术的飞速发展 ,单芯片多处理器 (Single- Chip Multiprocessor,SCMP)结构将是一条提高处理器性能的有效途径 .该文在分析 SCMP结构的特点的基础上 ,提出了 SCMP的一种结构实现 :共享多端口数据 Cache结构 (Shared Multi- Ported Data Cache Architecture,SMPDCA) .SMPDCA结构具有三个突出的优点 :最小的通信延迟、没有 Cache一致性维护开销和数据 Cache命中率提高 .模拟结果表明 ,与数据 Cache私有的结构相比 ,SMPDCA结构的突出优点使得应用程序的性能得到了明显的提高 ,特别是对于改善处理器之间的通信与交互比较多的应用程序的性能具有最为明显的效果 . 展开更多
关键词 共享多端口数据cache 执行时间 SMPDCA 单芯片多处理器
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部