期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
重用感知的非一致缓存迁移策略研究
被引量:
1
1
作者
汪玲
黄炎
袁光辉
《计算机工程》
CAS
CSCD
2014年第2期81-85,共5页
随着工艺的持续进步,多核处理器集成了越来越多的核以及片上缓存系统,因此利用非一致缓存架构(NUCA)应对片上多核处理器的缓存系统中逐渐增大的线延迟。高效的缓存块迁移策略对整个缓存系统至关重要。当前动态非一致缓存架构(D-NUCA)中...
随着工艺的持续进步,多核处理器集成了越来越多的核以及片上缓存系统,因此利用非一致缓存架构(NUCA)应对片上多核处理器的缓存系统中逐渐增大的线延迟。高效的缓存块迁移策略对整个缓存系统至关重要。当前动态非一致缓存架构(D-NUCA)中的缓存块迁移策略未考虑缓存块的历史访问信息,导致缓存块在不同的bank之间抖动从而增加缓存块的访问延迟。为此,提出一种重用感知的缓存块迁移(RABM)策略,采用缓存块的历史迁移信息来预测将来的缓存块迁移,从而提升D-NUCA的性能以及降低整个缓存系统的功耗。基于PARSEC基准测试程序的全系统仿真结果显示,与D-NUCA相比,基于RABM的D-NUCA可以使每时钟周期指令数平均提高9.6%,片上缓存系统功耗降低14%。
展开更多
关键词
非一致缓存
块迁移
块查找
重用感知
多核处理器
片上网络
下载PDF
职称材料
面向非一致Cache的智能多跳提升技术
被引量:
4
2
作者
吴俊杰
潘晓辉
杨学军
《计算机学报》
EI
CSCD
北大核心
2009年第10期1887-1895,共9页
非一致Cache体系结构(Non-Uniform Cache Architecture,NUCA)几乎已经成为未来片上大容量Cache的设计趋势.非一致Cache中,数据提升技术通过将经常访问的数据放置在距离处理器较近的Cache bank中减少处理器对该数据访问的等待时间,对NUC...
非一致Cache体系结构(Non-Uniform Cache Architecture,NUCA)几乎已经成为未来片上大容量Cache的设计趋势.非一致Cache中,数据提升技术通过将经常访问的数据放置在距离处理器较近的Cache bank中减少处理器对该数据访问的等待时间,对NUCA的性能有着重要影响.然而,目前已有的数据提升技术使用固定的提升策略,没有考虑所要提升到目标bank的实际状态,容易将目标bank中更有用的数据"挤"得远离处理器,从而产生Cache污染问题,严重制约了提升技术的性能发挥.针对这一问题,文中提出智能多跳提升技术.智能多跳提升技术能够感知候选目标bank的状态,为被提升的数据动态地选择合适的目标bank,从而提高了提升效率,减少了Cache污染.同时,智能多跳提升技术的设计巧妙地利用了处理器访问的反向路径,只是简单地扩充了处理器访问报文的格式,并没有增加对Cachebank的额外访问.最后使用全系统模拟器对来自NAS Parallel Benchmark和Livermore Benchmark的15个基准测试程序进行了详细测试,智能多跳提升技术单位提升操作节省的时钟周期数是已有提升技术的1.50倍,最多达到2.61倍;系统的IPC性能平均提高了6.24%,最高达到19.03%.
展开更多
关键词
高速
缓存
非
一致
高速
缓存
提升
数据迁移
智能
下载PDF
职称材料
面向非一致Cache的任意步长预提升技术
被引量:
4
3
作者
吴俊杰
杨学军
《计算机科学与探索》
CSCD
2010年第7期577-588,共12页
随着微电子工艺的不断进步,片上大容量非一致cache的研究受到广泛关注。提出了一种面向非一致cache的任意步长预提升技术,它能够优化非一致cache中的数据组织,使得即将访问的数据被放置在距离处理器较近的cachebank中,从而降低访存延迟...
随着微电子工艺的不断进步,片上大容量非一致cache的研究受到广泛关注。提出了一种面向非一致cache的任意步长预提升技术,它能够优化非一致cache中的数据组织,使得即将访问的数据被放置在距离处理器较近的cachebank中,从而降低访存延迟,提升系统性能。详细介绍了任意步长预提升技术的设计,比较了预提升技术与预取技术的差别,并提出了二者的结合技术。通过对来自NPB和SPEC2000的11个基准测试程序在全系统模拟器上的实验评测,发现任意步长预提升技术能够有效减小访存延迟,在访存预测表尺寸为16和32的情况下,系统IPC分别平均增长4.17%和4.91%;在结合预提升和预取技术的情况下,系统IPC分别平均增长8.84%和11.06%。
展开更多
关键词
预提升技术
非
一致
高速
缓存
结构
任意步长
访存模式
预取技术
下载PDF
职称材料
面向多核NUCA共享数据竞争问题的Bank一致性技术
4
作者
吴俊杰
潘晓辉
《计算机工程与科学》
CSCD
北大核心
2009年第11期21-24,49,共5页
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量cache的发展方向。多核处理器的NUCA结构中,多个处理器核对共享数据的竞争访问,可能导致数据经常处于中部的cache Bank,增加NUCA的访问延迟。本文提出支持数据副本的Bank一致性技术...
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量cache的发展方向。多核处理器的NUCA结构中,多个处理器核对共享数据的竞争访问,可能导致数据经常处于中部的cache Bank,增加NUCA的访问延迟。本文提出支持数据副本的Bank一致性技术,通过有选择地在NUCA中为访问的处理器核创建不同的数据副本,Bank一致性技术能够缓解多核处理器对共享数据的竞争问题。本文详细地介绍了Bank一致性协议的设计方法。最后,使用全系统模拟器对8个NPB基准测试程序进行了详细评测。实验结果表明,Bank一致性技术能够有效缓解多核处理器中共享数据的竞争访问问题。相比不支持Bank一致性技术的CMP-DNUCA结构,本文的方法能将系统IPC性能平均提升5.95%。
展开更多
关键词
非
一致
高速
缓存
数据竞争
多核
存储体
一致
性
高速
缓存
一致
性
下载PDF
职称材料
片上多核处理器Cache访问均衡性研究
被引量:
3
5
作者
王子聪
陈小文
郭阳
《计算机学报》
EI
CSCD
北大核心
2019年第11期2403-2416,共14页
随着片上多核处理器(CMP)规模的不断扩大和处理核数的增多,系统对于片上缓存(Cache)在容量和速度方面有了更高的需求.为了能够有效利用Cache资源,非一致Cache体系结构(NUCA)被提出用于支持高容量低延迟的Cache组织结构.另一方面,片上网...
随着片上多核处理器(CMP)规模的不断扩大和处理核数的增多,系统对于片上缓存(Cache)在容量和速度方面有了更高的需求.为了能够有效利用Cache资源,非一致Cache体系结构(NUCA)被提出用于支持高容量低延迟的Cache组织结构.另一方面,片上网络(NoC)由于具备良好的可扩展性,在片上多核处理器的互连方式上具有显著优势.因此,基于片上网络的非一致Cache体系结构逐渐成为未来组织大容量Cache的主流系统架构.在这样的系统架构中,最后一级缓存(LLC)通常在物理上分布于每个处理节点,这些Cache存储体(Bank)在逻辑上共同构成一个统一的共享Cache.当处理核发出Cache访问请求时,其访问时间与请求处理核节点与访问数据所在的Bank节点的距离有关.当距离较近时,访问时间较短;当访问距离较远的Bank时,访问时间较长.因此,当系统规模逐渐增大时,这种访问延迟与网络距离相关的特性会使得不同节点之间的通信距离和通信延迟的差异性逐渐增大.另外,片上网络规模的增大也会使得Cache访问延迟逐渐由网络延迟主导.这种延迟差异性会引起网络报文延迟不均衡问题,导致Cache访问延迟的非一致性进一步增大,因而出现更多的大延迟Cache访问并成为制约系统性能的瓶颈.因此,研究片上多核处理器的Cache访问均衡性对于提升网络性能和系统性能具有积极意义.该文分析了造成Cache访问延迟不均衡的原因,并针对延迟的两个来源:无冲突延迟和竞争延迟,分别提出了非一致存储映射和非一致链路分布的设计方法.通过非一致存储映射,我们根据Cache存储体在网络中的物理位置调节其相应的Cache块映射比例,从而均衡Cache请求平均访问距离;通过合理设计非一致的链路分布,我们依据各条链路上的流量负载为其分配合适的通道数量,从而缓解流量压力较大的链路上的报文竞争.全系统模拟器上的实验表明,采用面向Cache访问均衡性的片上多核处理器能够有效均衡Cache访问延迟,并减少大延迟Cache访问请求的数量.相比于传统的NUCA结构,我们的设计在最大的实验规模(64核)下在延迟均方差、最大延迟和平均延迟上分别平均降低了19.6%、12.8%和6.4%,最大降低了40.8%、29.9%和11.9%.同时在系统性能方面,通过PARSEC应用程序的模拟实验表明,单位周期执行指令数(IPC)平均提升了6.7%,最大提升了14.0%.
展开更多
关键词
片上多核处理器
非一致缓存
体系结构
片上网络
均衡性
缓存
访问
下载PDF
职称材料
基于紧耦合单跳步多平面架构的高端服务器设计
被引量:
6
6
作者
王恩东
陈继承
+1 位作者
胡雷钧
公维峰
《高技术通讯》
CAS
CSCD
北大核心
2014年第2期111-116,共6页
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理...
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。
展开更多
关键词
缓存
一致
性
非
均匀存储访问(CC-NUMA)
紧耦合单跳步多平面(TSMP)
QPI协议
CACHE
一致
性
目录cache
下载PDF
职称材料
题名
重用感知的非一致缓存迁移策略研究
被引量:
1
1
作者
汪玲
黄炎
袁光辉
机构
安徽大学江淮学院计算机科学与电子技术系
出处
《计算机工程》
CAS
CSCD
2014年第2期81-85,共5页
基金
安徽省高校省级自然科学研究基金资助项目(KJ2013B012)
安徽大学江淮学院科研基金资助项目(2011KJ0001)
文摘
随着工艺的持续进步,多核处理器集成了越来越多的核以及片上缓存系统,因此利用非一致缓存架构(NUCA)应对片上多核处理器的缓存系统中逐渐增大的线延迟。高效的缓存块迁移策略对整个缓存系统至关重要。当前动态非一致缓存架构(D-NUCA)中的缓存块迁移策略未考虑缓存块的历史访问信息,导致缓存块在不同的bank之间抖动从而增加缓存块的访问延迟。为此,提出一种重用感知的缓存块迁移(RABM)策略,采用缓存块的历史迁移信息来预测将来的缓存块迁移,从而提升D-NUCA的性能以及降低整个缓存系统的功耗。基于PARSEC基准测试程序的全系统仿真结果显示,与D-NUCA相比,基于RABM的D-NUCA可以使每时钟周期指令数平均提高9.6%,片上缓存系统功耗降低14%。
关键词
非一致缓存
块迁移
块查找
重用感知
多核处理器
片上网络
Keywords
non-uniform cache
block migration
block lookup
reuse-aware
multi-core processor
Network on Chip(NoC)
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向非一致Cache的智能多跳提升技术
被引量:
4
2
作者
吴俊杰
潘晓辉
杨学军
机构
国防科学技术大学计算机学院并行与分布处理国家重点实验室
出处
《计算机学报》
EI
CSCD
北大核心
2009年第10期1887-1895,共9页
基金
国家自然科学基金(60621003
60873014
+1 种基金
60633050)
国家"八六三"高技术研究发展计划项目基金(2007AA01Z102)资助
文摘
非一致Cache体系结构(Non-Uniform Cache Architecture,NUCA)几乎已经成为未来片上大容量Cache的设计趋势.非一致Cache中,数据提升技术通过将经常访问的数据放置在距离处理器较近的Cache bank中减少处理器对该数据访问的等待时间,对NUCA的性能有着重要影响.然而,目前已有的数据提升技术使用固定的提升策略,没有考虑所要提升到目标bank的实际状态,容易将目标bank中更有用的数据"挤"得远离处理器,从而产生Cache污染问题,严重制约了提升技术的性能发挥.针对这一问题,文中提出智能多跳提升技术.智能多跳提升技术能够感知候选目标bank的状态,为被提升的数据动态地选择合适的目标bank,从而提高了提升效率,减少了Cache污染.同时,智能多跳提升技术的设计巧妙地利用了处理器访问的反向路径,只是简单地扩充了处理器访问报文的格式,并没有增加对Cachebank的额外访问.最后使用全系统模拟器对来自NAS Parallel Benchmark和Livermore Benchmark的15个基准测试程序进行了详细测试,智能多跳提升技术单位提升操作节省的时钟周期数是已有提升技术的1.50倍,最多达到2.61倍;系统的IPC性能平均提高了6.24%,最高达到19.03%.
关键词
高速
缓存
非
一致
高速
缓存
提升
数据迁移
智能
Keywords
Cache
NUCA
promotion
data migration
smart
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向非一致Cache的任意步长预提升技术
被引量:
4
3
作者
吴俊杰
杨学军
机构
国防科学技术大学计算机学院并行与分布处理国家重点实验室
出处
《计算机科学与探索》
CSCD
2010年第7期577-588,共12页
基金
国家自然科学基金No.60921062
60873014~~
文摘
随着微电子工艺的不断进步,片上大容量非一致cache的研究受到广泛关注。提出了一种面向非一致cache的任意步长预提升技术,它能够优化非一致cache中的数据组织,使得即将访问的数据被放置在距离处理器较近的cachebank中,从而降低访存延迟,提升系统性能。详细介绍了任意步长预提升技术的设计,比较了预提升技术与预取技术的差别,并提出了二者的结合技术。通过对来自NPB和SPEC2000的11个基准测试程序在全系统模拟器上的实验评测,发现任意步长预提升技术能够有效减小访存延迟,在访存预测表尺寸为16和32的情况下,系统IPC分别平均增长4.17%和4.91%;在结合预提升和预取技术的情况下,系统IPC分别平均增长8.84%和11.06%。
关键词
预提升技术
非
一致
高速
缓存
结构
任意步长
访存模式
预取技术
Keywords
pre-promotion
non-uniform cache architecture
arbitrary stride
access pattern
pre-fetching
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向多核NUCA共享数据竞争问题的Bank一致性技术
4
作者
吴俊杰
潘晓辉
机构
并行与分布处理国家重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2009年第11期21-24,49,共5页
基金
国家自然科学基金资助项目(60621003
60873014
60633050)
文摘
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量cache的发展方向。多核处理器的NUCA结构中,多个处理器核对共享数据的竞争访问,可能导致数据经常处于中部的cache Bank,增加NUCA的访问延迟。本文提出支持数据副本的Bank一致性技术,通过有选择地在NUCA中为访问的处理器核创建不同的数据副本,Bank一致性技术能够缓解多核处理器对共享数据的竞争问题。本文详细地介绍了Bank一致性协议的设计方法。最后,使用全系统模拟器对8个NPB基准测试程序进行了详细评测。实验结果表明,Bank一致性技术能够有效缓解多核处理器中共享数据的竞争访问问题。相比不支持Bank一致性技术的CMP-DNUCA结构,本文的方法能将系统IPC性能平均提升5.95%。
关键词
非
一致
高速
缓存
数据竞争
多核
存储体
一致
性
高速
缓存
一致
性
Keywords
NUCA
data competition
multi-core
bank coherence
cache coherence
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
片上多核处理器Cache访问均衡性研究
被引量:
3
5
作者
王子聪
陈小文
郭阳
机构
国防科技大学计算机学院
出处
《计算机学报》
EI
CSCD
北大核心
2019年第11期2403-2416,共14页
基金
国家自然科学基金(61502508,61572025)
湖南省自然科学基金(2015JJ3017)资助~~
文摘
随着片上多核处理器(CMP)规模的不断扩大和处理核数的增多,系统对于片上缓存(Cache)在容量和速度方面有了更高的需求.为了能够有效利用Cache资源,非一致Cache体系结构(NUCA)被提出用于支持高容量低延迟的Cache组织结构.另一方面,片上网络(NoC)由于具备良好的可扩展性,在片上多核处理器的互连方式上具有显著优势.因此,基于片上网络的非一致Cache体系结构逐渐成为未来组织大容量Cache的主流系统架构.在这样的系统架构中,最后一级缓存(LLC)通常在物理上分布于每个处理节点,这些Cache存储体(Bank)在逻辑上共同构成一个统一的共享Cache.当处理核发出Cache访问请求时,其访问时间与请求处理核节点与访问数据所在的Bank节点的距离有关.当距离较近时,访问时间较短;当访问距离较远的Bank时,访问时间较长.因此,当系统规模逐渐增大时,这种访问延迟与网络距离相关的特性会使得不同节点之间的通信距离和通信延迟的差异性逐渐增大.另外,片上网络规模的增大也会使得Cache访问延迟逐渐由网络延迟主导.这种延迟差异性会引起网络报文延迟不均衡问题,导致Cache访问延迟的非一致性进一步增大,因而出现更多的大延迟Cache访问并成为制约系统性能的瓶颈.因此,研究片上多核处理器的Cache访问均衡性对于提升网络性能和系统性能具有积极意义.该文分析了造成Cache访问延迟不均衡的原因,并针对延迟的两个来源:无冲突延迟和竞争延迟,分别提出了非一致存储映射和非一致链路分布的设计方法.通过非一致存储映射,我们根据Cache存储体在网络中的物理位置调节其相应的Cache块映射比例,从而均衡Cache请求平均访问距离;通过合理设计非一致的链路分布,我们依据各条链路上的流量负载为其分配合适的通道数量,从而缓解流量压力较大的链路上的报文竞争.全系统模拟器上的实验表明,采用面向Cache访问均衡性的片上多核处理器能够有效均衡Cache访问延迟,并减少大延迟Cache访问请求的数量.相比于传统的NUCA结构,我们的设计在最大的实验规模(64核)下在延迟均方差、最大延迟和平均延迟上分别平均降低了19.6%、12.8%和6.4%,最大降低了40.8%、29.9%和11.9%.同时在系统性能方面,通过PARSEC应用程序的模拟实验表明,单位周期执行指令数(IPC)平均提升了6.7%,最大提升了14.0%.
关键词
片上多核处理器
非一致缓存
体系结构
片上网络
均衡性
缓存
访问
Keywords
chip multi-processor
non-uniform cache architecture
networks-on-chip
equalization
cache access
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于紧耦合单跳步多平面架构的高端服务器设计
被引量:
6
6
作者
王恩东
陈继承
胡雷钧
公维峰
机构
浪潮集团有限公司
高效能服务器和存储技术国家重点实验室
出处
《高技术通讯》
CAS
CSCD
北大核心
2014年第2期111-116,共6页
基金
863计划(2008AA01A202)
973计划(2010CB735905)资助项目
文摘
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。
关键词
缓存
一致
性
非
均匀存储访问(CC-NUMA)
紧耦合单跳步多平面(TSMP)
QPI协议
CACHE
一致
性
目录cache
Keywords
cache coherence non-uniform memory access( CC-NUMA), tightly-coupled single-hop multi-plane(TSMP), QPI, cache coherence, cache directory
分类号
TP393.05 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
重用感知的非一致缓存迁移策略研究
汪玲
黄炎
袁光辉
《计算机工程》
CAS
CSCD
2014
1
下载PDF
职称材料
2
面向非一致Cache的智能多跳提升技术
吴俊杰
潘晓辉
杨学军
《计算机学报》
EI
CSCD
北大核心
2009
4
下载PDF
职称材料
3
面向非一致Cache的任意步长预提升技术
吴俊杰
杨学军
《计算机科学与探索》
CSCD
2010
4
下载PDF
职称材料
4
面向多核NUCA共享数据竞争问题的Bank一致性技术
吴俊杰
潘晓辉
《计算机工程与科学》
CSCD
北大核心
2009
0
下载PDF
职称材料
5
片上多核处理器Cache访问均衡性研究
王子聪
陈小文
郭阳
《计算机学报》
EI
CSCD
北大核心
2019
3
下载PDF
职称材料
6
基于紧耦合单跳步多平面架构的高端服务器设计
王恩东
陈继承
胡雷钧
公维峰
《高技术通讯》
CAS
CSCD
北大核心
2014
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部