期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多核处理器非一致Cache体系结构延迟优化技术研究综述
被引量:
4
1
作者
黄安文
高军
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2012年第S1期118-124,共7页
非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache...
非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache环境下共享/私有机制中的延迟-容量权衡问题,讨论映射、迁移、复制和搜索等数据管理机制在多核环境下的优缺点.最后,针对基于片上网络(network-on-chip,NoC)互连结构的可扩展CMP体系结构,从NUCA模型优化、数据管理和一致性维护机制3个方面讨论和预测未来CMP NUCA延迟优化领域的发展趋势及面临的挑战性问题.
展开更多
关键词
非一致cache
体系结构
多核处理器
片上网络
存储墙
延迟优化
下载PDF
职称材料
非一致Cache体系结构技术综述
被引量:
1
2
作者
吴俊杰
杨学军
《计算机工程与科学》
CSCD
北大核心
2011年第2期51-60,共10页
存储墙问题使得Cache技术的研究始终非常重要。面对日益增长的片上Cache容量,线延迟逐渐成为制约Cache设计的重要因素。为了提供统一的访问延迟,传统的Cache设计方法不得不迁就离处理器最远的Cache Bank的访问时间。为此,研究人员提出...
存储墙问题使得Cache技术的研究始终非常重要。面对日益增长的片上Cache容量,线延迟逐渐成为制约Cache设计的重要因素。为了提供统一的访问延迟,传统的Cache设计方法不得不迁就离处理器最远的Cache Bank的访问时间。为此,研究人员提出了一种非一致Cache结构(NUCA),NUCA几乎成为未来处理器中大容量Cache设计的一种趋势。处理器访问NUCA时,如果在离处理器较近的Bank中发生命中,处理器的等待时间就较短;如果在离处理器较远的Bank中发生命中,处理器的等待时间就较长。本文综述了NUCA技术产生的原因、发展,以及当前最典型的NUCA系统;并且指出了对NUCA技术研究有借鉴的两种多机存储系统技术——NUMA和COMA;最后,提出了NUCA技术研究的关键问题,并给出了相应的解决思路。
展开更多
关键词
非一致cache
线延迟
局部性
多核
非
一致
存储访问
全
cache
存储结构
下载PDF
职称材料
片上非一致Cache体系结构研究
被引量:
1
3
作者
贾小敏
黄彩霞
+2 位作者
张民选
孙彩霞
齐树波
《计算机工程与科学》
CSCD
北大核心
2009年第8期93-98,共6页
随着集成电路制造工艺的发展,片上集成大容量Cache成为微处理器的发展趋势。然而,互连线延迟所占比例越来越大,成为大容量Cache的性能瓶颈,因此需要新的Cache体系结构来克服这些问题。非一致Cache体系结构通过在Cache内部支持多级延迟...
随着集成电路制造工艺的发展,片上集成大容量Cache成为微处理器的发展趋势。然而,互连线延迟所占比例越来越大,成为大容量Cache的性能瓶颈,因此需要新的Cache体系结构来克服这些问题。非一致Cache体系结构通过在Cache内部支持多级延迟和数据块迁移来减少Cache的命中时间,提高性能,从而克服互连线延迟对大容量Cache的限制,已经成为微处理器片上存储结构的研究热点。本文回顾了非一致Cache体系结构模型的研究进展,特别是对片上多核处理器中的非一致Cache体系结构模型进行了详细介绍,比较了不同模型的贡献和不足。最后,对非一致Cache体系结构的发展进行了展望。
展开更多
关键词
非一致cache
结构
多级延迟
块迁移
片上多核
下载PDF
职称材料
片上多核Cache资源管理机制研究
被引量:
6
4
作者
贾小敏
张民选
+1 位作者
齐树波
赵天磊
《计算机科学》
CSCD
北大核心
2011年第1期295-301,共7页
随着片上多核成为处理器发展的主流和片上Cache资源的持续增长,Cache资源的管理已成为片上多核的关键问题。介绍了片上多核Cache资源管理的研究进展,依据研究内容将Cache资源的管理分为Cache划分和Cache共享两类。对Cache划分,探讨了其...
随着片上多核成为处理器发展的主流和片上Cache资源的持续增长,Cache资源的管理已成为片上多核的关键问题。介绍了片上多核Cache资源管理的研究进展,依据研究内容将Cache资源的管理分为Cache划分和Cache共享两类。对Cache划分,探讨了其主要组成部分和一般形式,分析和比较了典型的片上多核Cache划分机制。对Cache共享,给出了其主要研究内容,并介绍和比较了几种主流的片上多核Cache共享机制。通过分析,认为软硬件协同管理的页划分应是未来片上多核Cache划分机制的研究重点;而片上多核Cache共享机制的研究则应从目标应用的Cache行为特征着手。
展开更多
关键词
片上多核
cache
资源管理
cache
划分
cache
共享
非一致cache
下载PDF
职称材料
多核处理器片上存储系统研究
被引量:
5
5
作者
黄安文
高军
张民选
《计算机工程》
CAS
CSCD
北大核心
2010年第4期4-6,共3页
针对多核处理器计算能力和访存速度间差异不断增大对多核系统性能提升的制约问题,分析几款典型多核处理器存储系统的设计特点,探讨多核处理器片上存储系统发展的关键技术,包括延迟造成的非一致cache访问、核与cache互连形式对访存性能...
针对多核处理器计算能力和访存速度间差异不断增大对多核系统性能提升的制约问题,分析几款典型多核处理器存储系统的设计特点,探讨多核处理器片上存储系统发展的关键技术,包括延迟造成的非一致cache访问、核与cache互连形式对访存性能的束缚以及片上cache设计的复杂化等。
展开更多
关键词
多核
存储系统
非一致cache
访问
下载PDF
职称材料
面向虚拟共享域划分的自适应迁移与复制机制
6
作者
黄安文
石文强
+1 位作者
高军
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2013年第8期1583-1591,共9页
传统数据管理机制无法感知分布式cache布局的非一致访问延迟特性,导致多核处理器大容量cache失效率和命中延迟之间的矛盾日益加剧.此外,单独依靠数据迁移和盲目复制难以解决共享数据块的竞争访问与长延迟命中问题.基于瓦片式多核处理器...
传统数据管理机制无法感知分布式cache布局的非一致访问延迟特性,导致多核处理器大容量cache失效率和命中延迟之间的矛盾日益加剧.此外,单独依靠数据迁移和盲目复制难以解决共享数据块的竞争访问与长延迟命中问题.基于瓦片式多核处理器分布式cache的虚拟共享域划分机制,提出并实现一种域间数据自适应迁移与复制机制,能够协同感知本地目标bank候选牺牲块状态和远程命中块的局部活跃程度,在多个虚拟共享域间对多核竞争访问的共享数据进行动态迁移和复制决策,综合权衡片上长延迟命中和cache容量有效利用率问题,降低平均存储访问延迟.最后,在全系统模拟器中实现虚拟共享域划分和域间共享数据自适应迁移-复制机制,并采用典型测试程序包SPLASH-2评估性能优化情况.实验表明,与传统固定共享域划分机制和同类优化机制相比,自适应迁移与复制机制在不同共享度下均可获得相应性能提升,面积开销可以忽略不计.
展开更多
关键词
非一致cache
体系结构
多核处理器
延迟优化
迁移
复制
下载PDF
职称材料
基于NUCA结构的同构单芯片多处理器
被引量:
1
7
作者
陈宏铭
林昶志
陈麒安
《中国集成电路》
2011年第11期32-38,54,共8页
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量Cache的发展方向。本文指出同构单芯片多处理器的设计主要有多级Cache设计的数据一致性问题,核间通信问题与外部总线效率问题,我们也说明多处理器设计上的相应解决办法。最后给出...
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量Cache的发展方向。本文指出同构单芯片多处理器的设计主要有多级Cache设计的数据一致性问题,核间通信问题与外部总线效率问题,我们也说明多处理器设计上的相应解决办法。最后给出单核与双核在性能、功耗的比较,以及双核处理器的布局规划图。利用双核处理器,二级Cache控制器与AXI总线控制器等IP提出一个可供设计AXI总线SoC的非一致Cache体系结构平台。
展开更多
关键词
非一致cache
体系结构
同构单芯片多处理器
FMP626
缓存
AXI
SOC
下载PDF
职称材料
CC-NUMA结构下共享变量并行计算的研究
8
作者
李岱峰
许忆南
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期89-90,113,共3页
探讨了如何提高CC-NUMA结构下共享变量程序的并行效率。主要介绍了几种有效的负载均衡策略和减少共享存储访问延迟的优化 手段。通过分析可以看出,通过合适的优化方法,CC-NUMA结构下共享变量的应用程序可以取得好的并行效率。
关键词
cache
一致
性
非
均匀存储器访问
负载均衡
任务粒度
访问延迟
下载PDF
职称材料
题名
多核处理器非一致Cache体系结构延迟优化技术研究综述
被引量:
4
1
作者
黄安文
高军
张民选
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第S1期118-124,共7页
基金
国家自然科学基金项目(60970036)
文摘
非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache环境下共享/私有机制中的延迟-容量权衡问题,讨论映射、迁移、复制和搜索等数据管理机制在多核环境下的优缺点.最后,针对基于片上网络(network-on-chip,NoC)互连结构的可扩展CMP体系结构,从NUCA模型优化、数据管理和一致性维护机制3个方面讨论和预测未来CMP NUCA延迟优化领域的发展趋势及面临的挑战性问题.
关键词
非一致cache
体系结构
多核处理器
片上网络
存储墙
延迟优化
Keywords
non-uniform
cache
architecture
chip multi-processors
network-on-chip
memory wall
latency optimization
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
非一致Cache体系结构技术综述
被引量:
1
2
作者
吴俊杰
杨学军
机构
并行与分布处理国防科技重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2011年第2期51-60,共10页
基金
国家自然科学基金资助项目(60621003
60873014
60633050)
文摘
存储墙问题使得Cache技术的研究始终非常重要。面对日益增长的片上Cache容量,线延迟逐渐成为制约Cache设计的重要因素。为了提供统一的访问延迟,传统的Cache设计方法不得不迁就离处理器最远的Cache Bank的访问时间。为此,研究人员提出了一种非一致Cache结构(NUCA),NUCA几乎成为未来处理器中大容量Cache设计的一种趋势。处理器访问NUCA时,如果在离处理器较近的Bank中发生命中,处理器的等待时间就较短;如果在离处理器较远的Bank中发生命中,处理器的等待时间就较长。本文综述了NUCA技术产生的原因、发展,以及当前最典型的NUCA系统;并且指出了对NUCA技术研究有借鉴的两种多机存储系统技术——NUMA和COMA;最后,提出了NUCA技术研究的关键问题,并给出了相应的解决思路。
关键词
非一致cache
线延迟
局部性
多核
非
一致
存储访问
全
cache
存储结构
Keywords
NUCA
wire delay
locality
multicore
NUMA
COMA
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
片上非一致Cache体系结构研究
被引量:
1
3
作者
贾小敏
黄彩霞
张民选
孙彩霞
齐树波
机构
并行与分布处理国家重点实验室
长沙学院计算机科学与技术系
出处
《计算机工程与科学》
CSCD
北大核心
2009年第8期93-98,共6页
文摘
随着集成电路制造工艺的发展,片上集成大容量Cache成为微处理器的发展趋势。然而,互连线延迟所占比例越来越大,成为大容量Cache的性能瓶颈,因此需要新的Cache体系结构来克服这些问题。非一致Cache体系结构通过在Cache内部支持多级延迟和数据块迁移来减少Cache的命中时间,提高性能,从而克服互连线延迟对大容量Cache的限制,已经成为微处理器片上存储结构的研究热点。本文回顾了非一致Cache体系结构模型的研究进展,特别是对片上多核处理器中的非一致Cache体系结构模型进行了详细介绍,比较了不同模型的贡献和不足。最后,对非一致Cache体系结构的发展进行了展望。
关键词
非一致cache
结构
多级延迟
块迁移
片上多核
Keywords
NUCA
multiple access latencies
block migration
on-chip multi-processors
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
片上多核Cache资源管理机制研究
被引量:
6
4
作者
贾小敏
张民选
齐树波
赵天磊
机构
国防科技大学计算机学院
出处
《计算机科学》
CSCD
北大核心
2011年第1期295-301,共7页
基金
国家863高技术研究发展计划(No.2009AA01Z124)
国家自然科学基金(No.60970036)和国家自然科学基金(No.60873016)资助
文摘
随着片上多核成为处理器发展的主流和片上Cache资源的持续增长,Cache资源的管理已成为片上多核的关键问题。介绍了片上多核Cache资源管理的研究进展,依据研究内容将Cache资源的管理分为Cache划分和Cache共享两类。对Cache划分,探讨了其主要组成部分和一般形式,分析和比较了典型的片上多核Cache划分机制。对Cache共享,给出了其主要研究内容,并介绍和比较了几种主流的片上多核Cache共享机制。通过分析,认为软硬件协同管理的页划分应是未来片上多核Cache划分机制的研究重点;而片上多核Cache共享机制的研究则应从目标应用的Cache行为特征着手。
关键词
片上多核
cache
资源管理
cache
划分
cache
共享
非一致cache
Keywords
Chip multi-processors
cache
resource management
cache
partitioning
cache
sharing
Non-uniform
cache
architecture
分类号
TP368 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
多核处理器片上存储系统研究
被引量:
5
5
作者
黄安文
高军
张民选
机构
国防科技大学计算机学院并行与分布处理国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第4期4-6,共3页
基金
国家自然科学基金资助项目(60873016)
国家"863"计划基金资助项目(2008AA01Z147
2007AA01Z102)
文摘
针对多核处理器计算能力和访存速度间差异不断增大对多核系统性能提升的制约问题,分析几款典型多核处理器存储系统的设计特点,探讨多核处理器片上存储系统发展的关键技术,包括延迟造成的非一致cache访问、核与cache互连形式对访存性能的束缚以及片上cache设计的复杂化等。
关键词
多核
存储系统
非一致cache
访问
Keywords
multi-core
memory system
Non-Uniform
cache
Access(NUCA)
分类号
TP333 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向虚拟共享域划分的自适应迁移与复制机制
6
作者
黄安文
石文强
高军
张民选
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第8期1583-1591,共9页
基金
国家自然科学基金项目(60970036)
文摘
传统数据管理机制无法感知分布式cache布局的非一致访问延迟特性,导致多核处理器大容量cache失效率和命中延迟之间的矛盾日益加剧.此外,单独依靠数据迁移和盲目复制难以解决共享数据块的竞争访问与长延迟命中问题.基于瓦片式多核处理器分布式cache的虚拟共享域划分机制,提出并实现一种域间数据自适应迁移与复制机制,能够协同感知本地目标bank候选牺牲块状态和远程命中块的局部活跃程度,在多个虚拟共享域间对多核竞争访问的共享数据进行动态迁移和复制决策,综合权衡片上长延迟命中和cache容量有效利用率问题,降低平均存储访问延迟.最后,在全系统模拟器中实现虚拟共享域划分和域间共享数据自适应迁移-复制机制,并采用典型测试程序包SPLASH-2评估性能优化情况.实验表明,与传统固定共享域划分机制和同类优化机制相比,自适应迁移与复制机制在不同共享度下均可获得相应性能提升,面积开销可以忽略不计.
关键词
非一致cache
体系结构
多核处理器
延迟优化
迁移
复制
Keywords
non-uniform
cache
architecture
chip multi-processor
latency reduction
migration
replication
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于NUCA结构的同构单芯片多处理器
被引量:
1
7
作者
陈宏铭
林昶志
陈麒安
机构
智原科技
出处
《中国集成电路》
2011年第11期32-38,54,共8页
文摘
非一致Cache体系结构(NUCA)几乎已经成为未来片上大容量Cache的发展方向。本文指出同构单芯片多处理器的设计主要有多级Cache设计的数据一致性问题,核间通信问题与外部总线效率问题,我们也说明多处理器设计上的相应解决办法。最后给出单核与双核在性能、功耗的比较,以及双核处理器的布局规划图。利用双核处理器,二级Cache控制器与AXI总线控制器等IP提出一个可供设计AXI总线SoC的非一致Cache体系结构平台。
关键词
非一致cache
体系结构
同构单芯片多处理器
FMP626
缓存
AXI
SOC
Keywords
NUCA
CMP
FMP626
cache
AXI
SoC
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
CC-NUMA结构下共享变量并行计算的研究
8
作者
李岱峰
许忆南
机构
上海交通大学计算机科学与工程系
江南计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期89-90,113,共3页
文摘
探讨了如何提高CC-NUMA结构下共享变量程序的并行效率。主要介绍了几种有效的负载均衡策略和减少共享存储访问延迟的优化 手段。通过分析可以看出,通过合适的优化方法,CC-NUMA结构下共享变量的应用程序可以取得好的并行效率。
关键词
cache
一致
性
非
均匀存储器访问
负载均衡
任务粒度
访问延迟
Keywords
CC-NUMA
Load balancing
Task granularity
Access latency
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多核处理器非一致Cache体系结构延迟优化技术研究综述
黄安文
高军
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2012
4
下载PDF
职称材料
2
非一致Cache体系结构技术综述
吴俊杰
杨学军
《计算机工程与科学》
CSCD
北大核心
2011
1
下载PDF
职称材料
3
片上非一致Cache体系结构研究
贾小敏
黄彩霞
张民选
孙彩霞
齐树波
《计算机工程与科学》
CSCD
北大核心
2009
1
下载PDF
职称材料
4
片上多核Cache资源管理机制研究
贾小敏
张民选
齐树波
赵天磊
《计算机科学》
CSCD
北大核心
2011
6
下载PDF
职称材料
5
多核处理器片上存储系统研究
黄安文
高军
张民选
《计算机工程》
CAS
CSCD
北大核心
2010
5
下载PDF
职称材料
6
面向虚拟共享域划分的自适应迁移与复制机制
黄安文
石文强
高军
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2013
0
下载PDF
职称材料
7
基于NUCA结构的同构单芯片多处理器
陈宏铭
林昶志
陈麒安
《中国集成电路》
2011
1
下载PDF
职称材料
8
CC-NUMA结构下共享变量并行计算的研究
李岱峰
许忆南
《计算机工程》
CAS
CSCD
北大核心
2004
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部