期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
CC-NUMA并行系统通信优化的变换技术
1
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 cc-numa
下载PDF
Elastic pointer directory organization for scalable shared memory multiprocessors
2
作者 Yuhang Liu Mingfa Zhu Limin Xiao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第1期158-167,共10页
In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve t... In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve three key attributes: reasonable memory overhead, sharer position precision and implementation complexity. However, researchers often face the problem that gain-ing one attribute may result in losing another. The paper proposes an elastic pointer directory (EPD) structure based on the analysis of shared-memory applications, taking the fact that the number of sharers for each directory entry is typical y smal . Analysis re-sults show that for 4 096 nodes, the ratio of memory overhead to the ful-map directory is 2.7%. Theoretical analysis and cycle-accurate execution-driven simulations on a 16 and 64-node cache coherence non uniform memory access (CC-NUMA) multiproces-sor show that the corresponding pointer overflow probability is reduced significantly. The performance is observed to be better than that of a limited pointers directory and almost identical to the ful-map directory, except for the slight implementation complex-ity. Using the directory cache to explore directory access locality is also studied. The experimental result shows that this is a promis-ing approach to be used in the state-of-the-art high performance computing domain. 展开更多
关键词 DIRECTORY scalabUity memory overhead positioningprecision OVERFLOW cache coherence non uniform memory accesscc-numa).
下载PDF
MPD:结点具有多个并行缓存一致性域的CC-NUMA系统
3
作者 陈继承 赵雅倩 +3 位作者 李一韩 王恩东 史宏志 唐士斌 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期775-786,共12页
大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点... 大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点互连,形成结点间一致性域.然而,受限于处理器直连能力与处理器可识别ID数,系统的单结点规模有限,系统规模的扩展不得不依靠增加结点数来实现,使得大规模CC-NUMA系统的结点间互连复杂度上升,跨结点访问带宽和延迟急剧增长,影响了系统性能的有效扩展.MPD系统通过在结点内构建多个并行缓存一致性域,突破了处理器直连能力与可识别ID数对单结点规模的限制,能够大幅减少结点数量,并将部分结点间访问转化为结点内访问,实现系统性能的有效扩展.理论分析和实验结果表明:采用同规格处理器的32路系统中,结点内4个并行缓存一致性域的MPD系统可实现结点数目减少75%、一致性目录存储开销节省40%以上、平均访问延迟降低约27.9%、系统整体性能提升约14.4%. 展开更多
关键词 cc-numa系统 两级一致性域 并行缓存一致性域 一致性协同芯片 系统可扩展性
下载PDF
基于基地址寄存器映射的数据缓存研究
4
作者 沈秀红 赵朝君 +1 位作者 孟建熠 项晓燕 《计算机工程》 CAS CSCD 2013年第5期73-77,共5页
针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接... 针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接获得目标数据,从而加速加载指令的数据获取过程,减少地址计算和对高速缓存的访问。测试结果表明,该方法的处理器性能平均提高约3.7%,数据高速缓存功耗平均降低约18.7%。 展开更多
关键词 映射关系 基地址寄存器映射 内存访问局部性 数据一致性 高速缓存
下载PDF
基于紧耦合单跳步多平面架构的高端服务器设计 被引量:5
5
作者 王恩东 陈继承 +1 位作者 胡雷钧 公维峰 《高技术通讯》 CAS CSCD 北大核心 2014年第2期111-116,共6页
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理... 针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。 展开更多
关键词 缓存一致性非均匀存储访问(cc-numa) 紧耦合单跳步多平面(TSMP) QPI协议 cache一致性 目录cache
下载PDF
片上多核处理器的区域共享的双粒度目录
6
作者 曾露 陈新科 王焕东 《高技术通讯》 CAS CSCD 北大核心 2015年第7期669-676,共8页
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用... 研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。 展开更多
关键词 双粒度目录(DGD) 片上多核处理器 缓存一致性 区域共享 目录一致性协议 访存优化
下载PDF
PC服务器新发展
7
作者 吴月琴 《广播电视信息》 1999年第4期42-47,共6页
本文叙述PC服务器新发展动向和各个不同厂家的新PC服务器产品的特点,对先进的对称多处理机/缓存相干非均匀存储器访问体系结构作出较详细的介绍。
关键词 PC服务器 微处理器 结构 SMPA 芯片组
下载PDF
龙芯GS464E处理器核架构设计 被引量:15
8
作者 吴瑞阳 汪文祥 +1 位作者 王焕东 胡伟武 《中国科学:信息科学》 CSCD 北大核心 2015年第4期480-500,共21页
龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cach... 龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cache容量和TLB容量.访存子系统拥有3级Cache结构,每一级都采用LRU替换策略,可以支持多核缓存一致性协议.经过上述强化设计,GS464E处理器核已成为一个创新性的高性能处理器核架构. 展开更多
关键词 处理器核 多核处理器 分支预测 访存性能 缓存一致性
原文传递
System Architecture of Godson-3 Multi-Core Processors 被引量:7
9
作者 高翔 陈云霁 +2 位作者 王焕东 唐丹 胡伟武 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期181-191,共11页
Godson-3 is the latest generation of Godson microprocessor family. It takes a scalable multi-core architecture with hardware support for accelerating applications including X86 emulation and signal processing. This pa... Godson-3 is the latest generation of Godson microprocessor family. It takes a scalable multi-core architecture with hardware support for accelerating applications including X86 emulation and signal processing. This paper introduces the system architecture of Godson-3 from various aspects including system scalability, organization of memory hierarchy, network-on-chip, inter-chip connection and I/O subsystem. 展开更多
关键词 multi-core processor scalable interconnection cache coherent non-uniform memory access/non-uniform cache access cc-numa/NUCA) MESH CROSSBAR cache coherence reliability availability and serviceability (RAS)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部