期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
CC-NUMA系统中一种块传输通讯机制的设计与实现 被引量:1
1
作者 张峻 庞征斌 +3 位作者 郑义 谢旻 徐炜遐 周兴铭 《计算机工程与科学》 CSCD 2008年第1期138-141,共4页
本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能... 本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能抽象出来给应用层使用,在测试中获得了较好的性能。 展开更多
关键词 cc-numa 描述符 一致性块传输 通信接口
下载PDF
基于CC-NUMA系统模拟器的并行程序性能分析 被引量:1
2
作者 陈渝 庞立会 +1 位作者 杨学军 陈福接 《计算机工程与科学》 CSCD 2001年第1期86-89,96,共5页
针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度... 针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度高和内存开销小等特点。在 AMY模拟器环境下 ,通过对几个典型的并行测试程序的模拟执行 ,文章给出了统计的模拟结果 ,分析了并行测试程序的执行行为和开销 ,最后得出了在 CC- NUMA并行系统中对并行程序进行性能优化的有益的指导原则。 展开更多
关键词 cc-numa 并行系统模拟器 性能分析 并行程序
下载PDF
CC-NUMA并行系统通信优化的变换技术
3
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 cc-numa
下载PDF
一种CC-NUMA系统模拟环境的研究与实现
4
作者 庞立会 陈渝 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期82-85,共4页
描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开... 描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开销,能够有效指导并行程序的优化和对CC-NUMA并行系统进行深入研究。最后将AMY模拟环境与CC-NUMA系统以及其它的模拟环境进行比较分析,对它的精确性、灵活性和有效性进行了检验。 展开更多
关键词 并行程序 cc-numa 并行系统 LINUX操作系统 开销 PC机 模拟环境 有效指导 灵活性 有效性
下载PDF
面向CC-NUMA体系结构的事务内存冲突规避方法 被引量:1
5
作者 王睿伯 卢锡城 +1 位作者 卢凯 王绍刚 《计算机学报》 EI CSCD 北大核心 2011年第4期676-683,共8页
现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过... 现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过详尽的实验数据,深入分析了CC-NUMA结构的本地、远程访存差异特性对事务内存性能的影响,提出了一种面向CC-NUMA体系结构的冲突规避方法PBC.PBC在事务启动之前,对冲突可能性进行预测,并根据预测结果对事务进行调度,以降低事务的失败率.实验表明,文中提出的PBC方法可以显著提高CC-NUMA机器上运行事务内存的整体性能. 展开更多
关键词 事务内存 cc-numa 冲突规避
下载PDF
基于CC-NUMA的多处理器系统研究 被引量:1
6
作者 桑钊 张君毅 贺占庄 《现代电子技术》 2009年第2期16-18,22,共4页
针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种... 针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种简单、实用的新型架构,在灵活度、延迟、可扩展性方面均优于以前的架构,同时对其可行性及性能进行了全面分析。 展开更多
关键词 ccnuma Origin2000 ALPHA 21364 OPTERON 平均访问路程
下载PDF
CC-NUMA架构下4路龙芯3B服务器设计与实现 被引量:2
7
作者 张鹏 《计算机工程与科学》 CSCD 北大核心 2018年第12期2141-2145,共5页
针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G... 针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G以太网接口对处理器资源的占用消耗,有效提高了服务器的综合性能。通过测试验证,该服务器能够实现高效的并行计算能力和10G以太网通信能力,且国产元器件种类占比和数量占比均可达95%以上。 展开更多
关键词 服务器 cc-numa 龙芯3B3000 TOE 自主可控
下载PDF
CC-NUMA结构下共享变量并行计算的研究
8
作者 李岱峰 许忆南 《计算机工程》 CAS CSCD 北大核心 2004年第B12期89-90,113,共3页
探讨了如何提高CC-NUMA结构下共享变量程序的并行效率。主要介绍了几种有效的负载均衡策略和减少共享存储访问延迟的优化 手段。通过分析可以看出,通过合适的优化方法,CC-NUMA结构下共享变量的应用程序可以取得好的并行效率。
关键词 Cache一致性非均匀存储器访问 负载均衡 任务粒度 访问延迟
下载PDF
CC-NUMA多处理机操作系统设计
9
作者 冯朝辉 潘清 《装备指挥技术学院学报》 2002年第1期61-66,共6页
多处理机系统是实现并行处理的高效低价的选择,要发挥多处理机系统的性能必须要有相应的软件支撑,这中间最为重要的就是操作系统.CC-NUMA结构的多处理机系统以其紧耦合性和良好的可扩展性而得到了日益广泛的应用,本文讨论了CC-NUMA技术... 多处理机系统是实现并行处理的高效低价的选择,要发挥多处理机系统的性能必须要有相应的软件支撑,这中间最为重要的就是操作系统.CC-NUMA结构的多处理机系统以其紧耦合性和良好的可扩展性而得到了日益广泛的应用,本文讨论了CC-NUMA技术的特点,并重点论述了CC-NUMA结构的多处理机系统S1000的操作系统设计及其扩展. 展开更多
关键词 多处理机系统 分布共享存储器 操作系统 cc-numa
下载PDF
CC-NUMA结构计算机含错技术研究
10
作者 金丽娜 《长春大学学报》 2008年第12期28-30,共3页
主要研究CC-NUMA结构计算机的主存共享状态下含错技术问题。本文对主存共享、含错区域划分进行了说明,并深入分析了在主存共享状态下的含错区域划分、乱写防护等含错技术支持和保障。
关键词 ccnuma 主存共享 含错技术
下载PDF
MPD:结点具有多个并行缓存一致性域的CC-NUMA系统
11
作者 陈继承 赵雅倩 +3 位作者 李一韩 王恩东 史宏志 唐士斌 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期775-786,共12页
大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点... 大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点互连,形成结点间一致性域.然而,受限于处理器直连能力与处理器可识别ID数,系统的单结点规模有限,系统规模的扩展不得不依靠增加结点数来实现,使得大规模CC-NUMA系统的结点间互连复杂度上升,跨结点访问带宽和延迟急剧增长,影响了系统性能的有效扩展.MPD系统通过在结点内构建多个并行缓存一致性域,突破了处理器直连能力与可识别ID数对单结点规模的限制,能够大幅减少结点数量,并将部分结点间访问转化为结点内访问,实现系统性能的有效扩展.理论分析和实验结果表明:采用同规格处理器的32路系统中,结点内4个并行缓存一致性域的MPD系统可实现结点数目减少75%、一致性目录存储开销节省40%以上、平均访问延迟降低约27.9%、系统整体性能提升约14.4%. 展开更多
关键词 cc-numa系统 两级一致性域 并行缓存一致性域 一致性协同芯片 系统可扩展性
下载PDF
关于大规模并行处理机系统可扩展性设计 被引量:2
12
作者 卢锡城 《中国工程科学》 2000年第10期105-109,共5页
大规模并行处理系统旨在满足国防和国民经济许多重要应用领域对高性能计算能力的需求。长期以来 ,结构上的可扩性和编程上的友好性一直是并行计算机系统设计中追求的重要而又互相矛盾的两个目标。文章结合研究实践 ,对大规模并行处理机... 大规模并行处理系统旨在满足国防和国民经济许多重要应用领域对高性能计算能力的需求。长期以来 ,结构上的可扩性和编程上的友好性一直是并行计算机系统设计中追求的重要而又互相矛盾的两个目标。文章结合研究实践 ,对大规模并行处理机系统 (MPP) 展开更多
关键词 体系结构 大规模并行处理机 对称多处理机 非一致存储访问 可扩展性 设计 并行计算机系统
下载PDF
一种新型高效共享的并行I/O系统
13
作者 郭御风 李琼 +1 位作者 刘光明 肖立权 《计算机工程》 CAS CSCD 北大核心 2006年第12期244-246,共3页
如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待解决的关键技术。该文提出了一种高效共享的并行I/O系统——HPPIO,该系统基于CC-NUMA并行系统结构,采用了一系列高效共享、并行I/O技术。该文对其分布与集中相结合的高效共享并行... 如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待解决的关键技术。该文提出了一种高效共享的并行I/O系统——HPPIO,该系统基于CC-NUMA并行系统结构,采用了一系列高效共享、并行I/O技术。该文对其分布与集中相结合的高效共享并行I/O系统结构、基于PCI Express的高性能I/O控制器设计等进行了介绍。 展开更多
关键词 cc-numa I/O系统 并行I/O PCI EXPRESS CACHE一致性协议
下载PDF
一种基于路由器Cache的一致性协议
14
作者 潘国腾 汪波 +1 位作者 谢伦国 张民选 《计算机工程》 CAS CSCD 北大核心 2002年第7期72-74,共3页
在大规模并行分布式共享主存多处理机系统中,尽可能减少系统中远程访问时延,是提高系统整体性能的关键。该文提出了一种路由Cache结构,并详细介绍了基于路由器Cache的一致性协议。该协议在减少系统远程访问延时,提高系统有效带宽方面有... 在大规模并行分布式共享主存多处理机系统中,尽可能减少系统中远程访问时延,是提高系统整体性能的关键。该文提出了一种路由Cache结构,并详细介绍了基于路由器Cache的一致性协议。该协议在减少系统远程访问延时,提高系统有效带宽方面有较好的效果。 展开更多
关键词 路由器Cache 一致性协议 互联网络 消息处理
下载PDF
可伸缩分布共享大规模并行I/O系统设计
15
作者 李琼 郭御风 +1 位作者 庞征斌 刘光明 《计算机工程与科学》 CSCD 2006年第1期135-138,共4页
如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待研究解决的关键技术。我们提出了一种可伸缩分布共享并行I/O系统方案,并自行研制了结点控制器芯片和路由器芯片,研制了原型系统SDSP604。为实现系统的计算、通讯和I/O性能随着系... 如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待研究解决的关键技术。我们提出了一种可伸缩分布共享并行I/O系统方案,并自行研制了结点控制器芯片和路由器芯片,研制了原型系统SDSP604。为实现系统的计算、通讯和I/O性能随着系统规模均衡扩展的目标,该系统基于CC-NUMA系统结构,采用了合理的分布共享并行I/O系统结构。 展开更多
关键词 并行I/O系统 分布共享I/O HYPERTRANSPORT cc-numa共享存储系统
下载PDF
共享存储多处理机目录组织技术研究
16
作者 贺尔华 潘国腾 谢伦国 《计算机应用》 CSCD 北大核心 2004年第9期136-138,共3页
当前 ,绝大多数分布式共享存储系统采用基于目录的Cache一致性协议。介绍了几种典型的目录组织方案 ,并对它们进行了比较。提出一种新的目录组织方案。该方案采用位向量和有限指针混合的两级目录结构 ,在存储开销上比位向量目录优越 ,... 当前 ,绝大多数分布式共享存储系统采用基于目录的Cache一致性协议。介绍了几种典型的目录组织方案 ,并对它们进行了比较。提出一种新的目录组织方案。该方案采用位向量和有限指针混合的两级目录结构 ,在存储开销上比位向量目录优越 ,比有限指针目录增加不多 ;而在时间性能上 ,优于有限指针目录 ,接近位向量目录。 展开更多
关键词 目录组织 分布式共享存储 cc-numa
下载PDF
实现系统规模化的龙芯3号桥片设计与验证
17
作者 鲍庆元 李孟春 +3 位作者 王焕东 曾露 王启银 赵锐 《计算机工程与应用》 CSCD 2014年第9期56-60,共5页
CC-NUMA(高速缓存非均匀访存)系统应用在龙芯3A的处理器上,已得到了良好的性能体现,程序开发也有明显的简化。在维护片内和片间数据传输的稳定性和正确性的工作中,对基于一致性协议的片间互连结构进行分析和研究。为了构建更大规模的CC-... CC-NUMA(高速缓存非均匀访存)系统应用在龙芯3A的处理器上,已得到了良好的性能体现,程序开发也有明显的简化。在维护片内和片间数据传输的稳定性和正确性的工作中,对基于一致性协议的片间互连结构进行分析和研究。为了构建更大规模的CC-NUMA系统而维护多处理器间的一致性。在片间利用互连桥片进行统一调度,从而保证跨系统访问和全局数据一致,并且实现了多核处理器在访存性能上的提升。所设计的桥片在部分结构上与龙芯3A二级缓存相似。通过定向和随机环境测试,验证了桥片在功能方面的正确性。 展开更多
关键词 cc-numa 多处理器互连 目录结构 龙芯 一致性协议 桥片
下载PDF
页迁移:一种动态开发数据局部性的方法
18
作者 郑立刚 杨学军 《计算机工程与科学》 CSCD 1999年第5期35-38,60,共5页
页迁移技术包括页迁移和页复制两个方面, 是一种动态开发数据局部性的方法。由于CC-NUMA机器对远程访问的延迟是本地访问延迟的3~5倍,数据的局部性对CC-NUMA机器有较大的影响, 静态开发数据的局部性有其局限性。本... 页迁移技术包括页迁移和页复制两个方面, 是一种动态开发数据局部性的方法。由于CC-NUMA机器对远程访问的延迟是本地访问延迟的3~5倍,数据的局部性对CC-NUMA机器有较大的影响, 静态开发数据的局部性有其局限性。本文主要针对CC-NUMA体系结构, 讨论了动态开发数据局部性的方法 展开更多
关键词 局部性 cc-numa 页迁移 并行计算机
下载PDF
基于紧耦合单跳步多平面架构的高端服务器设计 被引量:4
19
作者 王恩东 陈继承 +1 位作者 胡雷钧 公维峰 《高技术通讯》 CAS CSCD 北大核心 2014年第2期111-116,共6页
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理... 针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。 展开更多
关键词 缓存一致性非均匀存储访问(cc-numa) 紧耦合单跳步多平面(TSMP) QPI协议 CACHE一致性 目录cache
下载PDF
一种基于共享转发态的多级缓存一致性协议 被引量:3
20
作者 陈继承 李一韩 +3 位作者 赵雅倩 王恩东 史宏志 唐士斌 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期764-774,共11页
在CC-NUMA架构系统中,为了减少缓存一致性维护的开销,大规模CC-NUMA系统通常采用多级缓存一致性域设计,降低平均一致性维护操作数量,从而有效缓解系统性能扩展与一致性维护开销的矛盾.传统的MESI,MESIF,MOESI协议主要是针对单级一致性... 在CC-NUMA架构系统中,为了减少缓存一致性维护的开销,大规模CC-NUMA系统通常采用多级缓存一致性域设计,降低平均一致性维护操作数量,从而有效缓解系统性能扩展与一致性维护开销的矛盾.传统的MESI,MESIF,MOESI协议主要是针对单级一致性域优化设计,并且没有考虑到大型数据库应用中查询(数据读访问)业务量占据主导地位的特点,故该类一致性协议在多级缓存一致性域场景下存在着跨域操作频度高、执行效率低等缺点.针对上述问题,提出了一种基于共享转发态的多级缓存一致性协议MESI-SF.该协议创建了一个共享转发态Share-F,允许多个一致性域内同时存在远端数据副本的可读可转发状态,从而能够为同一域内同地址的读请求直接提供共享数据,有效减少了跨域操作,提升系统性能.SPLASH-2程序集模拟结果表明,对于两级Cache一致性域系统,相比MESI协议,MESI-SF能够减少23.0%跨结点访问次数,指令平均执行周期数(cycles per instruction,CPI)降低7.5%;相比MESIF协议,MESI-SF能够减少12.2%跨结点访问次数,指令平均执行周期数降低5.95%. 展开更多
关键词 多核处理器 cc-numa系统 多级一致性域 缓存一致性 MESI协议
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部