期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
Index-Based Cache Coherence Protocol
1
作者 Soha S. Zaghloul Najlaa A1Huwaishel Maram AlAlwan 《通讯和计算机(中英文版)》 2014年第6期479-483,共5页
关键词 一致性协议 高速缓存 索引表 多处理器 主存储器 负载均衡 工作原理 网络结构
下载PDF
Cache Coherency Design in Pentium Ⅲ SMP System 被引量:1
2
作者 LIU Jinsong ZHANG Jiangling GU Xiwu 《Wuhan University Journal of Natural Sciences》 CAS 2006年第2期360-364,共5页
This paper analyzes cache coherency mechanism from the view of system. It firstly discusses caehe-memory hierarchy of Pentium Ⅲ SMP system, including memory area distribution, cache attributes control and bus transac... This paper analyzes cache coherency mechanism from the view of system. It firstly discusses caehe-memory hierarchy of Pentium Ⅲ SMP system, including memory area distribution, cache attributes control and bus transaction. Secondly it analyzes hardware snoopy mechanism of P6 bus and MESI state transitions adopted by Pentium Ⅲ. Based on these, it focuses on how muhiprocessors and the P6 bus cooperate to ensure cache coherency of the whole system, and gives the key of cache coherency design. 展开更多
关键词 snoop cache coherency MESI protocol P6bus Pentium SMP system
下载PDF
软硬件混合的高效CHI协议分析
3
作者 赵祉乔 周理 +3 位作者 荀长庆 潘国腾 铁俊波 王伟征 《计算机工程与科学》 CSCD 北大核心 2024年第2期224-231,共8页
在片上系统SoC开发过程中,如何高效准确地进行功能验证与性能分析,是亟待解决的难题。针对目前在FPGA原型平台上对片上网络协议监测手段有限的问题,提出了一种软硬件混合的高效CHI协议监测和分析方法,通过SystemVerilog的直接编程接口DP... 在片上系统SoC开发过程中,如何高效准确地进行功能验证与性能分析,是亟待解决的难题。针对目前在FPGA原型平台上对片上网络协议监测手段有限的问题,提出了一种软硬件混合的高效CHI协议监测和分析方法,通过SystemVerilog的直接编程接口DPI连接C代码,由可综合的硬件部分提供共享函数体,不可综合的软件部分通过共享函数体从片上网络协议的各个通道捕捉待测SoC中的CHI报文,进行离线保存或在线检查。实验结果表明,该方法具有硬件资源占用少、可重用性高的优点,离线模式对仿真速率影响不大,在线模式可以在待测SoC运行的同时发现问题,能够实现在原型平台上对CHI协议报文的高效监测,有效加速SoC问题的定位和性能分析。 展开更多
关键词 CHI协议 FPGA 芯片验证 软硬件混合
下载PDF
基于交叉开关互连的多核堆栈处理器架构设计
4
作者 刘欢庆 周永录 +1 位作者 刘宏杰 代红兵 《计算机工程与设计》 北大核心 2024年第7期2212-2219,共8页
为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、... 为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、核间数据传输和中断响应操作。在Xilinx FPGA芯片上进行单核、双核和四核堆栈处理器的实现,通过矩阵乘法计算进行性能实验验证,在100 MHz时钟频率的情况下,四核堆栈处理器的最大性能相当于单核堆栈处理器的3.99倍。实验结果表明,基于交叉开关互连的多核堆栈处理器架构可较好发挥多核堆栈处理器中每一个核心的性能。 展开更多
关键词 堆栈处理器 多核处理器 交叉开关 高速缓存 一致性协议 中断控制器 现场可编程门阵列
下载PDF
Model Checking Data Consistency for Cache Coherence Protocols 被引量:1
5
作者 潘宏 林惠民 吕毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第5期765-775,共11页
A method for automatic verification of cache coherence protocols is presented, in which cache coherence protocols are modeled as concurrent value-passing processes, and control and data consistency requirement are des... A method for automatic verification of cache coherence protocols is presented, in which cache coherence protocols are modeled as concurrent value-passing processes, and control and data consistency requirement are described as formulas in first-order p-calculus. A model checker is employed to check if the protocol under investigation satisfies the required properties. Using this method a data consistency error has been revealed in a well-known cache coherence protocol. The error has been corrected, and the revised protocol has been shown free from data consistency error for any data domain size, by appealing to data independence technique. 展开更多
关键词 concurrent systems cache coherence protocols value-passing symbolic transition graphs model checking
原文传递
A Lock-Based Cache Coherence Protocol for Scope Consistency
6
作者 胡伟武 water.chpc.ict.ac.cn +5 位作者 施巍松 water.chpc.ict.ac.cn 唐志敏 water.chpc.ict.ac.cn 李明 water.chpc.ict.ac.cn 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第2期97-109,共13页
Directory protocols are widely adopted to maintain cache coherence of distributed shared memory multiprocessors. Although scalable to a certain extent, directory protocols are complex enough to prevent it from being u... Directory protocols are widely adopted to maintain cache coherence of distributed shared memory multiprocessors. Although scalable to a certain extent, directory protocols are complex enough to prevent it from being used in very large scale multiprocessors with tens of thousands of nodes. This paper proposes a lock-based cache coherence protocol for scope conyistency. It does not rely on directory information to maintain cache coherence. Instead, cache coherence is mailltained through requiring the releasing processor of a lock to store all write-notices generated in the associated critical section to the lock and the acquiring processor invalidates or updates its locally cached data copies according to the write notices of the lock. To evaluate the performance of the lock-based cache coherence protocol, a software DSM system named JIAJIA is built on network of workstations. Besides the lockbased cache coherence protocol, JIAJIA also characterizes itself with its shared memory organization scheme which combines the physical memories of multiple workstations to form a large shared space. Performance measurements with SPLASH2 program suite and NAS benchmarks indicate that, compared to recent SVM systems such as CVM, higher speedup is achieved by JIAJIA.Besides, JIAJIA can solve large scale problems that cannot be solved by other SVM systems due to memory size limitation. 展开更多
关键词 Memory consistency cache coherence lock-based protocol directorybased protocol scope consistency
原文传递
基于节点预测的直接Cache一致性协议 被引量:33
7
作者 张骏 田泽 +1 位作者 梅魁志 赵季中 《计算机学报》 EI CSCD 北大核心 2014年第3期700-720,共21页
处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议... 处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议,研究一致性交互延迟隐藏和目录存储开销减少技术.针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题,分别提出节点挂起技术和直接写缺失处理技术,有效隐藏了目录访问延迟.为了实现准确的节点预测,作者还提出基于“签名”回收的历史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2测试程序集,在基于2DMESHNoC互联的64核CMP下,相对于全映射目录协议,NPP协议的平均执行时间降幅为21.78%~31.11%;平均读缺失延迟降低14.22%~18.9%;平均写缺失延迟降低17.89%~21.13%.而获得上述性能提升的代价是网络流量平均增加6.62%~7.28%. 展开更多
关键词 单芯片多处理器(CMP) 预测 一致性协议 目录 可扩展中图法
下载PDF
基于新型Cache一致性协议的共享虚拟存储系统 被引量:15
8
作者 胡伟武 施巍松 唐志敏 《计算机学报》 EI CSCD 北大核心 1999年第5期467-475,共9页
介绍了一个基于新型Cache一致性协议的共享虚拟存储系统JIAJIA.与目前国际上具有代表性的共享虚拟存储系统相比,JIAJIA采用了基于NUMA的结构,能够把多个机器的物理地址空间组织成一个更大的共享虚拟地址空间.... 介绍了一个基于新型Cache一致性协议的共享虚拟存储系统JIAJIA.与目前国际上具有代表性的共享虚拟存储系统相比,JIAJIA采用了基于NUMA的结构,能够把多个机器的物理地址空间组织成一个更大的共享虚拟地址空间.此外,JIAJIA实现了一种基于锁的新型一致性协议,通过附带在锁上的write-notice来维护一致性,从而避免了传统的目录协议中由目录引起的存储开销和系统复杂度.利用一些被广泛使用的测试程序,例如SPLASH2和NAS并行程序集,对JIAJIA进行的测试表明,同近期实现的共享虚拟存储系统(如CVM)比较,JIAJIA不仅具有更高的性能,而且可以解决更大规模的问题. 展开更多
关键词 虚拟存储系统 CACHE 一致性协议 存储器 JIAJIA
下载PDF
分布式共享内存的技术和实现 被引量:6
9
作者 李群 谢立 孙钟秀 《计算机研究与发展》 EI CSCD 北大核心 1997年第5期327-331,共5页
分布式共享内存结合了分布式内存结构与共享存储结构的优点,具有可扩充性、通用性、方便性.本文论述了在实现DSM系统中存在的问题。
关键词 分布式 共享内存 一致性协议 并行处理 软件开发
下载PDF
基于IEC61850的变电站自动化系统一致性测试 被引量:10
10
作者 潘勇斌 申狄秋 杨乘胜 《电力自动化设备》 EI CSCD 北大核心 2009年第4期143-146,共4页
以基于IEC61850的500 kV桂林变电站系统工程为例,论述了基于IEC61850的变电站自动化系统一致性测试。对于系统一致性的测试分为IEC61850规约测试、变电站自动化系统测试和与调度通信规约的测试3大部分。认为规约一致性测试是保证互操作... 以基于IEC61850的500 kV桂林变电站系统工程为例,论述了基于IEC61850的变电站自动化系统一致性测试。对于系统一致性的测试分为IEC61850规约测试、变电站自动化系统测试和与调度通信规约的测试3大部分。认为规约一致性测试是保证互操作的基础,在测试中必须强制执行。提供了测试流程、通信一致性测试过程、SCADA基本功能测试的设备连接模型、保护设备功能测试及其他测试情况。 展开更多
关键词 IEC61850 自动化系统 一致性测试 变电站 调度通信规约 SCADA
下载PDF
片上多核处理器Cache一致性协议优化研究综述 被引量:5
11
作者 胡森森 计卫星 +3 位作者 王一拙 陈旭 付文飞 石峰 《软件学报》 EI CSCD 北大核心 2017年第4期1027-1047,共21页
现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速... 现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速缓存一致性协议设计的关键问题,综述了近年来学术界对一致性的研究.从程序访存行为模式、目录组织结构、一致性粒度、一致性协议流量、目录协议的可扩展性等方面,阐述了近年来缓存一致性协议性能优化的方向.对目前片上多核处理器缓存一致性协议设计中存在的问题进行了讨论,并指出了未来进一步研究的方向. 展开更多
关键词 片上多核处理器 缓存一致性协议 性能优化
下载PDF
基于伪临界值的Cache一致性协议验证方法 被引量:3
12
作者 屈婉霞 郭阳 +1 位作者 庞征斌 杨晓东 《国防科技大学学报》 EI CAS CSCD 北大核心 2008年第6期47-52,共6页
针对Cache一致性协议状态空间爆炸问题,提出共享集合伪临界值(Pseudo-cutoff)的概念,并以采用释放一致性模型的CC-NUMA系统为例,分析了共享数据的分布情况,推导出在一定条件下共享集合伪临界值为4的结论,有效优化了目录Cache协议状态空... 针对Cache一致性协议状态空间爆炸问题,提出共享集合伪临界值(Pseudo-cutoff)的概念,并以采用释放一致性模型的CC-NUMA系统为例,分析了共享数据的分布情况,推导出在一定条件下共享集合伪临界值为4的结论,有效优化了目录Cache协议状态空间,并提出了解决小概率的宽共享事件的方法。实验数据表明,基于伪临界值的协议模型优化,能够有效缩小Cache协议状态空间,加快验证速度,扩大验证规模。 展开更多
关键词 形式化验证 模型检验 多处理机系统 CACHE一致性协议
下载PDF
NoC目录协议能耗分析与建模研究 被引量:1
13
作者 王继禾 郭兵 +2 位作者 沈艳 伍元胜 刘云本 《计算机学报》 EI CSCD 北大核心 2011年第9期1603-1610,共8页
在MPSoC芯片设计中,能耗问题是一个关键因素,NoC(Network-on-Chip片上网络)的能耗占芯片总能耗的50%以上.文中首先对NoC应用层协议的能耗行为进行统一的数学描述,在此基础上,针对目前Cache一致性中常用的目录协议进行深入分析,提出一种... 在MPSoC芯片设计中,能耗问题是一个关键因素,NoC(Network-on-Chip片上网络)的能耗占芯片总能耗的50%以上.文中首先对NoC应用层协议的能耗行为进行统一的数学描述,在此基础上,针对目前Cache一致性中常用的目录协议进行深入分析,提出一种基于位置概率分布的目录协议能耗模型,其考虑目录信息与数据块节点位置分布的无关性,定位数据块在NoC中的节点位置,计算任意节点间数据传输的概率矩阵,并结合路由单元能耗、连线能耗以及网络拓扑结构,准确获得目录协议中一次数据块传输的能耗.仿真实验表明,该文提出的模型在发包概率稳定的Mesh(网孔)网络中可有效计算出不同类型目录协议产生的能耗,且精度较高(误差小于2%),为下一步协议能耗优化研究提供可信的量化的评判依据. 展开更多
关键词 MPSOC NOC 协议功耗 目录协议 CACHE一致性
下载PDF
OCT不同扫描模式检测视网膜神经纤维层厚度的可重复性研究 被引量:3
14
作者 田润 唐罗生 +3 位作者 王玲 袁苑 杨晖 黄娟 《眼科新进展》 CAS 2008年第5期358-360,共3页
目的采用光学相干断层成像扫描(optical coher-ence tomography,OCT)不同扫描模式检测视网膜神经纤维层(retinal nerve fiber layer,RNFL)厚度的可重复性。方法采用双盲法,2名检查者对20名(20眼)正常人分别以OCT3种不同扫描模式:RNFL厚... 目的采用光学相干断层成像扫描(optical coher-ence tomography,OCT)不同扫描模式检测视网膜神经纤维层(retinal nerve fiber layer,RNFL)厚度的可重复性。方法采用双盲法,2名检查者对20名(20眼)正常人分别以OCT3种不同扫描模式:RNFL厚度(3.4)扫描模式,视神经盘圆(0·98+视盘半径)扫描模式,RNFL厚度(2.27×disc)扫描模式,连续3d测量RNFL厚度,每天每眼记录5幅图像,取其中3幅图像的RNFL厚度值的平均值。计算3d中全周平均及各象限RNFL厚度的变异系数。比较3种扫描模式检测RNFL的可重复性。结果OCT3种扫描模式所测全周平均及4象限RNFL厚度的变异系数范围分别是:RNFL厚度(3·4)扫描模式:(4.57±2·14)%~(9.57±6.28)%,视神经盘圆(0.98+视盘半径)扫描模式:(1.14±0.59)%~(4.81±2.22)%,RNFL厚度(2·27×disc)扫描模式:(2.77±1·49)%~(9.52±4.50)%,且均以鼻侧象限最大。2名操作者间变异系数对比差异无统计学意义(P>0.05)。结论OCT3种扫描模式检测RNFL可重复性均较好。以视神经盘圆(0.98+视盘半径)扫描模式最优。3种扫描模式检测各象限RNFL均以鼻侧象限的可重复性最差。 展开更多
关键词 光学相干断层扫描 视网膜神经纤维层 模式 可重复性
下载PDF
数据网格中一种均衡性能的副本一致性算法 被引量:2
15
作者 荣翠芳 李明楚 +1 位作者 孙伟峰 姚红岩 《计算机工程与应用》 CSCD 北大核心 2010年第22期83-87,共5页
通过比较和分析数据网格环境下aggressive-copy和lazy-copy两个副本一致性协议,针对两个协议的不足,在扩展副本一致性框架的基础上提出了一种新的副本一致性lazy_agg-copy算法。该算法在多层框架下随机选择部分副本进行一致性更新,可以... 通过比较和分析数据网格环境下aggressive-copy和lazy-copy两个副本一致性协议,针对两个协议的不足,在扩展副本一致性框架的基础上提出了一种新的副本一致性lazy_agg-copy算法。该算法在多层框架下随机选择部分副本进行一致性更新,可以弥补已有两种算法的缺点。将lazy_agg-copy算法和已有两种在网格模拟软件OptorSim下进行了模拟。模拟结果表明,la-zy_agg-copy算法在实时性、网络负载和带宽消耗方面都能取得更好的均衡,可以达到更优的整体效果。 展开更多
关键词 一致性协议 多层框架 随机选择 性能均衡
下载PDF
PMESI:一种优化进程私有数据访问的缓存一致性协议 被引量:1
16
作者 王绍刚 徐炜遐 +3 位作者 庞征斌 吴丹 戴艺 陆平静 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第1期97-102,共6页
并行应用程序中绝大部分的访存是对私有数据的访问,在cache一致性协议上不会产生冲突。传统一致性协议没有根据程序私有数据的访问模式进行针对性设计,存在着很大的优化空间。针对以上的问题,提出了一种支持私有状态的cache一致性协议PM... 并行应用程序中绝大部分的访存是对私有数据的访问,在cache一致性协议上不会产生冲突。传统一致性协议没有根据程序私有数据的访问模式进行针对性设计,存在着很大的优化空间。针对以上的问题,提出了一种支持私有状态的cache一致性协议PMESI,通过动态关闭和激活内存空间的cache一致性目录,优化私有内存空间的访问延迟和功耗。通过时钟精确模拟器的测试,PMESI协议优化了程序中54%的访存,并行程序的执行时间平均缩短了9%。 展开更多
关键词 PMESI协议 私有内存空间 目录协议 操作系统
下载PDF
利用月面链路的月球车定位体制 被引量:5
17
作者 李雪 徐勇 +1 位作者 王策 张其善 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2008年第2期183-187,共5页
提出一种利用月面月球车-着陆器UHF(Ultra High Frequency)近程通信链路的高精度测距、测角的新方法,实现月球车的精密定位.该体制采用直序扩频和CCSDS(Con-sultative Committee for Space Date Systems)Proximity-1协议实现月球车-着... 提出一种利用月面月球车-着陆器UHF(Ultra High Frequency)近程通信链路的高精度测距、测角的新方法,实现月球车的精密定位.该体制采用直序扩频和CCSDS(Con-sultative Committee for Space Date Systems)Proximity-1协议实现月球车-着陆器之间的数据交互,利用双向异步传输帧非相干扩频测距方法实现精密测距,利用着陆器双天线形成短基线实现对月球车方位角的精密测量.讨论了用于测距的CCSDS Proximity-1协议帧结构、双向异步传输帧测距原理、方位角的载波相位差分干涉测量原理,以及建立月面着陆参考系并给出月球车精确定位的方法.研究表明,所提出的方法功能集成度高、信道资源利用率高、设备简单、性能指标满足月球探测二期月球车的月面定位、通信任务需求. 展开更多
关键词 月面链路 CCSDS Proximity-1协议 非相干测距 载波相位干涉测量
下载PDF
利用预测器降低令牌协议的通信量 被引量:1
18
作者 付桂涛 赵天磊 +2 位作者 黄平 汤先拓 邢座程 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第6期14-19,共6页
令牌协议采用广播方式发送一致性消息,导致网络通信量大,限制了协议的扩展能力。提出预测的方法有效地消除令牌协议中的无用消息,从而降低了通信量。根据应用程序的读写失效比例提出3种预测策略。实验结果显示,采用512项的Owner预测器... 令牌协议采用广播方式发送一致性消息,导致网络通信量大,限制了协议的扩展能力。提出预测的方法有效地消除令牌协议中的无用消息,从而降低了通信量。根据应用程序的读写失效比例提出3种预测策略。实验结果显示,采用512项的Owner预测器平均降低3.8%的连接通信量,Sharer预测器和Hybrid预测器分别平均降低了11%和7%的连接通信量。预测方法可以有效地降低令牌协议的通信量,提升令牌协议的扩展能力。 展开更多
关键词 令牌协议 一致性协议 预测器 通信量 广播
下载PDF
支持多核并行程序确定性重放的高效访存冲突记录方法 被引量:5
19
作者 刘磊 黄河 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第1期64-75,共12页
多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确... 多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确定冲突访存操作在执行中所处happens-before序关系的位置,可以抑制部分记录信息的产生,从而有效减少记录信息.与其他方式方法相比,可以进一步压缩17%的记录条数.采用逻辑向量时钟描述冲突访存操作间的happens-before关系,与采用标量时钟相比,可以避免happens-before关系的误识,降低重放执行时并行度的损失. 展开更多
关键词 确定性重放 缓存一致性协议 访存冲突 多核 并行程序
下载PDF
参数化系统二维抽象框架 被引量:1
20
作者 屈婉霞 庞征斌 +2 位作者 郭阳 李暾 杨晓东 《国防科技大学学报》 EI CAS CSCD 北大核心 2010年第1期95-100,共6页
针对参数化系统状态空间爆炸问题提出了一个通用的参数化系统二维抽象框架TDA。对所有进程单独进行抽象,利用参数化系统的设计思想,隐藏系统参数构建全系统的抽象模型,最大限度地剔除了原始系统中的冗余信息。建立的具有真并发语义的参... 针对参数化系统状态空间爆炸问题提出了一个通用的参数化系统二维抽象框架TDA。对所有进程单独进行抽象,利用参数化系统的设计思想,隐藏系统参数构建全系统的抽象模型,最大限度地剔除了原始系统中的冗余信息。建立的具有真并发语义的参数化系统的形式化模型,更适合描述一般意义上的并发系统,较好地解决了验证大规模同构和异构系统的空间激增问题。理论推导和实例均证实了TDA的正确性和合理性。 展开更多
关键词 参数化系统 模型检验 抽象 多处理机系统 CACHE一致性协议
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部